Большой

Новости

ДомДом / Новости / Большой

Aug 03, 2023

Большой

Паразиты и векторы, том 16, Номер статьи: 265 (2023) Цитировать эту статью 90 Доступов 4 Подробности об альтметрических метриках Флавивирусы представляют собой разнообразную группу РНК-вирусов, которые включают этиологические

Паразиты и переносчики, том 16, Артикульный номер: 265 (2023) Цитировать эту статью

90 доступов

4 Альтметрика

Подробности о метриках

Флавивирусы представляют собой разнообразную группу РНК-вирусов, в которую входят этиологические агенты вируса Зика, денге и желтой лихорадки, передающиеся комарами. Флавивирусы не кодируют обратную транскриптазу и не могут осуществлять обратную транскрипцию в ДНК, однако последовательности ДНК флавивирусов обнаруживаются как интегрированными в хромосомы комаров Aedes aegypti, так и в виде внехромосомных последовательностей. Ранее мы исследовали Ae. aegypti для идентификации интеграций флавивирусов и анализа консервативности этих последовательностей среди данных всего генома 464 Ae. aegypti собраны в 10 странах мира. Здесь мы расширили этот анализ, идентифицировав последовательности флавивируса в этих образцах независимо от Ae. Эталонная сборка aegypti. Нашей целью было идентифицировать полный набор вирусных последовательностей, в том числе отсутствующих в эталонном геноме, и их географическое распространение. Мы сравнили идентифицированные последовательности с помощью BLASTn и применили методы машинного обучения для выявления кластеров подобных последовательностей. Помимо кластеров последовательностей, которые соответствуют четырем событиям вирусной интеграции, которые мы описали ранее, мы идентифицировали 19 меньших кластеров. Единственный кластер с сильной географической ассоциацией состоял из вирусоподобных последовательностей агента слияния клеток, специфичных для Таиланда. Остальные кластеры не имели географической привязки и в основном состояли из почти идентичных коротких последовательностей, не имеющих сильного сходства с какими-либо известными флавивирусными геномами. Данные секвенирования короткого чтения не позволили нам определить, были ли идентифицированные последовательности внехромосомными или интегрированными в Ae. хромосомы aegypti. Наши результаты показывают, что «Ливерпуль» напрягает и выставляет Ae. Комары aegypti имеют сходное разнообразие консервативной флавивирусной ДНК, функциональная роль которой должна быть изучена в последующих исследованиях.

В нашей предыдущей публикации [1] мы рассмотрели эталонные геномы Aedes aegypti и Ae. albopictus для идентификации интегрированных последовательностей флавивируса и улучшения нашего понимания неретровирусных эндогенных вирусных элементов (nrEVE) (недавний обзор см. в [2]). Мы также изучили общедоступные данные полногеномного секвенирования Aedes, чтобы понять сохранение выявленных вирусных последовательностей. Мы обнаружили, что nrEVE у Ae. albopictus были очень разнообразны и практически не сохранились. Напротив, мы обнаружили, что почти все nrEVE в Ae. Эталонный геном aegypti произошел в результате четырех различных событий вирусной интеграции (VIE). Мы пришли к выводу, что разнообразие флавивирусных последовательностей nrEVE в эталонном геноме является результатом дупликации и фрагментации этих четырех VIE. Аэ. Фрагменты aegypti nrEVE присутствовали почти во всех изученных секвенированных изолятах, но демонстрировали звездчатую филогенетическую структуру без клад, что указывает на недавнее событие расширения популяции от общего предка.

Помимо этих четырех основных событий, в нашей предыдущей работе мы наблюдали множество коротких (<50 нт) флавивирусоподобных последовательностей в Ae. эталонный геном aegypti, который мы в то время не анализировали [1]. Кроме того, другие исследования обнаружили длинные последовательности с очень высокой идентичностью (> 95%) вирусу агента слияния клеток (NC_001564.2) с некоторой географической специфичностью [3, 4]. Другие исследования показали, что вирусная ДНК генерируется комарами Aedes при флавивирусной инфекции [5, 6].

Ограничением нашего предыдущего подхода было сосредоточение внимания на nrEVE, присутствующих в эталонных геномах комаров. В этом кратком отчете мы устраняем это ограничение, изучая ландшафт предполагаемой флавивирусной ДНК (пфДНК) у Ae. aegypti независимо от эталонного генома. В частности, мы стремились идентифицировать любую географически специфичную пфДНК, отсутствующую в эталонном геноме. В надежный анализ мы также намеренно включили высококачественные последовательности с очень короткой длиной совпадения между ДНК комаров и вирусными последовательностями, чтобы усилить сигналы любых консервативных последовательностей в географических регионах. Поскольку мы используем данные короткого считывания секвенирования, мы не можем определить, являются ли последовательности pfDNA внутри- или внехромосомными. Мы также не проверяем повторно последовательности, принадлежащие четырем событиям вирусной интеграции (VIE1–VIE4), как описано ранее [1]. Для нашего анализа мы сопоставили 464 общедоступных Ae. aegypti полногеномного секвенирования (WGS) [7] ко всем последовательностям Flaviviridae базы данных NCBI RefSeq (n = 118, по состоянию на апрель 2020 г.) [7] и nrEVE, которые мы ранее идентифицировали [1] (Таблица 1, Дополнительный файл 2: Рис. С1). Для выравнивания мы использовали программу Bowtie2 [8] с очень чувствительными настройками (-D 15 -R 2 -N 0 -L 11 -i S, 1, 0,75). Картированные прочтения были собраны de novo с использованием программного обеспечения SPAdes (v3.13.0) [9] в 25 049 контигов со средним количеством 53 контигов на изолят (диапазон: 8–138). Распределение длин контигов соответствовало экспоненциальному распределению со средней длиной 200 нт и самым длинным контигом 10 057 нт.

 97%) compared to Calbertado virus [1]. Thus, cluster 3 corresponds to what we previously termed VIE1. Based on our analysis here, the Ae. aegypti AaegL5 reference assembly has only half of the VIE1 sequence. This result is consistent with our previous observation that VIE1 is less conserved than VIE2, VIE3 or VIE4 [1]./p> 95% identity. The cluster was most prevalent in Ghana (19%) and Senegal (13%)./p> 100 nt (Additional file 3: Table S1). This bifurcation of clusters into those that contain only sequences < 50 nt and those that include sequences > 100 nt serves to separate white noise from genuine hits./p> 95% identity to sequences of these VIEs. Consequently, these 46 contigs also had hits against the Ae. aegypti reference genome. In addition, all four Madagascan samples had an identical 606-nt sequence that matched a 743–1349-nt region of a Cell-fusing agent virus with 86% identity. The remaining 516 contigs in the cluster had short (25–72 nt) hits against the viral genome and similar length hits (28–72 nt) against the Ae. aegypti reference genome. In post-clustering quality control, we found that clustering of these sequences was a statistical artifact. The e-value for pairs of contigs without any BLASTn hit was set to 1.0, and as a result the main similarity between these 516 contigs was dissimilarity to other contigs./p>