СЕЛЬСКОХОЗЯЙСТВЕННАЯ БИОЛОГИЯ, 2008, № 3, с. 38-47

ДНК-технологии в генетике и селекции

УДК 582.683.2+633.18]:57.088

СЕМЕЙСТВО MuDR ТРАНСПОЗАЗ В ГЕНОМАХ Arabidopsis thaliana
И Oryza sativa*

Ю.В. ЧЕСНОКОВ, А.А. ШУТОВА, А.Д. ШУТОВ

На основе сравнительного анализа первичных аминокислотных последовательностей транспозаз семейства MuDR растений с полностью секвенированными геномами (Arabidopsis thaliana и Oryza sativa) рассматриваются вопросы происхождения мобильных генетических элементов растений и кодируемых ими генов. Существование множества гомо-логичных транспозаз указывает на то, что в геноме A. thaliana эта система элементов может быть очень древней. Исходя из сходства последовательностей внутри консервативных доме-нов, делается вывод, что исследованные мобильные генетические элементы класса II содержат полноценную транспозазу. В случае утери необходимых для связывания фермента консер-вативных мотивов элемент становится дефектным, однако транспозаза может использоваться для перемещения других дефектных элементов. Полученные результаты позволяют предпо-ложить, что рассмотренные последовательности дивергировали недавно и могут служить предшественниками новых дефектных элементов.

Ключевые слова: MuDR транспозазы, Arabidopsisthaliana, Oryzasativa, сравнительный анализ.

Key words: MuDR transposases, Arabidopsis thaliana, Oryza sativa, alingment.

На протяжении последних трех десятилетий молекулярные генетики смогли идентифицировать значительное число мобильных элементов в эукариотических геномах, многие из которых представляют собой один из основных источников спонтанных мутаций и генетической изменчивости внутри видов, популяций и отдельных генотипов. При этом ряд ученых считает, что мобильные элементы являются продуктом и двигателем эволюционного процесса адаптации и видообразования, в то время как другие полагают, что эти элементы — просто своеобразные паразиты геномов, поддерживаемые внутри популяций преимущественно за счет способности к репликации (1-3). У растений вариабельность генетических локусов, содержащих мобильные и контролирующие их элементы, связана с частыми изменениями состояния (state) последних. Не только передвижения подвижных элементов, но и изменения их состояния и свойств могут быть обусловлены присутствием во фланкирующих и внутренних областях специфических участков, подобных IS-элементам бактерий. Возможно, в контролирующих элементах растений есть также инвертируемые сегменты ДНК вроде тех, которые описаны у фага Mu и сальмонелл (4). Такое предположение объясняет циклические смены «фаз активности» контролирующих и мобильных элементов. Вспышки наследственной изменчивости, которые вызывают эти элементы у растений, имеют, очевидно, большое значение для эволюции. Поэтому важен вопрос о том, насколько часто и каким путем появляются активные мобильные и контролирующие их элементы.
Имеющиеся данные позволяют предполагать, что генетические факторы, соответствующие контролирующим и мобильным элементам, присутствуют в геноме в неактивном состоянии и поэтому не проявляются (2, 5). При некоторых повреждениях хромосом эти факторы, изменяясь, приобретают новое, самое важное свое свойство — способность к транспозициям. Первое условие для приобретения какими-либо генетическими элементами способности перемещаться — наличие на их концах последовательностей, благоприятных для рекомбинаций. Сравнительно частые точные вырезания контролирующих и мобильных элементов указывают на сайт-специфичность происходящих при этом рекомбинаций по отношению к границам элементов совершенно так же, как в случае транспозонов бактерий. Для перемещений рецепторов контролирующих элементов необходимо присутствие их регуляторов, которые действуют как в цис-, так и в транс-положении и одновременно сами способны к транспозициям. Поэтому следует считать, что для перемещений мобильных и контролирующих их элементов нужны кодируемые регуляторами сайт-специфичные системы рекомбинации и составляющие их гены (например, транспозазы). Трудно представить, что соответствующие гены в регуляторах возникают de novo — вероятнее, что они должны образоваться посредством изменения уже существующих генов, например осуществляющих общую рекомбинацию. Остается неясной природа эволюционных предшественников мобильных и контролирующих элементов: являются ли они обычными генами, выполняющими некие важные для организма функции, малозначительными последовательностями ДНК или же имеют экзогенную природу.
Согласно последнему предположению, подвижные элементы растений произошли из собственных вирусов, вирусов животных или перемещающихся элементов бактерий благодаря «потоку» чужеродных генов между разными организмами (6, 7).
Целью настоящего исследования была проверка достоверности этого предположения на основе сравнительного анализа первичных аминокислотных последовательностей транспозаз семейства MuDR у растений с полностью секвенированными геномами — Arabidopsis thaliana и Oryza sativa. A. thaliana представляет особый интерес, так как является модельным рас-тительным организмом, для которого изучены основные механизмы раз-вития и жизнедеятельности. Геном O. sativa, в свою очередь, предоста-вляет исключительную возможность охарактеризовать мобильные элемен-ты и их разнообразие.  
Методика. Для анализа вариаций аминокислотных последовательностей транспозаз семейства MuDR в геномах использован содержащий практически исчерпывающую информацию банк данных National Center for Biotechnology Information (NCBI, http://www.ncbi.nlm.nih.gov). Проводи-ли поиск сходных последовательностей с помощью программы BLAST (www.ncbi.nlm.nih.gov/blast/). Дополнительно последовательности транспозаз семейства MuDR генома A. thaliana получали из банка данных Munich Information Center for Protein Sequences (MIPS, http://mips.gsf.de). Исходной последовательностью для поиска (query) служила последовательность транс-позазы кукурузы (Zea mays L.) mudrА (AAA21566). Сравнительный анализ аминокислотных последовательностей (элайнмент) проводили с помощью программы CLUSTAL. Для анализа филогенетических взаимоотношений применяли программу TREECON (8).
Результаты. Известно, что Mu-элементы характеризуются исклю-чительной вариабельностью (4, 9). Для характеристики семейства в целом выбирают наиболее консервативные участки, каким является mudrA, ко-дирующий транспозазу и концевые инвертированные повторы.
Однако в геноме Arabidopsis найдены Mu-элементы, не содер-жащие этих повторов. Вопреки ожиданиям оказалось, что такие элементы также могут кодировать транспозазу и перемещаться по геному (10, 11). Подобные примеры структурного разнообразия встречаются в семействе необычных бактериальных IS-элементов (IS901, IS116, IS902) (12). Для того, чтобы охватить и эту группу элементов, анализировали транспозазу как опре-деляющую сайт-специфичную рекомбинацию при транспозиции мобильных элементов. Кроме того, наиболее достоверно именно сопоставление белковых последовательностей, поскольку в случае нуклеотидных третий вариабельный нуклеотид, как правило, вносит дополнительную ошибку.


* Работа выполнена при частичной финансовой поддержке гранта РФФИ 08-04-90104-Мол_а.

Б

        1 MDLTPSFNSLDSNGIPNSPDVDPALGETGGSEGLQKIDGESQLDWDSIIVSDVLDDEGRV
          61 QVPTENEIYFNLGLNKGDEAANNRFSGSGTNCHAQGSLDTDNEDHHADQPCQDYIPDEKR
         121 VVYNRMNPSMQPGCLFPNMKEFRIAMRQYAIKHEFELGIEVTSTTRYVGYCKGGDCPWRI
         181 YAREEKKGLPTIVVAVLDDVHTCTSSGRRRTTTPTCGWVAFHAKPLLMKKPQMGAKELQQ
         241 TLQTTHNVTIGYDTVWKGKEKALRELYGSWEESFQLLYSWKEAVIAVMPDSVIEIDVILE
         301 DGKYYFSRFFCAFGPCISGFRDGCRPYLSVDSTALNGRWNGHLASATGVDGHNWMYPVCF
         361 GFFQAETVDNWIWFMKQLKKVVGDMTLLAICSDAQKGLMHAVNEVFPYAERRECFRHLMG
         421 NYVKHHAGSEHMYPAARAYRRDVFEHHVSKVRNVHKIAEYLDQHHKFLWYRSGFNKDIKC
         481 DYITNNMAEVYNNWVKDHKDLPVCDLAEKIREMTMELFHRRRRIGHKLHGIILPSVLAIL
         541 KARTRGLGHLSIVKCDNYMAEVRDSTNCMTKHVVNAELKQCSCEEWQHTGKPCQHGLALI
         601 IAQDSRDVGMENFVDDYYSTERFKIAYSRRVEPIGDRSFWPSVDFASGVFAPIARRGLGR
         661 QRKNRIKSCLEGGSARNKSTNENEKTKKRLKRQYTCPNCGELGHRQSSYKCPLNGTKKRK
         721 RKPRINTTKNWIPKELRTSSQNVPVQPDVAEEVTEQELEDPQPETEQLGLALFQPLGAQI
         781 TEQEADEPAEQAPPASPPPTRKWLVKKITPKKRLRISAQQKQY

Рис. 1. Структурные домены в пределах аминокислотной последовательности (А) и транспозазы mudrА кукурузы gb|ААА21566 (Б). Области последовательностей, образующих домены, подчеркнуты.

MudrA Z. mays, использованная в качестве исходной последова-тельности для поиска (query). Под CD-доменом понимаются определенные функциональные и/или структурные участки полипептидной цепи: MuDR-домен, специфичный для соответствующего семейства растительных транспозаз, и Transposase до-мен, общий для растительных и бактериальных транспозаз (рис. 1).

Домены, имеющие высокую степень сходства:

Score (bits)

E value

gnl|CD|23418

pfam03108, MuDR, MuDR family transposase

62,7

1e-10

gnl|CD|1427

pfam00872, Transposase_mut, Transposase, Mutator family

48,3

3e-06

Домен gnl|CD|23418 найден в растительных белках, которые являются транспозазами для мобильных элементов семейства Mutator. Такие транспозоны содержат две рамки считывания. Молекулярная функ-ция этого домена неизвестна.

gnl|CD|23418   pfam03108, MuDR, MuDR family transposase

Query:  133  GCLFPNMKEFRIAMRQYAIKHEFELGIEVTSTTRYVGYCKGGDCPWRIYAREEKKGLPTI  192
Sbjct:  31   GQVFKSKEDCQILLAIYAIKNKFHFKVTKSDPKRYVLECRDEGCLWRVRATRVKES-DCF  89

Query:  193  VVAVLDDVHT-CTSSGRRRTTTPTCGWVA--FHAKPLLMKKPQMGAKELQQTLQTTHNVT  249

Sbjct:  90   EIRKYNSEHTCSVTERSNRHRQATPRVIGSVLKEK-YSGQFPGPRPKDLMELVLEDLGVK  148
Query:  250  IGYDTVWKGKEKAL  263
Sbjct:  149  ISYSKAWRAKEFAV  162

gnl|CD|1427, pfam00872, Transposase_mut, Transposase, Mutator family

Query:  326  PYLSVDSTALNGRWNGHLAS-----ATGVDGHNWMYPVCFGFFQAETVDNWIWFMKQLKK  380
Sbjct:  163  PYLFLDATYVKVREEGRVVSKAVLIALGVTADGRREILGIEVGDGESAAFWLTFLDDLKA  222

Query:  381  VVGDMTLLAICSDAQKGLMHAVNEVFPYAERRECFRHLMGNYVKH  425

Sbjct:  223  RGLQGVLLVV-SDGHKGLVAAIRAVFPGASWQRCRVHFLRNLLAA  266

Рис. 2. Парный элайнмент областей mudrA, содержащих структурные домены, и соответ-ствующих им консенсусных последовательностей.

Информация о существующих доменах содержится в виде консен-сусной последовательности (consensus sequence), то есть последователь-ности, смоделированной таким образом, что она составлена из наиболее консервативных аминокислот, определенных множественным элайнментом.
В области, включающей домен transposase, в каждом из геномов с помощью программы BLAST (базы данных NCBI и MIPS) было обнару-жено более 100 последовательностей. Элайнмент этих последовательностей (рис. 2) и его оценка дендрограммой UPGMA («unrooted tree») (программа TREECON) позволили выявить четыре главных кластера (рис. 3): кластер Oryza, соединенный со смешанным кластером Oryza/Arabidopsis, и кластер Arabidopsis, соединенный со смешанным кластером Arabidopsis/Oryza. По-строенная дендрограмма характеризует эволюционное расстояние между по-следовательностями, но не указывает, какие из кластеров последовательно-стей более древние. Однако можно предположить, что последовательности, образующие смешанные кластеры, соответствуют древним признакам, сфор-мировавшимся до дивергенции цветковых растений на классы двудольных и однодольных, а индивидуальные кластеры Oryza и Arabidopsis — более позд-ним признакам, которые появились после этой дивергенции (в том числе специфичные для каждого из сопоставляемых видов). Естественно, это пред-положение нуждается в дополнительных доказательствах.
При построении эволюционного древа была выбрана последова-тельность, которая заведомо несет более древние признаки (outgroup se-quence), что позволяет «укоренить» древо. При этом при построении древа учитывали не только статические взаимоотношения между последователь-ностями и кластерами, но также определяли направления эволюции и, следовательно, выясняли, какой из двух классов последовательностей несет более древние признаки, унаследованные от предшественника.
В качестве outgroup sequence можно было бы использовать транс-позазу семейства Мu-элементов растений, филогенетически более древних, чем цветковые, однако информация о последовательностях мобильных эле-ментов нецветковых растений в международных базах данных отсутствует. Также возможно выбрать в качестве outgroup sequence бактериальную транс-позазу, но при этом возникает ряд трудностей. Так, бактериальные транспо-зазы эволюционно удалены от растительных. Степень сходства индивиду-альных последовательностей бактериальных и растительных транспозаз, об-наруживаемая парным элайнментом, оценивается количеством идентичных аминокислот и консервативных замен, которое лишь частично обусловлено общими древними признаками. Неопределенная часть обнаруживаемых при парном сопоставлении последовательностей идентичностей и консерватив-ных замен определяется случайным совпадением новообразованных вторич-ных признаков. Подобные совпавшие признаки маскируют искомые древние признаки, специфичные для транспозаз вне зависимости от их источника, в связи с чем эволюционный анализ, основанный на случайно выбранной в качестве outgroup sequence бактериальной транспозазе, может оказаться не-достоверным. Проблема осложняется областью достоверной гомологии бакте-риальных и растительных транспозаз, ограниченной лишь доменом II (см. рис. 1), который и несет искомые, но не определяемые при парном сопо-ставлении древнейшие признаки. Наконец, обилие бактериальных транспозаз в международных банках данных затрудняет выбор адекватной последо-вательности, отражающей признаки реально существовавшего предшествен-ника растительных транспозаз.
Иными словами, в нашем распоряжении имеются сотни после-довательностей бактериальных траспозаз, среди которых требуется найти единственную, использование которой в качестве outgroup sequence дол-жно определить направление эволюции среди сотен известных расти-тельных транспозаз.

Задача кажется неразрешимой, поскольку фактически сводится к обнаружению только двух транспозаз — растительной, несущей древ-нейшие признаки, унаследованные от общего предшественника всех рас-тительных транспозаз MuDR, и бактериальной, отражающей признаки этого предшественника.

Рис. 3. Дендрограмма, описывающая взаимоотношения первичных структур транспозаз геномов Arabidopsis и Oryza. Использованная коллекция транспозаз ограничена последова-тельностями, элайнмент которых достаточно достоверен в со-поставляемой области, ограниченной доменом II.

Исходя из по-следовательности рас-тительной транспозазы с заведомо древними признаками, с помо-щью парного элайн-мента можно устано-вить бактериальную outgroup sequence и наоборот. Поскольку направление эволюции растительных транспо-заз неизвестно, любая из них может быть ис-пользована для иденти-фикации бактериаль-ной транспозазы. В этом случае найден-ная транспозаза будет лишь казаться наибо-лее родственной из-за совпадения древних первичных и случай-ных вторичных приз-наков. Вследствие это-го использование для поиска различных слу-чайно выбранных рас-тительных транспозаз приводит к идентификации по меньшей мере нескольких бактериальных транспозаз, выбранных произвольно. Поэтому поиск адекватной outgroup sequence среди широкого спектра бактериальных последовательностей дол-жен опираться на использование той из растительных транспозаз, которая несет наиболее древние признаки. Между тем, именно это и составляет конечную цель исследования. Подобное противоречие можно преодолеть, использовав транспозазы из двух смешанных кластеров, a priory оце-ненных как древние, но и в таком случае выбор между этими двумя кластерами остается произвольным.
Для решения задачи идентификации единственной бактериальной последовательности, объективно пригодной в качестве outgroup sequence, использовали следующий прием (см. рис. 3). Программа NCBI позволяет установить консенсусную последовательность, характеризующую усреднен-ные общие признаки каждого из положений множественного элайнмента для большого числа бактериальных транспозаз. Консенсусная последова-тельность отражает консервативные признаки бактериальных транспозаз и, следовательно, предполагаемые консервативные признаки предшествен-ника растительных транспозаз. Поэтому использование в поиске не инди-видуальной (соответственно, в той или иной мере случайно выбранной) бактериальной транспозазы, а консенсусной последовательности должно привести к идентификации группы (кластера) растительных транспозаз, действительно несущих наиболее древние признаки.
При поиске наиболее родственных транспозаз растений с помощью установленной консенсусной последовательности оказалось, что такие по-следовательности принадлежат кластеру Arabidopsis/Oryza (см. рис. 3), то есть из двух кластеров, оцененных как древние, более древним является именно этот смешанный кластер. Для каждой из содержащихся в нем по-следовательностей с помощью программы BLAST были определены наи-более схожие последовательности бактериальных транспозаз. Как показал про-веденный анализ, наиболее родственна всем последовательностям кластера транспозаза бактерии Mycoplasma gallisepticum (NP_852947). Она и исполь-зовалась нами в дальнейшем исследовании избранных транспозаз Arabi-dopsis и Oryza (рис. 4, 5).

Для последовательностей кластеров Arabidopsis, Arabidopsis/Oryza и  Oryza/Arabidopsis было построено эволюционное древо, в котором оце-нили достоверность филогенетических расстояний и каждой из ветвей с помощью статистических методов (13-17). Были рассчитаны коэффи-циенты достоверности (bootstrap values, %) (100 % соответствует макси-мально возможной достоверности).

Рис. 4 Эволюционное древо, описывающее взаимо-отношения первичных структур транспозаз геномов Arabidopsis и Oryza (соответственно NP_917506 и NP_921661). Использованная коллекция транспозаз A. thaliana ограничена последовательностями, элайнмент которых достаточно достоверен в сопоставляемой об-ласти, ограниченной доменом II. В качестве outgroup sequence используется бактериальная транспозаза Myco-plasma gallisepticum (NP_852947).

Характерно, что оба смешанных кластера, пред-положительно оцененные как древние, действительно оказались таковыми среди выбранных последователь-ностей Arabidopsis. Отме-тим, что приведенные по-следовательности Arabidop-sis выделились как харак-терные представители сме-шанных кластеров и инди-видуального кластера Ara-bidopsis (см. рис. 2), обра-зующего несколько под-кластеров. Статистическая поддержка в пределах это-го индивидуального клас-тера невысока по двум причинам: первая — узкие границы элайнмента, до-ступные для анализа, вторая — последовательности индивидуального кла-стера Arabidopsis и бактериальной транспозазы эволюционно слишком далеки.

Bacteria consensus (query)
¯ BLAST
Cluster Arabidopsis/Oryza (query)
¯ BLAST
 Mycoplasma NP_852947 (outgroup)
¯
Построение древа (ограничено пределами домена II,
95 аминокислотных позиций)
¯
Oryza NP_921661 (outgroup sequence)
¯
Построение древа (домены I и II, 281 позиция)

Рис. 5. Схема эксперимента по обоснованию использования в качестве outgroup sequence последовательностей транспозаз Mycoplasma NP_852947 и Oryza NP_852947.

Попутно отметим, что в целом последова-тельности транспозаз Ara-bidopsis вариабельны, и для достоверного установления их эволюционных взаимо-отношений анализируемая область элайнмента дол-жна быть достаточно про-тяженной, вследствии чего мы увеличили длину исследуемых последователь-ностей, включив домен I MuDR, характерный только для растительных транспозаз, а также область между доменами I и II. При этом необходимо выбирать в качестве outgroup sequence другую последовательность, находящуюся на меньшем эволюци-онном расстоянии и несущую древние признаки. Методом парного элайн-мента установили, что таким условиям удовлетворяет последовательность, принадлежащая самому древнему кластеру Orysa — NP_921661.

А

AAA21566 RIAMRQYAIKHEFELGIEVTSTTRYVGYCKG-GDCPWRIYAEEKKGLPTIVVAVLDDVHTCTSSGRRR-TT

At1g42450 TTKLAIHPIRRKFHFIYAKSCPNIVFAMCVS-HTCLWRVYATELEEIDRFEIKCATQLHTCSVDARGDFHK
At2g07230 ATKLAIHAIRRKFNFITAKSCPNIVLAVCVS-HTCPWRVYATKLEDSERFEIKCATQQHTCSVDARGDFHK

At2g14030 NVKLAVHALNSRFHFRRDRSYKKLMTLTCIS-ELCLWRVYIVKLEDSDNYQIRSATLEHTCTVEERSNYHR
At2g29230 NVKLAVHALNRRFHFRRDRSCKKLMTLTCIS-ETCPWRVYIVKLEDSDNYQIRSANLEHTCTVEERSNYHR

At4g04140 RIALSIYAINRIFRFKFTRYEKHYLVAECYD-KKCDWRVRAHQVGGDSEYEVRLAKLEHVCKVQTRSRFSK
At3g43360 QQTMSLQAIKQCFCFKQPKSCPKTLKMVCVD-ETCPWQLTTRVVKDSESFKITSYATTHTCNIDSRKNYNK

At2g04310 HEVVDRAAFANSFGYVIKKSDKERYVLKCAK-ESCSWRLRASNISNTDIFSIRRYNKMHSCTRLSKSSSRR
At2g23500 HEVVDRAAFANSFGYVIKKSDKERYVLKCAK-ESCSWRLRASNISTTDIFSIRRYNKMHSCTRLSKGSSRR

At2g04950 VFTLRMSAVKHSFEFHTVKSDLTKYVLHCID-ENCSWRLRATRAGGSESYVIRKYVSHHSCDSSLRNVSHR
At2g15150 VFTLRMFAVKHNFEFHTVKSDLTRYVLHCID-ENCSWRLRATRAGGSESYAIRKYVSHHSCDSSLRNVSHR

At5g16505 RRTLKDLAIALHFDLRIVKSDRSRFIAKCSK-EGCPWRIHAAKCPGVQTFTVRTLNSEHTCEGVRDLH-HQ
At2g30640 RRALRDAAIALRFEMQTVKSDKTRFTAKCNS-EGCPWRIHCAKLPGLPTFTIRTIHGSHTCGGISHLG-HH
NP_917506 RRAVKDMAIAMHFELRVVKSDRSRFIAKCAR-EGCPWRVHVAKCHGVPTFTVRTLHGEHTCDGVRDLH-HH

At4g08680 KEAILEVTLKHGHNVVQDRWEKEKISFKCGMGGKCKWRVYCSYDPDRQLFVVKTSCTWHSCSPNGKCQILK
At1g33460 KEVVLHYAMKHRINAKQNRWEKDKISFRCAQRKECEWYVYASYSHERQLWVLKTKCLDHSCTSNGKCKLLK
NP_921661 KDAIERYALKKKINIRYVKNEQKRIRAVCRWKG-CPWLLYASHNSRSDWFQIVTYNPNHACCPELKNKRLS

 AAA21566 TPTCGWVAFHAKPLLM-KKPQMGAKELQQTLQTTHNVTIGYDTVWKGKEKALRELYGSWEESFQLLYSWKE

At1g42450 QASIAVIGKLVRTKYLGVGRGPRPNELRKMLRDEFNLNVSYLKAWRAQEIAMDNAMRSAMGSYTLIQPYFK
At2g07230 QASTAVIGQLMRTKYLGVGKGPRSNELRKMLRDEFSLNVSYWKAWRAREISMDNAMGSAMGSYALVQPYFK

At2g14030 GATTRVIRSIIKSKYDGNTRGPRAVDLQRILLTDYSVRISYWKAWKSREIALESVQGSATNSFSLLTAYIH
At2g29230 AATTRVIGSIIQSKYAGNSRGPRAIDLQRILLTDYSVRISYWKAWKSREIAMDSAQGSAANSFTLLPAYLH

At4g04140 HATSKVVAALLRAKYAKAFCGPRARDLPDSLLREHNVRMTYWKCWKAKELAVETAQGTDESSFSLLPVYLH
At3g43360 HANYKLLGEVVRSRYSSTQGGPRAVDLPQLLLNDLNVRISYSTAWRAKEVVVENVRGDEIANYRFLPTYLY

At2g04310 KGNPQLVAALLHDHFPGQLETPVPRIIMELVQTKLGMKVSYSTALRGKYHAIYDLKGSPEESYKDINCYLY
At2g23500 KGNPQLVAALLHDHFPGQLETPVPSIIMELVQTKLGVKVSYSTALRGKYHAIYDLKGSPEESYKDINCYLY

At2g04950 QASARTLGRLISNHFEGGKLPLRPKQLIEIFRKDHGVGINYSKAWRVQEHAAELARGLPDDSFEVLPRWFH
At2g15150 QASARTLGRLISNHFEGGKLPLRPKQLIEIFRKDHGVGINYSKAWRVQEHAAELARGLPDDSFEVLPRWFH

At5g16505 QASVGWVARSVEARIR-DNPQYKPKEILQDIRDEHGVAVSYMQAWRGKERSMAALHGTYEEGYRFLPAYCE
At2g30640 QASVQWVADAVTERLK-VNPHCKPKEILEQIHQVHGITLTYKQAWRGKERIMAAVRGSYEEDYRLLPRYCD
NP_917506 QATVGWVARSVEATLR-DNPQYKPKEILQDIREQHGVAVSYMQAWRGKERSMAAVHGTLEDGYRFLPAYCE

At4g08680 S---PVIARLFLDKLR-LNEKFMPMDIQEYIKERWKMVSTIPQCQRGRLLALKMLKKEYEEQFAHIRGYVE
At1g33460 R---RVIGRLFMDKLR-LQPNFMPLDIQRHIKEQWKLVSTIGQVQDGRLLALKWLKEEYAQQFAHLRGYVA
NP_921661 T---RRICDRYESTIK-ANPSWKAREMKETVQEDMGVDVSITMIKRAKTHVMKKIMDTQTGEYSKLFDYAL

 AAA21566 AVIAVMPDSVIEIDVILEDGYFSRF---FCAFGPCISGFRDGCRPYLSVDSTALNGRWNGHLASATGVDGH

At1g42450 LPLETNPNSLVALDTEKYNKGVERFRYLFFALPAAVHGYAYM-RKVMVIVGTHLRGRYGGCLIAASAQDAN
At2g07230 LLMETNPNSLVAMDTEKDKKGLERFRYLFFALDAAVKGYAYM-RKVIVIDGTHLRGRYGGCLIAASAQDAN

At2g14030 VLQEANPSSIVDLKTEIDAKGNYRFKYLFLAFAASIQGFSCM-KRVIVIGGAHLKGKYGGCLLTASAQDAN
At2g29230 VLREANPGSIVDLKTEVDGKGNHRFKYMFLAFAASIQGFSCM-KRVIVIDGAHLKGKYGGCLLTASGQDAN

At4g04140 VLQLANPGTVYHLETELDDIGDDRFKYVFLSLGASVKRLKYI-RRVVVVDGTHLFGKYLGCLLTASCQDAN
At3g43360 LLQLANPGTITHLHYTPEDDGKQRFKYVFVSLGASIKGLIYM-RKVVVVDGTQLVGPYKGCLLIACAQDGN

At2g04310 MLKKVNDGTITYLKL----DKNDKFQYVFVALGASIEGFRVM-RKVLIVDVTHLKNGYGGVLVFASAQDPN
At2g23500 MLKKVNDGTVTYLKL----DENDKFQYVFVALGASIEGFRVM-RKVLIVDATHLKNGYGGVLVFASAQDPN

At2g04950 RVQVTNPGSITFFK----KDSANKFKYAFLAFGASIRGYKLM-KKVISIDGAHLISKFKGTLLGASAQDGN
At2g15150 RVQVTNPGSITFFK----KDSANKFKYAFLAFGASIRGYKLM-RKVISIDGAHLTSKFKGTLLGASAQDGN

At5g16505 QIKLVNPGSFASVSALGPENCFQRL---FIAYRACISGFFSSCRPLLELDRAHLKGKYLGAILCAAAVDAD
At2g30640 QIRRTNPGSVAVVHGSPVDGSFQQF---FISFQASICGFLNACRPLIGLDRTVLKSKYVGTLLLATGFDGE
NP_917506 QIVQTNPGSVAIYKGTGPDNSFQRL---FVSFHASIHGFLNACRPLLEIDKADLKGKYLGTLLCASAVDAE

At4g08680 EIHSQNPGSVAFIDTYRNEKGEDVFNRFYVCFNILRTQWAGSCRPIIGLDGTFLKVVVKGVLLTAVGHDPN
At1g33460 EILSTNKGSTAIVDTIRDANENDVFNRIYVCFGAMKNAFY-FCRPLIGIDGTFLKHAVKGCLLTAIAHDAN

NP_921661 KLQRSNPGNSVHI-ALDPEEEDHVFQRFYVCFDACRRGFLEGCRRIIGLDGCFLKGPLKGELLSAIGRDAN

 AAA21566 NWMYPVCFGFFQAETVDNWIWFMKQLKKVV--GDMTLLAICSDAQKGLMHAVNEVFPYAERRECFRHL

At1g42450 FQVFPITFGIVNSENDDAWTWFMERLTEAI--PDDPDLVFVSDRHSSIYASIRKVYPMSSHAACVIHL
At2g07230 FQVFPIAFGIVNSENDDAWTWFMERLTDAI--PNDPDLVFVSDRHSSIYASMRKVYPMSSHAACVVHL

At2g14030 FQVYPLAFGVVDSKNDDAWEWFFRVLSTAI--PDGEILTFVSDRHSSIYTGLRKVYPKARHGACIVHL
At2g29230 FQVFPIAFGVVDSENDDAWEWFFRVLSTAI--PDGDNLTFVSDRHSSIYTGLRRVYPKAKHGACIVHL

At4g04140 FQIFPIAFAVVDSETDHSWTWFMNKLSEII--KDGPDLTFVSDRNQSIFKSVGLVFPQAHHGACLVHI
At3g43360 FQIFPIAFGVVDGETDASWAWFFEKLAEIV--PDSDDLMIVSDRHSSIYKGLSVVYPRAHHGACAVHL

At2g04310 RHHYIIAFAVLDGENDASWEWFFEKLKTVV--PDTSELVFMTEKCKPHKGHTERVYRRSSRKLSRVYV
At2g23500 RHHYIIAFAVLDGENDASWEWFFEKLKTVV--PDTSELVFMTDRNASLIKAIRNVYTAAHHGYCIWHL

At2g04950 FNLYPIAFAIVDSENDASWDWFLKCLLNII--PDENDLVFVSDRAASIASGLSGNYPLAHNGLCTFHL
At2g15150 FNLYPIAFAIVDSENDASWDWFLKCLLNII--PDENDLVFVSERAASIASGLSGNYPLAHHGLCTFHL

At5g16505 DGLFPLAIAIVDNESDENWSWFLSELRKLL--GSMPKLTILSERQSAVVEAVETHFPTAFHGFCLRYV
At2g30640 GAVFPLAFAIISEENDSSWQWFLSELRQLL--ENMPKLTILSSRDQSIVDGVDTNFPTAFHGLCVHCL
NP_917506 NMMFPLAFGIVDAESDENWMWFFSELRKML--GKMPVLTILSERQSQVVEAVEVNFPTAFHGFCLRYV

At4g08680 NQIYPIAWAVVQSENAENWLWFVQQIKKDLNLEDGSRFVILSDRSKGLLSAVKQELPNAEHRMCVKHI
At1g33460 NQIYPVAWATVQFENAENWLWFLNQLKHDLELKDGSGYVVISDRCKGIISAVKNALPNAEHRPCVKHI

NP_921661 NQLYPIAWAVVEYENKDSWNWFLGHLQKDINIPVGAAWVFITDQQKGLLSIVSTLFPFAEHRMCARHI

Рис. 6. Элайнмент области доменов I и II, а также междоменной вставки (281 позиция) (А, жирным шрифтом указаны аминокислоты, идентичные outgroup sequence) и эволюционное древо, описывающее взаимоотношения первичных структур транспозаз геномов Arabidopsis (Б, построено на основании элайнмен-та А; в качестве outgroup sequence использована транспозаза Orysa — NP_921661).

Характерно, что соответствующее эволюционное древо не только демонстрирует статистически достоверные эволюционные взаимоотно-шения кластеров (рис. 6), но и обнаруживает иную топологию по срав-нению с предыдущим (см. рис. 4). Исходя из полученных данных, кластер 2g04310/2g23500 более древний, чем 2g04950/2g15150.
На основе использования в качестве outgroup sequence после-довательностей смешанного кластера Arabidopsis/Oryza может быть про-анализирован и более широкий спектр последовательностей Arabidopsis и Oryza, образующих соответствующие индивидуальные кластеры. При этом следует иметь в виду, что последние представлены сильно дивергирован-ными последовательностями, одновременный эволюционный анализ которых затруднителен.
Предложенный нами подход к выбору адекватной outgroup sequence при исследовании эволюционных взаимоотношений внутри семейства бел-ков, лишь отдаленно родственных другим семействам, может найти доста-точно широкое применение в молекулярно-эволюционных и биоинфор-мационных исследованиях, поскольку, как правило, в современных банках данных представлены многочисленные последовательности белков высоко-развитых эукариот и примитивных бактерий, тогда как промежуточные эво-люционные звенья не охарактеризованы. В качестве примера приведем эво-люционно родственные запасным белки растений купины, которые при-сутствуют в виде сильно дивергировавших последовательностей у прока-риот и эукариот (18).
Существование множества гомологичных транспозаз, а также  сходство одного из структурных доменов с бактериальной транспозазой указывает на то, что эта система элементов в геноме Arabidopsis может быть очень древней.  
Неожиданным оказалось то, что нами обнаружено большое число элементов, кодирующих транспозазу. Открытым остается вопрос, явля-ются ли все элементы, содержащие исследованные последовательности, автономными (способный к самостоятельной транспозиции элемент дол-жен содержать как активную транспозазу, так и участок ДНК, который может связываться с ферментом, — концевые инвертированные повторы либо консервативные мотивы). Возможно, что некоторые из рассмотрен-ных выше транспозаз дивергировали в такой степени, что утратили спо-собность к самостоятельной транспозиции (см. рис. 3). Высокое сходство последовательностей внутри консервативных доменов предполагает, что эти элементы все-таки содержат полноценную транспозазу. В случае утери необходимых для связывания фермента консервативных мотивов элемент становится дефектным, однако транспозаза может быть использована для перемещения других дефектных элементов. Предполагается, что MuDR-элемент кукурузы является предком остальных элементов этого семейства (6). Полученные результаты позволяют предположить, что рассмотренные последовательности дивергировали недавно и могут служить предше-ственниками новых дефектных элементов.
Происхождение подвижных элементов растений и содержащихся в них генов трудно обсуждать, поскольку до конца не выяснены ни их тонкая структура, ни сам механизм транспозиций (19). На основе проведенного анализа прежде всего можно поставить вопрос о сходстве механизмов транспозиций перемещающихся элементов прокариот и эукариот. Считается, что контролирующие элементы растений перемещаются во время редупликации хромосом, но, как известно, накопленные на сегодня данные свидетельствуют в пользу транспозиций контролирующих элементов с одновременной их эксцизией из участка первоначальной локализации (6, 11, 19). В частности, транспозиции, как правило, не приводят к увеличению суммарного числа копий элементов и при удвоении в одной парной хромосоме происходит их эксцизия из другой. В то же время для перемещающихся элементов бактерий характерна «репликативная» транспозиция, когда одна сестринская копия переходит в новое место, а другая сохраняет первоначальную локализацию (4).
Если вывод об «эксцизионной» транспозиции контролирующих и мобильных элементов растений подтвердится, то можно будет говорить о принципиальном отличии их от подвижных элементов прокариот, по крайней мере, по механизму перемещений, контролируемых и осуществляемых транспозазами, но по мутагенности и механизмам влияния на соседние гены сходство мобильных элементов растений и перемещающихся элементов бактерий несомненно. Это следует и из проведенных выше результатов сравнительного анализа первичных аминокислотных последовательностей транспозаз, а также мобильных элементов про- и эукариот. Аналогию между мобильными элементами, включая отдельные гены, неоднократно подчеркивали многие авторы (4, 6, 10, 20), но еще не ясно, насколько она глубока. Для ответа на этот вопрос следует ожидать дальнейшего накопления дополнительных данных.
Таким образом, сравнительный анализ первичных аминокислотных последовательностей транспозаз семейства MuDR у растений с полностью секвенированными геномами (Arabidopsis thaliana и Oryza sativa) выявил сход-ство последовательностей внутри консервативных доменов, из чего следует, что изученные мобильные генетические элементы класса II содержат полно-ценную транспозазу. При утере необходимых для связывания фермента кон-сервативных мотивов элемент становится дефектным, однако транспозаза может использоваться для перемещения других дефектных элементов. По-лученные результаты позволяют предположить, что рассмотренные последо-вательности дивергировали недавно и могут служить предшественниками но-вых дефектных элементов.

Л И Т Е Р А Т У Р А

  1. B o w e n  N.J.,  J o r d a n  I.K. Transposable elements and the evolution of eukaryotic complexity. Curr. Issues Mol. Biol., 2002, 4: 65-76.
  2. M i l l e r  W.J.,  Mc D o n a l d  J.F.,  P i n s k e r  W. Molecular domestication of mobile elements. Genetica, 1997, 100: 261-270.
  3. Е в г е н ь е в  М.В. Мобильные элементы и эволюция. Мол. биол., 2007, 41: 234-245.
  4. Х е с и н  Р.Б. Непостоянство генома. М., 1985.
  5. V e l a z q u e z  F., F r e n a n d e z  S., de  L o r e n z o V. The upstream-activating sequences of the sigma54 promoter Pu of Pseudomonas putida filter transcription read through from upstream genes. J. Biol. Chem., 2006, 281: 11940-11948.
  6. B e n n e t z e n  J.L. Transposable element contributions to plant gene and genome evolution. Plant Mol. Biol., 2000, 42: 251-269.
  7. B e n n e t z e n  J.L. Transposable elements, gene creation and genome rearrangement in flowering plants. Cur. Opin. Genet. Dev., 2005, 15: 621-627.
  8. V a n  de  P e e r  Y.,  De  W a c h t e r  R. TREECON for Windows: a software package for the construction and drawing of evolutionary trees for the Microsoft Windows environment. Com. Appl. Biosci., 1994, 10: 569-570.
  9. H a r s h e y  R.M.,  J a y a r a m  M. The mu transposome through a topological lens. Crit. Rev. Biochem. Mol. Biol., 2006, 41: 387-405.
  10. Y u  Z., W r i g h t  S.I.,  B u r e a u  T.E. Mutator-like elements in Arabidopsis thaliana. Structure, diversity and evolution. Genetics, 2000, 156: 2019-2031.
  11. X u  Z.,  Y a n  X.,  M a u r a i s  S.,  F u  H. e.a. Jittery, a mutator distant relative with a paradoxical mobile behavior: excision without reinsertion. Plant Cell, 2004, 16: 1105-1114.
  12. O h t s u b o  F.,  S e k i n e  Y. Bacterial insertion sequences. Curr. Top Microbiol. Im-munol., 1996, 204: 1-26.
  13. E f r o n  B.,  H a l l o r a n  E.,  H o l m e s  S. Bootstrap confidence levels for phylogenetic trees. Proc. Natl. Acad. Sci. USA, 1996, 93: 13429-13434.
  14. B r o w n  J.K. Bootstrap hypothesis tests for evolutionary trees and other dendrograms. Proc. Natl. Acad. Sci. USA, 1994. 91: 12293-12297.
  15. E f r o n  B.,  G o n g  G. A leisurely look at the Bootstrap, the Jack-knife, and cross-validation. The American Statistician, 1983, 37: 37-48.
  16. F e l s e n s t i e n  J. Confidence limits on phylogenies: An approach using the bootstrap. Evolution, 1985, 39: 783-791.
  17. B e r l o c h e r  S.H.,  S w o f f o r d  D.L. Searching for phylogenetic trees under the frequency parsimony criterion: an approximation using generalized parsimony. Syst. Biol., 1997, 46: 211-215.
  18. D u n w e l l  J.M. Cupins: a new superfamily of functionally diverse proteins that include germins and plant storage proteins. Biotechnol. Genet. Eng. Rev., 1998, 15: 1-32.
  19. J o n e s  R.N. McClintock's controlling elements: the full story. Cytogenet. Genome Res., 2005, 109: 90-103.
  20. H e d g e s  D.J,  D e i n i n g e r  P.L. Inviting instability: transposable elements, double-strand breaks, and the maintenance of genome integrity. Mutat. Res., 2007, 616: 46-59.

 

ГНУ ГНЦ РФ Всероссийский НИИ
растениеводства им. Н.И. Вавилова,

190000 г. С.-Петербург, ул. Большая Морская, 44,
e-mail: yu.chesnokov@vir.nw.ru;
Лаборатория химии белка государственного молдавского университета,
МД-2009 г. Кишинев, Молдова, ул. А. Матеевича, 60

Поступила в редакцию
15 октября 2007 года

FAMILY OF MuDR TRANSPOSASE IN GENOMES OF Arabidopsis thaliana AND Oryza sativa

Yu.V. Chesnokov, A.A. Shutova, A.D. Shutov

S u m m a r y

On the basis of comparison analysis of amino acid sequences of transposases from family of MuDR plants with entirely known genomes (Arabidopsis thaliana and Oryza sativa) the authors con-sidered the questions of the origin of mobile genetic elements in plants and the genes encoded by these elements. The existence of number homologous transposases denote that in A. thaliana genome this sys-tem may be very old. Based upon similarity of sequenses within conservative domens the conclusion was made that mobile genetic elements of class II have full transposase. In case of the loss of necessary for enzyme binding conservative motif this element becomes defective, however the transposase may be used for translocation of other defective elements. Obtained results permit to suppose that examined sequenses diverged recently and served as precursors of new defective elements.