ДНК-рекордсмены: как соотносятся между собой геномы человека и червяка. Сколько же всего генов у человека? Сколько генов в организме человека

Перекрывание генных текстов

Принцип компактности записи информации в ДНК проявляется еще в одном. Важный факт, обнаруженный первоначально при анализе последовательностей генов у вирусов, заключается в том, что в одном и том же участке ДНК иногда может быть записана информация о двух совершенно разных РНК (и, соответственно, о совершенно разных белках). Такое случается и в геноме высших организмов, включая человека. Как же это осуществляется? Вспомним, что записанный в ДНК текст явно не разбит на слова (буквы – нук–леотиды – следуют в молекуле ДНК одна за другой). Но слова в этом тексте есть, просто знаки пунктуации и разрывы между словами скрыты от глаза и узнаются клеткой после перекодировки информации из ДНК в РНК. Для большей наглядности приведем широко известный пример такого текста:

НАПОЛЕОНКОСИЛТРАВУПОЛЯКИПЕЛИСОЛОВЬЯМИ.

В зависимости от разбивки этого текста на слова получается два предложения с совершенно разным значением:

НА ПОЛЕ ОН КОСИЛ ТРАВУ ПОЛЯ КИПЕЛИ

СОЛОВЬЯМИ

НАПОЛЕОН КОСИЛ ТРАВУ ПОЛЯКИ ПЕЛИ

СОЛОВЬЯМИ.

Теоретически на двух цепях ДНК с учетом того, что код триплет–ный, можно записать 6 разных текстов: три на одной цепи и три на другой. Это может быть достигнуто за счет сдвига точки начала считывания информации, что называют сдвигом рамки считывания (начало считывания возможно с любого из 3–х разных рядом лежащих нуклеотидов) (см. рис. 21). Такое явление получило название перекрывания генов. Впервые оно было обнаружено у вирусов. И здесь было понятно, зачем это потребовалось. Вирусные геномы обычно очень маленькие. Перекрывание генов диктовалось необходимостью как можно компактнее разместить информацию на отно


Рис. 21. Схематическое изображение перекрывания двух ДНКовых текстов, записанных на одном участке ДНК. Белок А образуется на мРНК, которая транслируется с одних кодо–нов, а белок Б образуется на мРНК, читаемой (транслируемой) со сдвигом в один нуклеотид. В результате кодоны (они разделены пробелами) совершенно разные, и, соответственно, при трансляции мРНК образуются совершенно разные белки сительно коротких молекулах ДНК. Большой геном человека теоретически позволяет обойтись без такого перекрывания. Однако и в геноме человека, хотя и относительно редко, перекрывание генов также имеется.

Каков может быть смысл в сохранении этого феномена в геноме человека? Пока еще не все ясно, но кое–какие моменты уже проясняются. Например, в ряде случаев обнаружили считывание РНК с разных цепей одного участка ДНК. Это приводит к образованию таких РНК, которые в силу комплементарности могут взаимодействовать друг с другом в клетке, образуя в результате двунитевые РНК. А в дву–нитевом виде мРНК не способна к такому важному процессу, как трансляция. Таков реальный механизм специфической регуляции (инактивации) экспрессии генов человека, число которых, по последним оценкам, составляет ~ 1600.

Не все гены кодируют белки

Прежде всего, следует отметить, что кроме генов, кодирующих белки, в геноме имеются еще гены, на которых синтезируется РНК, которые не являются мРНК (то есть, не кодируют белок), но выполняют ряд самостоятельных важных функций в клетках. В результате получается ситуация, что традиционное привычное определение гена надо расширять, включив в него гены, кодирующие белки, и гены, не кодирующие белки, но кодирующие функционально значимые РНК.

Давно уже известно, что кроме мРНК на ДНК синтезируются разнообразные вспомогательные РНК, которые сами не транслируются (т. е. они не кодируют белки), но участвуют в разных клеточных процессах. В первую очередь это РНК «домашнего хозяйства» – ри–босомные РНК (рРНК), транспортные РНК (тРНК) и др., которые участвуют непосредственно в синтезе белка на мРНК. Эти РНК кодируются участками, которые также называются генами, и составляют основную массу РНК в клетках. рРНК входят в состав рибосом, являясь важным компонентом их структурной организации. У человека присутствует два основных типа рРНК размером около 1900 нуклеотидов и более 5000 нуклеотидов в малой и большой субчастицах соответственно. Еще одни некодирующие белок РНК – тРНК, которые обеспечивают аппарат трансляции, подтаскивая к рибосомам различные аминокислоты, вступающие в реакцию друг с другом. В геноме человека гены, кодирующие рРНК и тРНК, представлены многочисленными копиями. Так, в секвенированной ДНК человека обнаружено около 500 генов, кодирующих тРНК. Генов для рРНК в геноме человека выявлено около 200 копий, которые расположены на 5–ти разных хромосомах (13, 14, 15, 21 и 22).

Изучение свойств РНК привело к тому, что представление об исключительности белков в катализе биохимических реакций пришел конец. Выяснилось, что в природе имеются виды РНК, которые, подобно белкам, обладают высокоспецифической каталитической активностью.

Очень важным стало обнаружение в геноме человека множества других генов, также производящих РНК, но не способных кодировать белок. Постепенно выяснилось, что некоторые из таких не кодирующих белки РНК принимают участие в важнейших процессах, происходящих в клетке: регуляции транскрипции ДНК, сплайсинга и трансляции мРНК, модулировании функций белков и их пространственного распределения в клетке. По этой причине их назвали риборегуляторами. И примеров таких риборегуляторов уже сейчас можно привести немало. Так, установлено, что не кодирующий белок участок гена H19 имеет отношение к ряду процессов, протекающих в клетках, и, в частности, к их злокачественному перерождению. Другой РНК–кодирующий ген контролирует работу белок–ко–дирующего гена HFE, вовлеченного в метаболизм железа и связанного с наследственным заболеванием хемохроматозом. В последнем случае РНК–продукт кодируется тем же самым геном, который он регулирует, но его образование осуществляется на другой нити ДНК. В результате так называемый антисмысловой (комплементарный) РНК–продукт способен взаимодействовать с мРНК, образуя гибриды, неспособные транслироваться в рибосомах с образованием белка. Еще один интересный ген – ген РНК–активатора стероидного рецептора. Он обеспечивает активность стероидных рецепторов за счет образования комплекса с этим белком.

В клетках человека, как и у других организмов, выявлены короткие двунитевые РНК (микроРНК), отдельные из которых, по–видимому, могут участвовать в процессе регуляции экспрессии генов через механизм, названный РНК–интерференцией. Этот механизм впервые был обнаружен в 1998 году у низших организмов. Различные микроРНК в клетках червя C. elegans оказались в состоянии «приглушать» работу строго определенных генов путем воздействия на процесс синтеза кодируемых ими белков. Вполне вероятно, и у человека микроРНК играют подобную роль.

Таким образом, мы видим, что продукты генов, кодирующих только РНК, вмешиваются в различные клеточные процессы, используя при этом совершенно разные механизмы. Гены риборегу–ляторов составляют, по–видимому, заметную часть генома человека. Примерные оценки говорят о величине на порядок больше, чем доля белок–кодирующих нуклеотидных последовательностей. Сам факт существования таких генов, неспособных кодировать белок, но реально проявляющих себя в производстве функционирующих в клетках РНК, ставит большой вопрос перед исследователями генома. И, в первую очередь, что следует после этого считать собственно геном?

Ген в гене (генная матрешка)

Изредка обнаруживаются варианты, когда внутри одного гена целиком содержится другой, меньший по размерам ген. Этакая своеобразная «матрешка», построенная из генов. Такая организация генов весьма редка. Так, в хромосоме 22 имеется лишь 2 таких случая. Чаще всего белок–кодирующий ген располагается в интроне другого белок–кодирующего гена. Но встречаются и другие варианты. В качестве примера можно привести ситуацию, имеющую место для ми–тохондриального гена одной из рибосомных РНК. Ген, кодирующий эту рРНК, обеспечивает ею рибосомы митохондрий в качестве структурного компонента (т. е. не кодирует белок). Однако вместе с тем небольшой участок, расположенный внутри этого гена, кодирует короткий белок (полипептид), получивший название гуманин (от англ. human – человек), который принимает участие в процессе программированной клеточной гибели. То есть в РНК–кодирующем гене может содержатся белок–кодирующий ген. Другой вариант-уже упоминавшийся выше ген H19. Здесь, наоборот, ген, кодирующий белок, содержит внутри своей кодирующей части другой более короткий ген, кодирующий только РНК, которая принимает участие в регуляции работы этого гена.

Генные семейства

Как у людей имеются семьи, так и у генов нередко существуют семейства. Семейством генов называют набор из двух или более генов, чьи экзоны родственны между собой, т. е. похожи (хотя и не идентичны) по нуклеотидной последовательности. В геноме человека присутствует около полутора тысяч таких семейств генов. Причем только около сотни из них специфичны для человека и других позвоночных животных, тогда как основная масса генных семейств имеется и у человека, и у червя.

Разные члены одного семейства генов возникали в эволюции из одного гена–предшественника (условно – от одного прапрапрадеда, как и в человеческой популяции). Процесс, в результате которого появлялись «копии», получил название дупликации, т. е. удвоения. Такие дупликации в некоторых случаях происходят не одноразово, а многократно. Сейчас стало ясно, что дупликации играют очень важную роль в эволюции. Подсчитано, что в геноме человека в сумме дуплицировано около 3,6% нуклеотидных последовательностей размером в 1000 и более п. н.

Разные копии одного семейства генов могут располагаться в геноме рядом и следовать друг за другом (это называют тандемной дупликацией). Рассмотрим несколько примеров. Так, гены, кодирующие рибосомную РНК (рРНК) и белки гистоны, расположены в геноме человека в виде кластеров, построенных из одних и тех же последовательностей, следующих друг за другом (рис. 22).



Рис. 22. Строение участка генома человека, состоящего из множества генов, кодирующих рибосомные РНК. Утолщенные линии – транскрибируемые участки


Такие «гроздья» одинаковых генов обычно требуются организму для того, чтобы нарабатывать большие количества определенного продукта. Действительно, рРНК составляет по массе основную часть всей клеточной РНК, входя в состав таких важных «машин» клетки, как рибосомы. Огромная масса гистонов нужна клетке для упаковки гигантских молекул ДНК и плотной укладки их в хромосомы. Во всех таких случаях говорят о большой «дозе» гена в геноме, которая в конечном итоге и обеспечивает клетку большим количеством продукта.

Однако в большинстве других случаев возникающие в результате дупликации «копии» генов постепенно претерпевают изменения (мутации), что приводит к возникновению определенных различий между ними, хотя формальное родство при этом сохраняется. Такой процесс был назван дивергенцией, т. е. расхождением. Дивергенцию обычно выражает в процентах различий между двумя родственными последовательностями нуклеотидов в ДНК или последовательностями аминокислот в белках.

Однако даже после того, как разные «копии» генов одного семейства становятся не совсем похожими друг на друга, они чаще всего выполняют сходную функцию. Они остаются очень дружной семейкой! Но экспрессируются разные члены одного такого семейства обычно в разное время или в разных типах клеток. Так, в геноме человека обнаружено тридцать генов, кодирующих родственные факторы роста клеток кожи (фибробластов). А вот у низших организмов число таких генов существенно меньше (у дрозофилы и червя их всего 2). Другой пример – гены, кодирующие кератины – белки наружного слоя кожи и ее производных (волосы, ногти). Их у человека 111 штук! Но и это не предел. Геном человека, как ни удивительно, имеет около 1 000 копий генов–рецепторов обоняния.

Дивергировавшие в ходе эволюции человека гены семейства иногда оказываются разбросанными в разных местах на одной или даже разных хромосомах. При этом ген может быть удвоен целиком, а может происходить удвоение небольшого набора его экзонов или даже всего лишь одного из его экзонов.

Как и в семье не без урода, так и в семействах генов встречаются иногда такие члены, которые не утруждают себя никакой работой. Нарушение их способности функционировать в клетке обычно связано с накоплением опечаток в их ДНКовом тексте. Такие гены–тунеядцы получили название «псевдогенов». Перед их названием ставят греческую букву ψ. Не совсем ясно, зачем геному нужны такие гены, почему он сохранил их в эволюции, не избавился от них. Но факт остается фактом. По имеющимся оценкам, в геноме человека имеется около 20000 таких, подобных вымершим реликтам, псевдогенов. В частности, в огромной семействе генов–рецепторов обоняния, состоящем из примерно 1000 генов, около 60% являются псевдогенами. Считается, что массивная потеря функциональных генов произошла за последние 10 млрд. лет, и связано это со снижением роли обоняния у человека по сравнению с другими позвоночными организмами. Здесь, по–видимому, действует принцип отмирания из–за неупотребления. Установлено, что существует, по крайней мере, два механизма, приводящих к образованию псевдогенов. Один из них заключается в удвоении уже существующего гена (дупликация), а потом дополнительная копия накапливает мутации, которые препятствуют его работе. Другой механизм связан с процессом сплайсинга и обратной транскрипции. На сформировавшейся мРНК синтезируется ее ДНК–копия, которая в дальнейшем встраивается в геном. Такие псевдогены не содержат ни интроны, ни промоторные участки. Кроме того, в них со временем накапливаются многочисленные мутации, не позволяющие этим генам обеспечивать синтез нормального белка.

Все вышесказанное можно проиллюстрировать на примере семейства генов, кодирующих белки крови человека (рис. 23). У человека имеется два семейства глобиновых генов (альфа и бета). Эти семейства расположены на разных хромосомах. Каждое семейство состоит из нескольких членов, имеются здесь и псевдогены. Нормальные гены глобиновых семейств экспрессируются в клетках крови на разных стадиях развития человека. Одни у эмбрионов (ξ, ε), другие у плода (G γ , А γ , a1), а третьи – у взрослого организма (α2, δ, β). Функция у всех глобиновых генов одинакова – синтез глобинов, участвующих в переносе кислорода клетками крови. И место их работы одно – клетки крови эритроциты. Отличаются они лишь тем, что включаются в разное время, в результате чего выполняют одну и ту же роль, но на разных стадиях развития организма.



Рис. 23. Строение двух локусов генома, состоящих из кластеров родственных глобиновых генов человека. Экспрессирую–щиеся гены указаны стрелками (направление транскрипции), молчащие гены (псевдогены) – квадратиками

Организация кластеров глобиновых генов у человека совершенно одинакова с организацией этих генов у гориллы и павиана. Это указывает на то, что такая организация полностью сформировалась еще от 20 до 40 млн. лет назад и с тех пор не изменялась. Анализ мутаций в межгенных областях позволил сделать вывод об эволюции не отдельных генов, собранных в такой кластер, а кластера как единого целого супергена.

По–иному ведут себя многочисленные гены семейства актинов, которые кодируют сократительные белки клетки. Эти гены экспрес–сируются почти все время, и их экспрессия происходит как в мышечных клетках, так и во многих других немышечных. При этом функция актинов везде одинакова.

Новые предложения из фрагментов старых текстов

Экзон–интронная организация генов способствует еще одному механизму возникновения новых генов – созданию новых ДНКовых текстов из фрагментов старых. Это осуществляется в результате «тасования» уже предсуществующих экзонов, что может приводить к появлению нового их сочетания и новых белков с новыми функциями. Чаще всего это происходит за счет процесса присоединения новых экзонов к старым. Примером этому может служить случай, представленный на рис. 24.



Рис. 24. Пример формирования новых генов за счет различного сочетания уже имеющихся экзонов. Изображены четыре разных белка, состоящих из сходных блоков–доменов (обозначены разными символами), которые кодируются разными экзонами

В процессе эволюции из общего предшественника образовались гены дрозофилы trx и ген человека alr. Ген человека hrx возник в результате присоединения к гену trx четырех новых экзонов. Это приводит к появлению в белке, кодируемом этим геном, четырех новых функциональных доменов, что существенно меняет его свойства по сравнению с предшественником. Такая ситуация вообще–то характерна для всех высших организмов, но у человека она встречается в 2-5 раз чаще, чем, например, у дрозофилы или червя.

После получения всех этих новых многочисленных сведений об особенностях организации и эволюции генов у человека (сходным образом обстоит дело и у других высших организмов) стало ясно, что дать строгое определение того, что же такое собой представляет ген, довольно сложно. Но даже если бы такое определение сегодня имелось, его, как и всякое другое, не следовало бы считать незыблемым. Не зря говорил Спиноза: «Всякое определение есть ограничение». Однако в целом базовое представление о гене осталось в силе. Ген – это физическая (определенный участок ДНК) и функциональная (кодирует белок или РНК) единица наследственности.

Сколько же всего генов у человека?

Это наиболее интересный вопрос, ради которого собственно и затевалось полное секвенирование генома человека. После получения основной информации о структуре генома человека в первую очередь были произведены различные анализы по поиску генов и определению их числа. Однако задача оказалась не простой. Это может показаться странным для читателя, но однозначного ответа на поставленный вопрос до сих пор нет.

Сколько же всего генов в ДНК человека? Еще несколько лет назад полагали, что их около 100 тыс., затем решили, что не более 80 тыс. В конце 1998 г. пришли к выводу, что в геноме человека не более 50-60 тыс. генов и на их долю приходится около 3% общей длины ДНК.

Последние подсчеты общего числа генов в геноме человека проводили несколько международных команд ученых. Уже упоминавшаяся компания «Celera» провела собственные исследования, результаты которого изложены в журнале «Science» в 2001 году. По ее оценкам общее число генов в геноме человека составляет от 26383 до 39114. Средний размер гена оценивается равным примерно 3000 п. н. Если принять, что число генов у человека порядка 30 тысяч генов и на каждый ген приходится примерно 3 тыс. п. н., то нетрудно подсчитать, что в кодировании белков принимает участие менее 1,5% хромосомной ДНК. Таким образом, генетические инструкции по формированию человеческой личности занимают меньше 3 сантиметров на двухметровой молекуле ДНК. Удивляет и малое количество генов, несущих эти инструкции, – их всего в пять раз больше, чем, например, у такого на наш взгляд совершенно примитивного организма, как муха дрозофила.

Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинзом, подсчитав число генов у человека независимым способом и на основе своих данных, получила сходный результат – около 32000 генов содержится в геноме каждой клетки человека.

Разнобой в окончательные оценки пока вносят два других коллектива ученых. Доктор Вильям Хезелтайн (руководитель фирмы «Хьюмэн Геном Сайенс») продолжает настаивать, что в их банке содержится приватизированная информация на 120 тыс. генов. Этой информацией он не собирается пока делиться с мировой общественностью. Фирма вложила деньги в патенты и собирается заработать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Фирма «Инсайт» сообщила о том, что имеет в настоящее время каталог, состоящий из 140 тысяч идентифицированных ей генов человека, и также настаивает на этом количестве общего числа генов у человека.

Очевидно, что наспех приватизированная генетическая информация будет еще тщательно анализироваться и проверяться в ближайшие годы, пока точное число генов станет окончательно «канонизировано». Дело в том, что устройство генов весьма многообразно и до конца еще не поняты все возможные варианты. Вот мы прочитали последовательность нуклеотидов ДНК. Определено, что она способна кодировать белок. Но один ли? Выше уже говорилось о том, как транскрипция и последующие модификации РНК, а затем трансляция и модификации полипептидов, способны обеспечить огромное многообразие белков, кодируемых одним участком ДНК. И понять это исходя только из нуклеотидной последовательности ДНК очень часто просто невозможно. Тем не менее структура генома представляет собой единственную базу для осмысления данных, получаемых такими новыми направлениями, рожденными геномикой, как транскриптомика (исследует совокупность РНК–транскриптов организма), протеомика (исследует совокупность белков организма), метаболомика (исследует обмен веществ – метаболизм – в организме). Эти направления призваны дополнить лежащий в основе структурной геномики метод геномного секвенирования, дать возможность выйти за пределы его разрешающей способности.

Выше уже также говорилось об альтернативном сплайсинге. Сейчас хорошо известно, что за счет этого процесса с одних и тех же генов могут считываться разные белки, которые затем взаимодействуют друг с другом, образуя неповторимую смесь, как из основных цветов в живописи – желтого, красного и голубого можно получить мириады оттенков. Такой сплайсинг характерен не менее чем для половины генов человека. Считается, что в среднем с одного гена человека за счет альтернативного сплайсинга может образовываться три разных пептида. Но некоторые гены имеют до 10 альтернативно сплайсируемых экзонов, что позволяет теоретически получать более 1000 различных вариантов белков всего лишь на одном гене. В реальности число разных белков, кодируемых одним геном, достигает 10. Кроме того, существуют еще и альтернативные промоторы, альтернативные кодоны инициации трансляции, редактирование РНК (превращение Ц в У или А в аналог Г – инозин). Все вышесказанное пока еще невозможно учесть при оценке общего числа генов у человека.

Но и это не все. Кроме генов, кодирующих белки, имеются еще гены, конечным продуктом которых являются РНК. Вспомним об упоминавшихся выше генах–риборегуляторах – они не кодируют белки, но производят функционирующую в клетках РНК. Так что скорее всего окончательная оценка числа генов у человека будет сделана еще нескоро.

На сегодняшний день ученым известны функции всего лишь около восьми–десяти тысяч из них. А детальные сведения о механизмах их регуляции еще более скудны. Тем не менее, приведенные выше данные о строении и функционировании генов человека свидетельствуют о том, что у человека, царствующего в природе, в отличие от других существующих на нашей планете организмов, очень высока сложность протеома – полного набора функциональных белков в клетке, которая обеспечивается не просто за счет крупного размера генома или большого числа генов, а благодаря всевозможным инновациям, связанным с функционированием генов и формированием белков: большее число доменов–модулей, более высокая комбинаторика (перемешивание) этих модулей в белках, активное использование альтернативного сплайсинга и многое другое, о чем мы поговорим дальше.

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие« призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?

Александр Панчин

Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК — одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.


Репликация (от лат. replicatio — возобновление) — процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской. При следующем за этим делении каждая из дочерних клеток получает по одной копии молекулы ДНК, идентичной ДНК исходной материнской клетки. Репликацию ДНК осуществляет реплисома — сложный ферментный комплекс, состоящий из 15−20 различных белков.

Немного молекулярной генетики

Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) — и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три — от мамы.


Плодовая муха дрозофила Drosophila melanogaster. Геном модельной мухи. Геном: 120 млн пар оснований. Генов: 13 500.

Наиболее изученный тип функциональных последовательностей ДНК — гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.


Частично синтетическая бактерия Mycoplasma laboratorium. Синтетический геном, в котором закодированы имена синтезировавших его ученых. Геном: 580 000 пар оснований. Генов: 381.

Померимся генами?

Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено? Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас — 20−25 тысяч. Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бОльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus, в 40 раз больше человеческого), так и с бОльшим количеством генов (у риса — 32−50 тысяч генов).


Свободноживущая нематода Caenorhabditis elegans. Маленький модельный геном животного. Геном: 100 млн пар оснований. Генов: ~20 000.

Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов — последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов — белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК — копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов — например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.


Резуховидка Таля Arabidopsis thaliana. Маленький модельный растительный геном. Геном: 119 млн пар оснований. Генов: ~25 000.

Тем не менее бОльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы — последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены — нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».

Вдвое умнее мух

Идея тотализатора по поводу числа человеческих генов пришла в голову доктору Эвану Бирни в баре при лаборатории в Колд-Спринг-Харбор незадолго до завершения проекта «Геном человека». По мере приближения к финалу, с 2000 по 2002 год, ставки выросли с 1 доллара до 20. В результате банк разделили «на троих»: Пол Дир из Британского совета по медицинским исследованиям, который еще в 2000 году поставил на дату своего рождения — 27.04.1962 — 27 462, Ли Роуэн из Института системной биологии в Сиэтле — в 2001 году она поставила на число 25 947, и Оливер Джейлон из французской компании Genoscope (26 500). Когда главного победителя — доктора Дира — спросили, как ему удалось еще три года назад, когда все думали, что генов у человека не меньше 50 000, угадать число с такой точностью, он ответил: «Дело было в баре, глубокой ночью. Наблюдая за поведением пьющих людей, я подумал, что оно мало отличается от поведения мух-дрозофил, у которых 13500 генов, а потому мне показалось, что удвоенного числа мушиных генов людям вполне достаточно».

Минимальная мышь

Существует точка зрения, что бОльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК — наличие достаточно близких организмов с очень разными размерами геномов. Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?


На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.


Мимивирус Acanthamoeba polyphaga mimivirus. Самый большой известный геном вируса. Геном: 1 181 404 пар оснований. Генов: 979.

Находка или мусор?

Вызов представлению о существовании мусорной ДНК бросил проект ENCODE — The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции — синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) — или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.


Двоякодышащая рыба протоптер Protopterus aethiopicus. Самый большой известный геном. Геном: 133 млрд пар оснований. Генов: много.

Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution, называется так: «О бессмертии телевизоров: «функция» в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron, что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.


Вирус иммунодефицита человека (ВИЧ). Быстро меняющийся геном вируса иммунодефицита человека. Геном: 9749 пар оснований (но уже мутировал). Генов: 9, но они кодируют 18 белков.

По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов — «предпочтение находиться в 5"-конце генов» (5"-конец — это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома — занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», — отмечают оппоненты.

Каша ехала на мотоцикле

Иногда в СМИ можно услышать некорректную фразу «генетический код мутировал». Но мутации происходят не в коде, а в молекуле ДНК (в геноме). В результате меняются нуклеотидные последовательности. Это можно сравнить с заменой буквы в слове. Например, фраза «Маша ехала на мотоцикле» превращается во фразу «Саша ехала на мотоцикле», если одна буква М «мутировала» в букву С. Изменение генетического кода намного серьезней — это как изменение алфавита. Представим, что во всем тексте буква М внезапно превратилась в букву К. Теперь у нас «Каша ехала на котоцикле». Понятно, что такие изменения приводят к значительным последствиям и поэтому в природе происходят крайне редко. Но происходят! Например, у некоторых инфузорий один из стоп-кодонов может кодировать аминокислоту глутамин. Но это скорее исключение, чем правило. У большинства организмов один и тот же генетический код: например, у человека, у червяка или огурца. А вот геномы у этих организмов различаются очень сильно. Тот же алфавит, но другой текст.

Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор — белок, инициирующий синтез информационной (матричной) РНК — связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.


Рыба фугу Fugu rubripes. Самый маленький известный геном позвоночного. Геном: 390 млн пар оснований. Генов: 20−28 тысяч.

Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.


Лук репчатый Allium cepa. Один из самых больших растительных геномов. Геном: 16 млрд пар оснований. Генов: неизвестно.

Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе — репликации!», — снова шутит Граур.


Антарктические бескрылые комары-звонцы Belgica antarctica. Самый маленький геном членистоногих. Геном: 99 млн пар оснований. Генов: ~14 000.

Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!


Бактерия Hodgkinia cicadicola. Самый маленький известный геном бактерии. Бактерия-симбионт с нестандартным генетическим кодом. Геном: 144 000 пар оснований. Генов: 189.

Мусорная крепость

Но неужели остальные 90% генома человека — мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.


Человек разумный Homo sapiens. Геном предположительно на 90% состоит из мусора. Геном: 3 млрд пар оснований. Генов: 20−25 тысяч.

Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.


Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны — спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме — как от концепции, так и от самих ненужных последовательностей.

Принципы наследственности были обозначены впервые в 1900-х годах, когда естественные получили развитие и ввели в обиход (с полным определением) понятия геном человека и ген, в частности. Их исследование дало возможность ученым открыть секрет наследственности, и стало толчком для изучения наследственных болезней и их природы.

Вконтакте

Геном человека: общие понятия

Чтобы разобраться, что такое гены и процессы наследования организмом определенных свойств и качеств, следует знать и понимать термины и основные положения. Краткое изложение основных понятий даст возможность более глубоко вникнуть в данную тему.

Гены человека – это части цепи (дезоксирибонуклеиновая кислота в виде макромолекул), которая задает последовательность определенных полипептидов (семейства аминокислот) и несет основную наследственную информацию от родителей к детям.

Говоря простым языком, определенный ген содержит информацию о строении белка и несет ее от родительского организма к детскому, повторяя строение полипептидов и передавая наследственность.

Геном человека – это обобщающее понятие, обозначающее некоторое количество определённых генов. Впервые его ввел Ганс Винклер в 1920-м, однако спустя время несколько изменилось его изначальное значение.

Вначале он обозначал определенное количество хромосом (непарных и одинарных), а спустя время выяснилось, что в геноме 23 парных хромосомы и митохондриальная дезоксирибонуклеиновая кислота.

Генетическая информация – это данные которые заключены в ДНК, и несущие порядок построения белков в виде кода из нуклеотидов. Стоит также упомянуть, что подобная информация находится внутри и вне границ .

Гены человека исследовались на протяжении многих лет, за которые было претворено в жизнь множество экспериментов . До сих пор проводятся опыты, которые дают ученым новую информацию.

Благодаря последним исследованиям стало ясно, что не всегда четкая и последовательная структура наблюдается в дезоксирибонуклеиновых кислотах.

Существуют так называемые прерывистые гены, связи которых прерываются, что делает неверными все предыдущее теории о постоянстве этих частиц. В них время от времени происходят изменения, которые влекут за собой изменения и в структуре дезоксирибонуклеиновых кислот.

История открытия

Впервые научный термин был обозначен только в 1909 году ученым Вильгельмом Иогансеном, который был выдающимся ботаником в Дании.

Важно! В 1912 году появилось слово «генетика», которое стало названием целого отдела . Именно он занимается изучением генов человека.

Исследование частицы началось задолго до 20 века (данных в каком точно году нет), и складывалось из нескольких этапов:

  1. В 1868 году известный ученый Дарвин выдвинул гипотезу о пангенезе. В ней он описывал отделение геммулы. Дарвин считал, что геммула – это определенная часть клетки, из которой затем образовываются половые клетки.
  2. Через несколько лет Гуго де Фриз сформировал свою собственную теорию, отличную от дарвиновской, в которой описал процесс пангенеза внутри клеток. Он считал, что в каждой клетке есть частица, и она ответственна за некоторые свойства наследования вида. Он обозначил эти частицы как «пангены». Отличия двух гипотез заключается в том, что Дарвин считал геммулы частями тканей и внутренних органов, независимо от вида животного, а де Фриз представлял свои пангены как признаки наследования внутри конкретного вида.
  3. В. Иогансен в 1900 году определил наследственный фактор как ген, взяв вторую часть от термина, использованного де Фризом. Он использовал слово для определения «зачатка», той частицы, которая является наследственной. При этом ученый подчеркивал независимость термина от ранее выдвинутых теорий.

Изучением наследственного фактора уже достаточно давно занимались биологи и зоологи, но только с начала 20-го века генетика начала развиваться с огромной скоростью, открывая для людей тайны наследования.

Расшифровка генома человека

С того момента, как ученые открыли наличие в организме человека гена, они стали исследовать вопрос информации, заключенной в нем. Уже более 80 лет ученые пытаются расшифровать ее. На сегодняшний день они добились в этом значительных успехов, что дало возможность влиять на наследственные процессы и менять структуру клеток у следующего поколения.

История расшифровки ДНК состоит из нескольких определяющих моментов:

  1. 19 век – начало изучения нуклеиновых кислот.
  2. 1868 год – Ф. Мишер впервые выделяет из клеток нуклеин или ДНК.
  3. В середине 20 века О. Эвери и Ф. Гриффит выясняют при помощи опыта, проведенного на мышах, что за процесс трансформации бактерий отвечает именно нуклеиновая кислота.
  4. Первый человеком, кто показал миру ДНК стал Р. Франклин. Спустя несколько лет после открытия нуклеиновой кислоты он делает фотографию ДНК, случайным образом используя рентген при исследовании структуры кристаллов.
  5. В 1953 году дано точное определение принципу воспроизводства жизни у всех видов.

Внимание ! С того времени, как впервые общественности предоставили двойную спираль ДНК, произошло множество открытий, давших возможность понять природу ДНК и механизмы ее работы.

Человеком, который открыл ген , принято считать Грегора Менделя, впервые обнаружившего определенные закономерности в наследственной цепи.

А вот расшифровка ДНК человека произошла на основе открытия другого ученого – Фредерика Сенгера, который разработал методы чтения последовательностей белковых аминокислот и последовательность построения самой ДНК.

Благодаря работе множества ученых за три последних века были выяснены процессы формирования, особенности, и сколько генов находится в геноме человека.

В 1990 году начался международный проект «Геном человека», которым руководил Джеймс Уотсон. Его целью было выяснить, в какой последовательности выстраиваются нуклеотиды в ДНК, и выявить около 25 000 генов в человеке. Благодаря этому проекту человек должен был получить полное представление о формировании ДНК и расположению всех его составляющих частей, а также механизм построения гена.

Стоит уточнить, что программа не ставила своей задачей определить всю последовательность нуклеиновой кислоты в клетках, а лишь только некоторых областей. Началась она в 1990 году, но только в 2000 был выпущен черновик работы, а полное исследование завершено — в 2003 году . Исследование последовательности длиться до сих пор и 8% гетерохроматиновых областей все еще не определены.

Цели и задачи

Как любой научный проект, «Геном человека» ставил перед собой конкретные цели и задачи. Изначально ученые собирались выявить последовательности 3 млрд нуклеотидов и более. Затем отдельные группы исследователей выразили желание попутно определить также последовательность биополимеров, которая бывает аминокислотной или нуклеотидной. В итоге главные цели проекта выглядели следующим образом:

  1. Создать карту генома;
  2. Создать карту человеческих хромосом;
  3. Выявить последовательность формирования полипептидов;
  4. Сформировать методологию хранения и анализа собранной информации;
  5. Создать технологию, которая поможет в достижении всех указанных выше целей.

Данный список задач упускает не менее важную, но не такую очевидную – это изучение этических, правовых и социальных последствий подобных исследований. Вопрос наследственности может вызывать разногласия среди людей и повлечь серьезные конфликты, поэтому ученые поставили за цель обнаружить решения этих конфликтов до их возникновения.

Достижения

Наследственные последовательности – это уникальное явление , которое наблюдается в организме каждого человека в той или иной форме.

Проект достиг всех поставленных задач раньше, чем исследователи предполагали. К концу проекта они расшифровали около 99,99 % ДНК, хотя ученые ставили перед собой задачу секвенировать только 95% данных. Сегодня, несмотря на успех проекта, остаются все еще неисследованные участки дезоксирибонуклеиновых кислот.

В итоге исследовательской работы было определено сколько генов в организме человека (около 20-25 тыс. генов в геноме), и все они охарактеризованы:

  • количество;
  • расположение;
  • структурно-функциональные особенности.

Геном человека — исследования, расшифровка

Расшифровка человеческого генома

Вывод

Все данные будут подробно изложены в генетической карте человеческого организма. Претворение в жизнь такого сложного научного проекта дало не только колоссальные теоретические знания для фундаментальных наук, но и оказало невероятное влияние на само понимание наследственности. Это в свою очередь, не могло не отразиться на процессах предупреждения и лечения наследственных болезней.

Данные, полученные учеными, помогли ускорить другие молекулярные исследования и способствовать эффективному поиску генетической основы в заболеваниях, передающихся по наследству, и предрасположенности к ним. Результаты смогут повлиять на обнаружение соответствующих лекарств для профилактики множества заболеваний: атеросклероза, сердечной ишемии, болезней психического и онкологического характера.

МОСКВА, 4 июл — РИА Новости, Анна Урманцева . У кого геном больше? Как известно, одни существа имеют более сложное строение, чем другие, а раз все записано в ДНК, то и это тоже должно быть отражено в ее коде. Получается, человек с его развитой речью обязан быть сложнее маленького круглого червяка. Однако если сравнить нас с червяком по количеству генов, получится примерно то же самое: 20 тысяч генов Caenorhabditis elegans против 20-25 тысяч Homo sapiens.

Еще более обидными для "венца земных созданий" и "царя природы" являются сравнения с рисом и кукурузой — 50 тысяч генов по отношению к человеческим 25.

Впрочем, может, мы не то считаем? Гены — это "коробочки", в которые упакованы нуклеотиды — "буквы" генома. Может, посчитать их? У человека 3,2 миллиарда пар нуклеотидов. А вот японский вороний глаз (Paris japonica) — красивое растение с белыми цветами — имеет в своем геноме 150 миллиардов пар оснований. Получается, что человек должен быть устроен в 50 раз проще какого-то цветка.

А двоякодышащая рыба протоптер (двоякодышащая — обладающая как жаберным, так и легочным дыханием), получается, в 40 раз сложнее, чем человек. Может, все рыбы почему-то сложнее, чем люди? Нет. Ядовитая рыба фугу, из которой японцы готовят деликатес, имеет геном в восемь раз меньше, чем у человека, и в 330 раз меньше, чем у двоякодышащей рыбы протоптер.
Остается посчитать хромосомы — но это еще сильнее запутывает картину. Как может человек по количеству хромосом быть равным ясеню, а шимпанзе — таракану?


С этими парадоксами эволюционные биологи и генетики столкнулись давным-давно. Они были вынуждены признать, что размер генома, в чем бы мы его ни пытались посчитать, поразительно не связан со сложностью устройства организмов. Этот парадокс назвали "загадкой значений С", где С — это количество ДНК в клетке (C-value paradoх, точный перевод — "парадокс величины генома"). И все-таки какие-то корреляции между видами и царствами существуют.

© Иллюстрация РИА Новости. А.Полянина


© Иллюстрация РИА Новости. А.Полянина

Ясно, например, что эукариоты (живые организмы, клетки которых содержат ядро) имеют в среднем геномы больше, чем прокариоты (живые организмы, клетки которых не содержат ядро). Позвоночные животные имеют в среднем геномы больше, чем беспозвоночные. Однако тут есть исключения, которые никто пока не смог объяснить.

Генетики расшифровали ДНК растения, способного пережить атомный взрыв Ученые впервые расшифровали полный геном гинкго – древнейшего современного растения на Земле, первые представители которого появились еще до рождения первых динозавров, во времена звероящеров.

Были предположения, что размер генома связан с продолжительностью жизненного цикла организма. Некоторые ученые утверждали на примере растений, что многолетние виды имеют более крупные геномы, чем однолетние, причем обычно с разницей в несколько раз. А самые маленькие геномы принадлежат растениям-эфемерам, которые проходят полный цикл от рождения до смерти в течение нескольких недель. Этот вопрос сейчас активно обсуждается в научных кругах.

Поясняет ведущий научный сотрудник Института общей генетики им. Н. И. Вавилова Российской академии наук, профессор Техасского агромеханического университета и Гёттингенского университета Константин Крутовский: "Размер генома не связан с продолжительностью жизненного цикла организма! Например, есть виды внутри одного рода, которые имеют одинаковый размер генома, но могут различаться по продолжительности жизни в десятки, если не сотни раз. В целом есть связь размера генома с эволюционной продвинутостью и сложностью организации, но со множеством исключений. В основном размер генома связан с плоидностью (копийностью) генома (причем полиплоиды встречаются и у растений, и у животных) и количеством высокоповторяющейся ДНК (простые и сложные повторы, транспозоны и другие мобильные элементы)".

Генетики "воскресили" кукурузу возрастом в пять тысяч лет Генетики смогли извлечь ДНК из древнейших останков "культурной" кукурузы и восстановить ее геном, указавший на более древние корни любимого растения Никиты Сергеевича Хрущева, чем мы считали раньше.

Есть также ученые, которые придерживаются другой точки зрения на этот вопрос.

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие «призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?

Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК - одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.

Немного молекулярной генетики

Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) - и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три - от мамы.

Наиболее изученный тип функциональных последовательностей ДНК - гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.

Померимся генами?

Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено?

Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас - 20−25 тысяч.

Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бóльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus , в 40 раз больше человеческого), так и с бóльшим количеством генов (у риса - 32−50 тысяч генов).

Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов - последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов - белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК - копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов - например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.

Тем не менее бóльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы - последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены - нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».

Минимальная мышь

Существует точка зрения, что бóльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК - наличие достаточно близких организмов с очень разными размерами геномов.

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?

На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30 000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.


специалист по эволюционной биологии и интегративной геномике, адъюнкт-профессор канадского Университета Гэльфа в провинции Онтарио:


«Луковый тест - хорошая проверка для любого, кто думает, что каждый нуклеотид в человеческом геноме имеет определенную функцию. Независимо от того, каковы эти предполагаемые функции, спросите себя: зачем обычному репчатому луку нужен геном примерно в пять раз больше вашего?»

Находка или мусор?

Вызов представлению о существовании мусорной ДНК бросил проект ENCODE - The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции - синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) - или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.

Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution , называется так: «О бессмертии телевизоров: «функция» в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron , что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American ) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.

По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов - «предпочтение находиться в 5"-конце генов» (5"-конец - это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома - занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», - отмечают оппоненты.

Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор - белок, инициирующий синтез информационной (матричной) РНК - связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.

Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.

Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе - репликации!», - снова шутит Граур.

Репликация

Репликация (от лат. replicatio - возобновление) - процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской. При следующем за этим делении каждая из дочерних клеток получает по одной копии молекулы ДНК, идентичной ДНК исходной материнской клетки. Репликацию ДНК осуществляет реплисома - сложный ферментный комплекс, состоящий из 15−20 различных белков.

Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!

Мусорная крепость

Но неужели остальные 90% генома человека - мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.

Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.

Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны - спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме - как от концепции, так и от самих ненужных последовательностей.