Геном человека может содержать на 20% меньше генов

В новом исследовании показано, что до 20% генов, классифицированных как кодирующие гены (те, которые производят белки, и являются строительными блоками всех живых существ), возможно, не кодируются, поскольку они имеют характеристики некодирующих генов или псевдогенов. Работа, опубликованная в журнале Nucleic Acids Research, является результатом международного сотрудничества под руководством автора исследования Майкла Трэса (Michael Tress).

Сколько генов у человека?

Эта работа еще раз подчеркивает сомнения в отношении количества реальных генов, присутствующих в клетках человека через 15 лет после секвенирования генома человека. Последующее сокращение размера генома человека может иметь важные последствия в биомедицине, поскольку количество генов, продуцирующих белки, и их идентификация имеет жизненно важное значение для исследования множества заболеваний, включая рак, сердечно-сосудистые заболевания и т.д.

С момента завершения секвенирования генома человека в 2003 году специалисты со всего мира работали над составлением конечного протеома человека (общее количество белков, генерируемых генами), и генов, которые их производят. Эта задача огромна, учитывая сложность генома человека и тот факт, что у нас около 20 000 отдельных кодирующих генов.

Исследователи проанализировали гены, каталогизированные как кодирование белка в основных эталонных протеомах человека.

Результаты научной работы

При детальном сравнении эталонных протеомов из международного консорциума GENCODE / Ensembl, RefSeq и UniProtKB обнаружило 22 210 кодирующих генов, но только 19 446 из этих генов присутствовали во всех 3 аннотациях.

Когда они проанализировали 2764 гена, которые присутствовали только в одной или двух из этих эталонных аннотаций, они с удивлением обнаружили, что экспериментальные данные предполагают, что почти все эти гены, скорее всего, являются некодирующими генами или псевдогенами. Фактически, эти гены вместе с другими 1470 кодирующими генами, которые присутствуют в трех справочных каталогах, не эволюционировали, как типичные гены, кодирующие белок. Заключение исследования состоит в том, что большинство из этих 4234 генов, вероятно, не кодируют белки.

По словам ученых, исследование уже оправдывает себя.

«Мы смогли подробно проанализировать многие из этих генов, и более 300 генов уже были реклассифицированы как некодирующие» – объясняет Тресс.

Результаты уже включены в новые аннотации генома человека международным консорциумом GENCODE, частью которого являются исследователи CNIO.

Эта работа еще раз подчеркивает сомнения в отношении количества реальных генов, присутствующих в клетках человека через 15 лет после секвенирования генома человека. Хотя самые последние данные показывают, что количество генов, кодирующих человеческие белки, может превышать 20000, Федерико Абаскаль (Federico Abascal, of the Wellcome Trust Sanger Institute in the United Kingdom), автор исследования, из  Института Велком Траст Сэнгер (Wellcome Trust Sanger Institute) в Соединенном Королевстве утверждает: «Наши данные свидетельствуют о том, что у людей может быть только 19 000 кодирующих генов, но мы до сих пор подробно не знаем о них».

«Удивительно, что некоторые из этих необычных генов были хорошо изучены и имеют более 100 научных публикаций, основанных на предположении, что ген продуцирует белок».

Выводы

Это исследование показывает, что все еще существует большая неопределенность, поскольку конечное количество кодирующих генов может  быть на 2000 больше или 2000 меньше, чем сейчас. Человеческий протеом все еще требуется дополнительно исследовать, особенно учитывая его важность для медицинского сообщества.

Авторы другого исследования выявили связь между геном MC1R и раком кожи, независящим от воздействия солнца.