Запись генетической информации

Исходя из теории кибернетики, любая система управления основана на трех факторах: хранении информации, ее передаче и переработке. Мы уже описали открытие генетической информации, контролирующей все процессы жизнедеятельности клетки и функционирования организма в целом. Все сведения записаны в химической структуре ДНК с помощью четырех оснований: двух пуриновых - аденина и гуанина - и двух пиримидиновых - тимина и цитозина. Каким же образом при наличии всего четырех разных оснований проявляется наследственная специфичность всех органических форм? Как генетическая информация определяет признаки и свойства организмов?

В учении о наследственности ведущее место занимает взаимоотношение нуклеиновых кислот и белков. Различие между биологическими полимерами - белками - состоит только в порядке расположения аминокислот. Чередование 20 аминокислот у белков контролируется четырьмя нуклеотидами. Перевод информации с языка нуклеотидов на язык аминокислот синтезируемого белка осуществляется с помощью генетического кода.

Упоминание о коде в биологической литературе появилось в 1954 г. Хотя, справедливости ради, необходимо отметить, что еще в 1927 г. Кольцов вплотную подошел к идее о коде при рассмотрении механизма передачи генетических свойств. В 1947 г. немецкий ученый Э. Шредингер структуру хромосомных нитей назвал шифровальным кодом. И все же биологи еще не были готовы к восприятию нового представления записи наследственности.

К началу 50-х годов прочно утвердилось мнение, что ДНК построена из четырех типов нуклеотидов, а белок - из 20 аминокислот. 1953 г. ознаменовался величайшим событием - открытием Уотсоном и Криком модели строения ДНК Первые представления о сущности генетического кода носили умозрительный характер. Работами Уотсона и Крика заинтересовался американский физик и астроном русского происхождения Г. Гамов. Он просит авторов модели структуры молекулы ДНК сообщить список 20 аминокислот, из которых строятся сложные белковые молекулы. После некоторых логических построений Гамов выдвигает гипотезу генетического кода и детально ее разрабатывает. Подобно тому как в азбуке Морзе при помощи трех знаков - точки, тире и интервала - можно передавать самые разнообразные человеческие мысли, различные сочетания четырех оснований способны передавать любую, самую тонкую наследственную информацию.

Гамов выдвинул следующие три положения кода: он должен быть триплетным, вырожденным и перекрывающимся. Природа создала четырехбуквенный алфавит нуклеотидов, и из него строятся 20 слов. Нужно решить, сколько букв в каждом слове. Сочетание двух нуклеотидов может дать всего 16 (42) слов. Простой расчет показывает, что из трех оснований возможно создание 64 различных комбинаций (43 = 64). Этого числа даже более чем достаточно для кодирования 20 аминокислот любых белков. Итак, одно слово - три основания. Такое сочетание названо триплетным кодом.

Поскольку всех аминокислот 20, Гамов считал, что должно быть всего 20 кодовых слов. Одна кислота определяется одним словом. Это и есть невырожденность. Размер аминокислоты в цепочке белка почти совпадает с размером основания в цепочке РНК. Отсюда можно заключить, что против каждой аминокислоты помещается одно азотистое основание. Каждое кодовое слово состоит из трех оснований, поэтому Гамов сделал вывод о частичном перекрывании соседних кодирующих слов. Иначе говоря, в соседних тройках два основания получаются общими. Значит, код является перекрывающимся. Например, если мы подберем такие слова из трех букв, как «акт», «кто», «ток», «око», то заметим, что они имеют «перекрывающие» буквы. По-видимому, аминокислоты должны кодироваться подобными словами.

Гипотеза Гамова вызвала интерес не только у биологов, но и у математиков, физиков-теоретиков. Вскоре было доказано, что два предположения из трех не выдержали проверки - такой код неверен. В случае существования перекрываемых триплетов для аминокислот должны быть разрешенные и запрещенные соседства, они не могут стоять в белках как попало.

Чтобы расшифровать код, необходимо взять несколько белков и выяснить, какие аминокислоты встречаются рядом, а какие никогда рядом не стоят, - установить принцип расположения аминокислот. В 1954 г. американский биохимик Ф. Сенджер предложил способ определения порядка аминокислот в белках, и во многих лабораториях приступили анализировать последние. Определив порядок чередования аминокислот в первом белке - инсулине, ученые сразу же пришли к выводу о невозможности закодировать имеющуюся в нем последовательность перекрывающимся кодом.

Другой довод против перекрывания триплетов был получен в результате изучения изменений молекулы гемоглобина. Исходя из принципа перекрывания, следует, что каждое основание участвует в кодировании трех соседних аминокислот, поэтому при изменении даже только одного нуклеотида в молекуле белка должны произойти изменения трех аминокислот. В действительности же были выявлены нарушения гемоглобина человека, связанные лишь с одной аминокислотой.

Итак, Гамов оказался неправ, и все-таки его работа стимулировала ученых к проведению широких исследований закономерностей кодирования аминокислот в белке. В начале 60-х годов в результате больших усилий генетиков, физиков, химиков и математиков разных стран мира была решена эта сложнейшая проблема. Здесь наиболее значительны генетические работы Крика с сотрудниками в Англии и биохимические исследования М. Ниренберга, С. Очоа и А. Корнберга в США.

В 1961 г. Ниренберг и Р. Маттей впервые в бесклеточной системе, содержащей рибосомы, аминокислоту и и-РНК, в которую входил только урацил (полиуридиловая кислота), провели синтез белка полифенилаланина. Были получены прямые экспериментальные доказательства триплетности генетического кода и прочтена его первая буква. Включением в полипептидную цепочку аминокислоты фенилаланин кодирует триплет урацила (УУУ). Дальнейшие опыты с добавлением в бесклеточную систему различных синтетических РНК дали возможность расшифровать состав нуклеотидных триплетов для всех 20 аминокислот.

При установлении триплетов для всех аминокислот оказалось, что большинство из них кодируется не одним, а двумя, тремя и даже четырьмя различными триплетами. Например, метионин кодируется одним (АУГ), лейцин - двумя (УУА и УУГ), изолейцин - тремя (АУУ, АУЦ и АУА), валин - четырьмя (ГУУ, ГУЦ, ГАЦ и ГУГ) триплетами. Проведенные эксперименты позволили прийти к заключению о вырожденности кода. Это значит, что включение в белковую молекулу одной аминокислоты контролируется несколькими триплетами оснований. Наличие 64 кодонов на 20 аминокислот дает возможность предположить, что встречаются и «бессмысленные» триплеты, которые не кодируют ни одну из аминокислот. Такое положение было подтверждено экспериментально. Так, для триплетов УАГ, УАА и УГА было показано, что они передают информацию «стоп-сигнал» - и обрывают синтез белковой молекулы у бактерий.

Было доказано, что код является неперекрывающимся. Один и тот же нуклеотид не может одновременно входить в состав двух соседних триплетов. Это было убедительно установлено экспериментально. Чтение кода начинается с определенного пункта и продолжается только в одном направлении. Триплеты ничем не разделены. Код не имеет разделительных знаков, он считывается без запятых.

Выпадение или вставка какого-либо нуклеотида в молекуле ДНК изменяет состав и последовательность чередования нуклеотидов во всей их цепи. В случае выпадения одного из нуклеотидов при считывании его место занимает ближайший нуклеотид из соседнего кодона и поэтому изменяется весь порядок считывания.

Важнейшая особенность генетического кода - его полная универсальность. Он един для всех типов организмов. Диалогичность кода свидетельствует о довольно раннем возникновении его в истории жизни на Земле и унаследование его наиболее сложно устроенными организмами от далеких предков.