У высших организмов генетическая информация, содержится в хромосомах. Последние располагаются в клеточном ядре, которое отделено оболочкой от остального клеточного содержимого (цитоплазмы). В ядерной оболочке есть специальные поры, через которые вещества проникают из ядра в цитоплазму, где и используется хранящаяся в хромосомах генетическая информация.
У бактерий генетический материал не отделен от остальной клетки. У них просто нет ядра. Как мы увидим ниже, это приводит к некоторым особенностям в механизмах использования генетической информации. Подобные бактериям безъядерные организмы называются прокариотами, остальные — у которых генетическая информация хранится в клеточном ядре -эукариотами. Дезоксирибонуклеиновая кислота (ДНК) — это очень длинная молекула-макромолекула, образованная последовательным соединением фосфатных групп и молекул сахара, дезоксирибозы (рис. 2). К каждой молекуле дезоксирибозы присоединено азотистое основание. В ДНК встречается всего четыре вида оснований: два пуриновых (аденин-А, гуанин-G) и два пиримидиновых (тимин-Т, цитозин-С). Соединение фосфат-сахар-основание называется нуклеотидом. Поскольку в структуре макромолекулы ДНК сахарофосфатный остов уложен однообразно, вся генетическая информация может определяться только последовательностью оснований в цепи. Она, следовательно, записана простым четырехбуквенным алфавитом: А, Т, G и С.
Однако молекула ДНК образована не одной цепью, а двумя, закрученными одна вокруг другой в двойную спираль (рис. 2). Хотя внутри каждой из цепей нуклеотиды соединены прочными химическими связями (ко валентными), ассоциация двух цепей в единую спираль происходит за счет слабых водородных связей, которые легко разрываются уже при обычных для большинства живых организмов температурах. Эти слабые связи соединяют азотистые основания попарно, но только в следующих комбинациях: А с Т, G с С.
До 1975 г. определить последовательность оснований в ДНК было очень трудно, но к этому времени появилось два элегантных и быстрых метода, разработанных группами У. Гилберта из Гарварда и Ф. Сэнгера из Кембриджа. К концу 1983 г. общая длина про читанных последовательностей уже достигала 2 миллионов пар нуклеотидов. Все эти последовательности относятся к фрагментам ДНК из разных источников. «Рекорд протяженности» прочитанной последовательности из того, что уже опубликовано на данный момент, принадлежит группе Ф. Сэнгера, которая определила последовательность для бактериофага л длиной 48 502 нуклеотидные пары. Та же группа прочла, но еще не успела опубликовать последовательность вируса из семейства герпеса, вируса Эпштейна-Барр (примерно 140 000 н. п. !).
Модель двойной спирали для молекулы ДИК была предложена в 1953 г. Дж. Уотсоном И Ф. Криком на основе данных рентгеноструктурного анализа, полученных Р. Франклин и М. Уилкинсом. Модель позволяет понять, как же воспроизводится информация, записанная в каждой из цепей: фермент (ДНК-полимераза) раскрывает нуклеотидные пары, разделяет нити двойной спирали и затем присоединяет нуклеотиды к новой цепи, растущей вдоль каждой из старых. Присоединение происходит по правилу комплементарности: перед А фермент включает Т, перед Т — А, перед G — С, перед С — G. Исходные цепи двойной спирали, таким образом, копируются, давая начало двум идентичным двойным спиралям. Каждая из них предназначается одной из дочерних клеток, образующихся при делении. Именно так информация, хранящаяся в геноме, передается из одной клетки в другую в ходе последовательных циклов деления.