vak: (Default)
[personal profile] vak
Насмотрелись мы всяких ASCII и Unicode, табличками нас не удивишь. Но какая кодировка самая старая? Вы будете удивлены, но возникла она гораздо раньше, чем древние укры вышли из моря на сушу. Благодаря ей все мы живём на этой планете. Она перекодирует "буквы" наших генов в аминокислоты белковых молекул. Так выглядит таблица.



Как эта штука работает? Рассмотрим картинку.



"Буквы" нашей ДНК образованы парами аденинтимин (A-T) и гуанинцитозин (G-C). Каждая пара несёт два бита информации. Сначала ген считывается на промежуточную "перфоленту" - РНК. Такое считывание биологи называют транскрипцией. В процессе транскрипции тимин заменяется на урацил - видимо, для необратимости процесса.

Дальше перфолента (РНК) заряжается в рибосому - специальный станочек по производству белковых молекул. Буквы с РНК последовательно считываются, и для каждой буквы к создаваемому белку приклеивается следующая аминокислота. Это называется трансляцией. Буквы считываются группами по три штуки: биологи их называют кодонами. Три буквы по два бита - в сумме шесть бит - дают 64 комбинации. На выходе имеем 20 различных аминокислот. Кроме того, есть специальный стартовый кодон (AUG, превращающийся в метионин) и стоповые кодоны (три разных).

Отображение 64 кодонов в 20 аминокислот, плюс старт и три стопа - в этом вся суть "главной кодировки жизни". Если/когда мы обнаружим белковую жизнь в других мирах, с большой вероятностью кодировка окажется той же.

Вот та же таблица, но со ссылками на описания аминокислот.

1-е
основание
2-е основание3-е
основание
UCAG
UUUU(Phe) ФенилаланинUCU(Ser) СеринUAU(Tyr) ТирозинUGU(Cys) ЦистеинU
UUCUCCUACUGCC
UUA(Leu) ЛейцинUCAUAAСтопUGAСтопA
UUGUCGUAGСтопUGG(Trp) Триптофан    G
CCUUCCU(Pro) ПролинCAU(His) ГистидинCGU(Arg) АргининU
CUCCCCCACCGCC
CUACCACAA(Gln) ГлутаминCGAA
CUGCCGCAGCGGG
AAUU(Ile) ИзолейцинACU(Thr) Треонин        AAU(Asn) АспарагинAGU(Ser) СеринU
AUCACCAACAGCC
AUAACAAAA(Lys) ЛизинAGA(Arg) АргининA
AUG(Met) МетионинACGAAGAGGG
GGUU(Val) ВалинGCU(Ala) АланинGAU(Asp) Аспарагиновая кислотаGGU(Gly) ГлицинU
GUCGCCGACGGCC
GUAGCAGAA(Glu) Глутаминовая кислотаGGAA
GUGGCGGAGGGGG

Date: 2025-08-20 05:36 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Не так давно оказалось, что это упрощение. Эта кодировка -тоже, в сущности, юникод с диакритиками.
Стоп кодон - не всегда стоп кодон, см. селеноцистеин.

Date: 2025-08-20 16:39 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Я понимаю; я, собственно, чисто ради сравнения нуклеотидного кода и юникода с диакритиками. :)

Date: 2025-08-20 18:41 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Удивительно, что синонимия конкретно по третьему нуклеотиду,

Date: 2025-08-20 10:59 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Отлично!

Date: 2025-08-20 18:14 (UTC)
From: [personal profile] chabapok
ситуация на 12 лет назад с точки зрения написателя геномного ассемблера

https://www.youtube.com/watch?v=50bjIQ_ECQk

Date: 2025-08-21 09:55 (UTC)
From: [personal profile] chabapok
Без понятия, но наверное ж да. Раз что-то делали, наверное у них что-то вышло.

Я просто увидел пост - и вспомнил, что есть такая вот штука.