Videotár Rejtélyes DVD Kiváltságos DVD Rólunk Linkajánló
Kapcsolat:

Adatábrázolás a természetben (a DNS-lánc)

Fóti Marcell informatikus telitalálatos írása.

Ezt a cikket vagy 8 éve követtem el, még a (megboldogult) BYTE magazin hasábjain, de most egy baráti kérdés kapcsán újra felmerült, hát idepasztázom. Egyébként ez a kérdés régóta foglalkoztat.

Domain Naming System? Nem, ezúttal dezoxiribo-nukleinsav.

Amerikai tudósok feltérképezték az emberi DNS-t, az elejétől a végéig, a fejétől a farkáig. Joggal kérdezhetitek, hogy mit keres a szerves kémia és a mikrobiológia e tényleg csodálatra méltó tudományos eredménye a mi informatikai „boncasztalunkon”?

Azért, mert informatikai vonatkozású a felfedezés. Arról ugyanis nincs szó, hogy bárki értelmezni tudná az emberi DNS tartalmát: a hír mögött összesen annyi áll, hogy sikeresen, ám gépiesen és bután lekörmölték egy (1) emberi sejt örökítő anyagának 12 gigabitnyi információját. Ám az értelmezés még hátravan. Megtalálták az emberi faj rosette-i kövét , amelyet tökéletesen le is másoltak, ám attól az még értelmezhetetlen hieroglifakupac maradt. A tudóscsoport vezetője be is vallotta: most jön a neheze. Ő mintegy 20 évnyi munkát becsült, amely arra kell, hogy meg is fejtsék a titkosírást. Megjegyzem: a lemásoláshoz 5 év, nemzetközi összefogás, és néhány milliárd dollár kellett az emberiség részéről, míg ugyanezt az infót egy egysejtű 80 másodperc alatt képes bitről bitre lekopizni – teljesen egyedül és ingyen. Ami pedig az értelmezést illeti: 20 év munkája (plusz nemzetközi összefogás, plusz néhány milliárd dollár) kell ahhoz, hogy megértsük azt, amit egy élő sejt simán olvas?

Mert mi is történik az egyedfejlődés során? Ahogy a sejtek sokasodnak a megszületendő magzatban, mindegyik megkapja a közös tudás egy példányát, a DNS-t, és mindegyik sejt kiolvassa belőle pontosan azt a szakaszt, ami rá vonatkozik: tüdőgümő legyen belőle, vagy nyálkahártya? Vagyis mindegyik sejt rendelkezik egy adathordozóval (ez a DNS) és egy olvasó-berendezéssel, amely kiolvassa az adott sejt felépítésére vonatkozó fejezetet. Olyan, mint egy lyukkártya, meg egy olvasó. A DNS információtartalma az evolúció során igencsak megváltozott (tehát a kód írható, jobban mondva íródik), a legelső DNS kialakulásáról azonban sejtelmünk sincs.

DNS-kódolás

Még olyan bonyolult képleteket is, mint amely magát az embert definiálja, le tudunk írni egyesek és nullák sorozatával, vagyis binárisan, s máris kiválóan olvassák számítógépeink. Ha ugyanezt az információtömeget „emberi fogyasztásra alkalmas” formában szeretnénk tárolni, valamilyen ABC-t, egy 32 különböző jelből álló kódrendszert használnánk. Ha már itt tartunk, idézzük fel, hogyan is működnek a tömörítőprogramok? Mi a tömörítés alapja? Az, hogy a tárolandó adathoz optimális kódrendszert rendelve csökkentjük a tároláshoz szükséges helyet.

Vajon a DNS információja tömöríthető-e? Vagy optimális a kódolása? Vizsgáljuk meg a DNS kódolását közelebbről!

Én húszféle aminosavból állok. Ön is. Minden élőlény minden sejtjének minden fehérjéje ugyanabból a húsz aminosavból épül fel, Alanintól Valinig. Elvileg tehát egy húszbetűs (valójában 21, mert egy STOP jel is kell, mely jelzi, hogy hol ér véget egy mondat) ábécére van szükségünk, vagyis összesen 21 különböző jelet kell ábrázolnunk egy bájton. Mit csinálna a WinZIP, ha csak 21 különböző bájt lenne egy tömörítendő fájlban? Eldobná a 8 bites bájtot, és helyette 5 biteset választana, hisz ennyi elegendő, sőt sok is a feladatra (2^5=32). Tekintve, hogy a DNS kettős spiráljában úgynevezett komplementer írásmódot „használunk”, hogy ha sejtosztódáskor széttekeredik, mindkét fele tökéletesen kiegészülhessen a párjával, csak páros számú „betűnk” lehet.

Az 5 bites kódolás 32 különböző lehetőséget jelent, ami elegendő lenne 21 jel tárolásához, de már némi hibadetektáló kód, például paritás képzéséhez kevés. Pedig jó lenne, ha a másolási hibák „kibuknának” még mielőtt háromfejű egyfogú szárnyas óriásgiliszták lepnék el a földet.

A DNS valóban tartalmaz hibadetektáló kódot is, így 5 helyett 6 bit kellene, s máris 20%-kal megnöveltük a jelek, s így a DNS-lánc hosszát, ami már nem fér be a sejtbe, átfúrja a sejtfalat. Hát éppen emiatt mondott le a Teremtő a bináris kódolásról, és használ helyette kvaternáris kódot (négyes számrendszer), ahol 1 „bit”, nem két értéket vehet fel, hanem négyet, és ezzel éppúgy 4^3=64 féle „szót”, azaz esetet tárolhatunk, mint 2^6-nál. A DNS-spirál hossza ezzel éppen feleakkora, mint az előbb (6 helyett 3 darb négyes számrendszerbeli „bit”), és így már simán elfér a sejtben. Hát nem zseniális? Kicsit nehéz fejben számolni a kvaternáris kóddal, de csak azért, mert rég voltunk már másodikosok – az általános iskolások viszont kiválóan tudnak bánni vele.

Komplementer írás

A komplementer írás lényege, hogy az ABC mindegyik betűjéhez testvért választunk, akivel kézen fogva jár. Ha az ABC-nk a következő betűket tartalmazza: EKLMNOPT, akkor mindegyikhez „testvért” kell rendelni, valahogy így:
E párja N; K párja O; L párja P; M párja T, s ha ezután leírunk valamit, akkor azonnal aláírjuk a komplemensét is:
• KOMPLEMENT: mondandó, a DNS-spirál főszárára írva
• OKTLPNTNEM: komplemens, a DNS-létra másik szárára írva
A komplementer írás belátható módon csak páros számú jel esetén működik, mert ha páratlan lenne – akkor páratlan lenne. Nem, ez nem palindrom, hanem komplementer. Na jó, itt egy palindrom is, bár semmi köze a DNS-hez:

Rám német nem lel elmentem én már

Miért legjobb a négyes számrendszer?

A kettes számrendszer túl hosszú DNS spirált adna. Belátható, hogy valójában ez a kódolás az elemi bitek „lebutítása”, két értékessé zsugorítása miatt a létező kódolások közül a leghosszabb „betűket” adja. Akkor a PC-k miért így működnek? Azért, mert a négy aritmetikai alapműveletet csak ebben a számrendszerben lehet megvalósítani 1-2 tranzisztorral (ÉS-kapuk és VAGY-kapuk felhasználásával).

A hármas és ötös számrendszer kiesik, mert azokkal páratlan számú „betű” állítható elő, amellyel nem lehet komplementáris kódolást alkotni, amely viszont a DNS osztódási módja miatt nélkülözhetetlen.

A négyes számrendszer a bitek felokosításával, vagyis, hogy 1 bit már nem csak kettő, hanem négy (0,1,2 és 3) értéket vehet fel jelentősen rövidebb jelsorozattal írhatja le ugyanazt, amit a bináris. Gondoljunk csak arra, hogy egyedül szegény számítógép kínlódik a bináris kóddal, míg például ha kinyomtatunk egy kódot, már négyes (BCD), nyolcas (oktális) vagy tizenhatos (hexadecimális) kódolást használunk, mert például a hexa éppen negyedannyi papírt fogyaszt, mint a bináris, s ráadásul sokkal szemléletesebb a
02A9 F905 6A9C
mint a
00101010 1001111 1100100 0001010 1101010 10011100

A hatos számrendszer pedig azért nem jó, mert bár páros, a „bitek” számának növelésével túl nagy lépésekben nő a lehetséges „betűk” száma: 6 után 36, majd 378. A 36 kevés, mert nincs hely hibadetektáló kódra, a 378 meg irdatlanul sok. A nyolcas számrendszerrel nem kalkulált a Teremtő.

Információsűrűség

Ma már mindenkinek lehetősége lenne arra, hogy egy DVD-n, vagy a modernebbek egy pendrájvon a zsebében hordja a saját genetikai kódját. Ennek ugyan nem lenne semmi értelme, hisz minden egyes sejtünkben ott van ez az információ, a DNS-spirál nevű adathordozóra írva összesen 6 x 10^10 négyes számrendszerű „bit”. Könnyen kiszámolható, hogy ez másfél gigabájtnak felel meg. Minden egyes mikroszkóp alatt alig kivehető sejtben egy fél DVD anyaga! A sejtben lévő DNS-spirál pedig oly kicsiny, hogy az elektronmikroszkóp is zavarba jön tőle! Azt hiszem, van még mit tanulni a természettől az információtárolásban, hisz a DVD trilliószor akkora tárgy, mint a DNS kettős spirálja…

Honnan jöttünk?

Vegyük észre, hogy nem maga a DNS kettős spirálja a csoda, hanem az általa leírt információ. DNS-spirálban kódolva vagy kinyomtatva, esetleg DVD-re írva az információ ugyanazt jelenti: az éti csiga testi felépítését. Annyira zseniális, hogy az emberben önkéntelenül felmerül a kérdés: az ősleves vajon mennyi idő alatt főz ki egy ilyen komplett rendszert merő véletlenségből?

Az Egyesült Államokban egyetemistákkal (tehát még nyitott agyú emberkékkel) végeztek egy kísérletet: tárgyak fényképét mutatták nekik, és el kellett dönteniük, hogy létrejöhet-e a képződmény véletlen útján. Kezdetben egyszerű tárgyak szerepeltek, mint kavics (igen, létrejöhet), tégla (nem, azt ember alkotja), patak (igen), szfinx a sivatagban (nem), a hold fotója (igen), egy autó (nem, ilyen véletlen nincs), egy ember (hopp, néhány másodperces töprengés, majd: IGEN!). Na de kérdem én, ha egy papucsállatka egymilliószor bonyolultabb „gép”, mint a laptopom, és tizenhatmilliótrilliószor bonyolultabb, mint egy tégla, akkor miért nincs arra példa, hogy X millió év alatt természetes úton előálljon egy tégla, s néhány milliárd év alatt egy laptop? Miért nem képes a sivatagi szél szfinxet faragni? A papucsállatka a maga primitívségében borzasztóan tökéletes. Gépek vagyunk, kémiai miniüzemek, amelyek egy lyukszalag, a DNS feldolgozására képesek. Ám lyuxalagot írni nem tudnak gépeink, csak olvasóval vagyunk felszerelve. Az élet alapja, a DNS tervezési okokból read only számunkra. Nekünk nincs írási jogunk, nehogy eltoljunk valamit. Majd talán húsz év múlva meghackelik a tudósok de addig csak gondolkozzunk:

Ki írta a kódot?

Az információ véletlen születéséről ismerős lehet az a gondolatkísérlet, hogy ha leültetünk egy majmot egy írógép elé, és az elkezd véletlenszerűen klimpírozni a billentyűkön, akkor vajon mennyi idő szükségeltetik ahhoz, hogy megírja Tom Sawyer kalandjait. Elvileg előbb-utóbb megírja eredetiben, majd újabb néhány milliárd év múlva magyarul is. Tehát a DNS elvileg véletlenül is keletkezhetett. De van itt egy bökkenő: a majom klimpírozását egy intelligencia dolgozza fel, és dönti el, hogy most éppen zagyvaságot gépel, vagy – merő véletlenségből – éppen nem. Tehát azáltal válik az információ információvá, hogy valaki számára jelent a jelsorozat valamit. Minden egyes sejt számára természetesen jelent valamit a DNS, hisz ez alapján építkezik, tehát megvan a „célszemély”, aki eldönti, hogy infó-e az infó. A sejt DNS-olvasója is keletkezhetett véletlenül. De annak a valószínűsége, hogy a 12 gigabites lyuxalag (DNS) és az ezt hibátlanul olvasó kémiai gép egyszerre véletlenül létrejön, kerek nulla.

Ha valóban a véletlen művei vagyunk, akkor az egyiknek milliárd évekkel előbb létre kellett jönnie, mint a másiknak.

Ennek menete hasonló lenne a következőhöz: képzeljük el Joseph-Marie Jacquard urat, amint éppen a lyukszalagos kötőgép feltalálásának felénél tart, bambán álldogál a műhely közepén kezében egy Budmil póló elkészítését vezérlő lyukszalaggal, és halvány fogalma sincs arról, hogy mire való, mert az olvasó feltalálásánál még nem tart, ergo számára is ismeretlen az általa készített szalag tartalma. Vagy fordítva: éppen tűreszelővel reszeli a mechanikus olvasót, mely majd a kötőgép fejét fogja vezérelni, de még nem tudja, hogy mire lesz jó, mert az egész gép működése, s a szalag kódrendszere még nem állt össze a fejében. Ugye badarság?

(…)

Forrás: fotimarcell.netacademia.net

Darwinizmus és intelligens tervezettség Az élet rejtélyének megfejtése A Kiváltságos Bolygó Az intelligens válasz