A látható különbség

Tudományos ismereteinket eddig főként könyvekben, enciklopédiákban és szakfolyóiratokban tároltuk. Napjaink biológusainak, orvosainak robbanásszerűen megszaporodott adattal kell elboldogulniuk ahhoz, hogy egységes rendszerben tudják kezelni a gének, fehérjék, hatóanyagok szerkezetét és funkcióját. E kényszerhelyzet megoldására született meg a bioinformatika, amely elsősorban naprakész adatbázisok hálózatával igyekszik hozzájárulni a hatalmas ismeretanyag értelmezéséhez. Az élettudományok új ágába Pongor Sándor, a trieszti székhelyű Nemzetközi Géntervezési és Biotechnológiai Központ bioinformatikai kutatásainak vezetője avatta be a Mindentudás Egyetemének hallgatóságát.

Mindentudás Egyeteme
2005. 11. 12. 0:00
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

Öt évvel ezelőtt készült el az ember örökletes anyagának első olvasata. Mára már több mint kétszáz egyéb szervezet – növények, állatok és mikroorganizmusok – genetikai információját is ismerjük. Adatokban tehát nincs hiány, a megfejtett „kódok” rendezésére, értelmezésére pedig ott a bioinformatika. Az új szakterület az informatikában és a biológiában, biotechnológiában jelentkező forradalmi fejlődésnek köszönheti megjelenését. A molekuláris biológia vagy a fehérjék szerkezetével foglalkozó tudományágak valójában meg sem születhettek volna számítástechnikai eszközök nélkül, mivel olyan bonyolult molekulákkal foglalkoznak, amelyek szerkezetét papíron, ceruzával, tollal lehetetlen felvázolni.
Vegyük szemügyre először a bioinformatikusok adatait! Például egy DNS-molekulának megjeleníthetjük az atomjait, a felszínét, vagy – tudva, hogy csupán négyféle bázis építi fel – egyszerűen leírhatjuk az építőelemek sorrendjét. Ez a betűsorozat a szekvencia, benne találhatók az öröklött információ, a genom adatai. A DNS működését elmagyarázó vonalas ábrák még ennél is egyszerűbbek: a láncszerű DNS-molekulának egyetlen vonal felel meg. Az örökletes információ egysége a gén, amely a lánc egy szakasza. Mikor a gén működésbe lép, a szakaszról egy másik láncszerű molekula másolódik: az RNS, amelyről aztán elkészül a kívánt fehérje. A gén tehát olyan, mint egy tervrajz, amelyet lemásolnak, s a műhelyben az alapján gyártják a terméket.

De mikor lépjen működésbe egy gén? Erről külön utasítások gondoskodnak. A gének elején egy jelzőszakasz igazít el abban, hogy mikor kell duplikálni a tervrajzot. A másolatban – vagyis az RNS-molekulán – lévő jelek pedig azt árulják el, hogy a tervnek mely részeire van szükség, és melyekre nem. Végül a fehérjék egy részén szintén található címzés: az megmondja, hogy a molekula hová menjen a sejten belül, illetve elhagyja-e azt. Az egész nem más, mint egy részletes utasításrendszer, amely az örökletes információban van kódolva. Vagyis egy gén nem csupán egy géntermék – egy fehérje – szerkezeti információit hordozza, hanem a működés feltételeit is.
Az információáramlásnak azonban ezzel nincs vége, a géntermékek maguk is további információcserében vesznek részt. Például a fehérjemolekulák megemésztésére képes emésztőenzim a reakcióhoz több ponton megköti „áldozatát”, és egy jól célzott kémiai reakció révén a hasítás már szobahőmérsékleten végbemegy. Ennek alapja az, hogy az – ugyancsak fehérjemolekulájú – enzimben kódolva van a kiszemelt fehérjepartner térbeli képe. Ha húslevest főzünk, csak magas hőmérsékleten tudjuk feldarabolni egy hús fehérjéit, és sok energiát kell elpazarolnunk. A fehérjék információt használnak energia helyett.
Egy sejten belül számtalan kölcsönhatás működhet, mivel a gének és a fehérjék egymást szabályozzák. Bonyolult hálózatról van szó: akad olyan gén, amely 50 másikat szabályoz. A szabályozás tipikusan úgy történik, hogy egy gén elkezd termelni egy fehérjét, az pedig beindít vagy leállít egy másik gént. A fehérjék tehát a gének utasításrendszerét olvassák olyan háromdimenziós kölcsönhatások alapján, mint amit az emésztőfehérjéknél láttunk. Ma még általában csak annyit tudunk, hogy két elem segíti vagy gátolja egymást, s csupán néhány esetben ismerjük a hatás nagyságát, illetve a háromdimenziós részleteket.
Egy szervezet genomját megismerve a sokféle kölcsönhatásból csak egy-egy szűkszavú leírást kapunk, az építőelemek sorrendjét, amely azonban olyan, mint egy nagyon hosszú, monoton szöveg. Gondoljuk el: az ember esetében hárommilliárd karaktert kellene elolvasnunk (ez a mennyiség durván másfél millió könyvoldalt tesz ki). Egyáltalán megérthetjük-e, hogy miről szól ez a szöveg? A helyzet leginkább egy ismeretlen nyelven és ismeretlen írással rótt sorok megfejtéséhez hasonlít. A perszepoliszi perzsa királyi feliratok ékírásos szövegét három egyszerű fogással fejtette meg a német Grotefend: feltételezte az írás alapvető ismérvét, azaz szerkezetét, észrevette és megpróbálta értelmezni a hasonló szavakat („királyok királya, nagy király, X király fia”), majd a neveket, és ezek kapcsolatából rájött, hogy kikről szól a felirat. Vagyis először felhasználta, hogy az írásnak van szerkezete. Ezt követően csoportosította a hasonló egységeket, és megpróbált következtetni a hozzájuk tartozó funkcióra (király, fiú stb.).
Korunk kutatói lényegében ugyanezeket a fogásokat vetik be, amikor számítógépekkel próbálják elolvasni a gének szövegét. Létezik ugyanis egy egyszerű írásmodell, a genetikai kód, amely szerint a DNS-ben három szomszédos építőelem kódol egy aminosavat. A modellt kiterjesztve csak olyan megfejtéseket fogadnak el, amelyek elején és végén megtalálhatók a szükséges további – például szabályozási – utasításjelek. Ezekből már sokkal kevesebb létezik, s ha azt is kikötjük, hogy a sorozatok megfelelő hosszúságúak legyenek, csupán néhány fehérjeszekvencia-jelölt marad.
Az egyszerű szervezetek – a prokarioták – génjei ezzel a módszerrel szinte teljes mértékben felderíthetők. A bonyolultabb – eukariota – szervezetek génjei azonban szakaszokból állnak, és azok kezdő-, illetve végpontjeleit külön-külön kell értelmezni. Mindezeket a jeleket valószínűségi alapon kombinálják össze, de a bonyolult állati és növényi szervezetek génszakaszainak meghatározása még így is problematikus. A fehérjeszekvenciákat csoportosítani eleve csak számítógépes módszerekkel tudjuk, mivel az emberi szem nehezen észleli a hosszú karaktersorozatok hasonlóságát.

Igen hatékonyak viszont a közelítő illesztés algoritmusai : a szekvenciákat, amelyekről semmit sem tudunk, a számítógép elkezdi páronként összevetni, és rögzíti, ha kettő hasonlít egymáshoz. Rengeteg hasonlóság jelenik meg egymás hegyén-hátán. Bizonyos csoportoknál ugyanakkor sűrűsödések figyelhetők meg: ezek tagjai jobban hasonlítanak egymásra, mint a többire.
Megtaláltuk tehát a hasonló szavakat, de kérdés, tudjuk-e, mit jelentenek. Ráadásul ahhoz, hogy a hasonlóságok hálózatából kiválogassuk az értelmes csoportokat, már jókora emberi munkára van szükség. Szakembereknek kell meghatározniuk, hogy az egyik csoport mondjuk az emésztőenzimeket, egy másik pedig a vérben lévő hemoglobinmolekulákat alkotja. Szerencsére ez az osztályozás már jó harminc–negyven éve folyik, és ma már körülbelül tízezer olyan csoportot ismerünk, amely többször is előfordul a természetben. Csakhogy ennek sokszorosa az olyan fehérje, amelyik csupán egyetlenegyszer szerepel.
A szekvenciák összehasonlításában a számítógépek voltak ügyesebbek, a térbeli alakok esetében azonban az ember: a fehérjék térbeli formáinak talán legjobb adatbázisát egy orosz kutató, Alekszej Murzin szabad szemmel osztályozza. Egyszerűen látja a különbségeket. A fehérjemolekulák vázát alkotó láncok ismétlődő egyenes és spirális szakaszai (vagyis a béta-szálak és alfa-hélixek) ugyanis jól elkülönülnek, és szembetűnnek az egyezések is. Érdemes tehát odafigyelni, hogy mi az, amit az ember jobban tud, mint a számítógép. Két köznapi tárgy hasonlóságát mi magunk is azonnal és csalhatatlanul észrevesszük, mert nemcsak a közös szerkezeti elemeket látjuk, hanem ismerjük a közös funkciót is: például egy váza formájának látványa mellett azt is tudjuk róla, hogy virágot tesznek bele. Azaz együttesen használunk szerkezeti és működési információt.
Vannak-e ilyen adataink? Igen, bár jóval nehezebben kezelhetők, mint a szekvenciák adatai. Térszerkezetből néhány ezret, funkcióból pedig néhány tízezret ismerünk. Ezek csoportosítását számítógépek végzik el, s különféleképpen rendezett adatbázisokat kapunk, ám azok azonos elemei a világháló technikájával összeköthetők. Egy rendezett információs hálózathoz jutunk, benne egy-egy csoport akkor is megfeleltethető egymásnak, ha nem minden tagjukról van meg minden információ. Egy feltételezett új fehérje többnyire csak egyetlen csoportra hasonlít, és ennek egyetlen szerkezet és egyetlen funkció felel meg. Ezek a biztos tippek. Léteznek azonban olyan fehérjék, amelyek kétféle csoportra is hasonlítanak. S akadnak reménytelen esetek: egy szekvencia többféle csoportra, többféle alakra és többféle funkcióra is hasonlít. Ilyenkor célszerű további információkat igénybe venni. Például a szakcikkek kulcsszavai is kiadnak egy rendezett adatbázist. Ha szerencsénk van, a kulcsszavak alapján kiderülhet, hogy az eddig vizsgált kétféle funkciónak köze lehet egymáshoz.
A bioinformatikában legalább száz nagyobb adatbázis információit kell összekötni. A naponta érkező sokezernyi új adatot úgy célszerű csoportosítani, hiperlinkekkel egymáshoz kapcsolni, hogy a felhasználók azonnal kérdezni tudják a rendszert. Az adatokat tehát nem elég csak tárolni, hanem intelligensen lekérdezhető formába kell hozni, hogy az egyszerű kutató is használhassa őket. Az első – és talán máig legjobb – rendszert az Egyesült Államokban hozták létre, ez mindenki számára hozzáférhető struktúra, amellyel például a gyakorló orvos megtalálhatja az őt érdeklő cikket, annak alapján egy betegségben érintett gént, netán a gyógyszer hatóanyagát. Mindehhez nem kell más, csak – orvosi vagy biológusi – szakértelem, internet és némi számítógépes gondolkodásmód. Az élettudományokban nem nagyon akad kutató, aki ne használná nap mint nap ezt a rendszert.
Mindent egybevéve elmondhatjuk, hogy az információs hálózatok segítségével sok igen fontos, általános felfedezés született, amelyek mára a biológia egész szemléletmódját megváltoztatták. Még ha a legtöbb részletet nem értjük is, de kezdjük látni az egyszerű és a bonyolult szervezetek közötti óriási különbségeket. Az egyszerű szervezetek génállománya úgy néz ki, mint ahogy azelőtt minden genomot elképzeltünk: a gének szépen sorban követik egymást. A bonyolult – eukariota – szervezetek génjei viszont már eleve összetettebbek: szakaszokból állnak, ezek szabályozásának jeleit csak részben ismerjük. A szakaszok egymástól messze helyezkedhetnek el, és a kimaradó részek szerepe sem ismert. Sokáig úgy gondoltuk, hogy egy génből csak egyféle fehérje lesz, de ma már tudjuk, hogy például az ember génjeinek több mint a fele sokféle fehérjét tud termelni, a szakaszok változatosan kombinálhatók. A természet ugyanis bennünket jóval megelőzve feltalálta a moduláris tervezést, és úgy tűnik, hogy a genetikailag örökletes betegségek nagy százalékában éppen ez a bonyolult masinéria hibásodik meg.

A már olvasható gének az emberi genomnak csak alig néhány százalékát teszik ki. A többi szekvencia nagyrészt fehér folt, funkcióját nem ismerjük. Azt is látjuk, hogy a bennük rejlő információt nem tudjuk elolvasni a genetikai kódhoz vagy a génszabályozás jeleihez hasonló logika szerint. Funkciójukról csak sejtéseink vannak. Az emberi géneket ugyanis viszonylag nehéz azonosítani, öt évvel az első emberi genomolvasat közzététele után is csak mintegy kétharmadukat azonosítottuk, míg egy baktérium génjei ma már néhány napi munkával biztonsággal felderíthetők.
A gének számát tekintve szintén érdekes különbségek adódnak egy-egy szervezet genomja között. Az embernek ugyan sokkal több génje van, mint egy baktériumnak, de alig több, mint a macskának vagy a kutyának, és jóval kevesebb, mint sok növénynek. Az is tény, hogy az emberi génekről sokkal többféle másolat készül, mint a baktériumokéiról. Vagyis a tervet sokrétűbben használjuk – s ezzel a jelentős különbséggel a rendszer lényegesen komplexebb lesz. Régen úgy kezeltük, hogy a gén–RNS–DNS viszony egyirányú utcához hasonlítható, ma inkább egymással sokféle kapcsolatban álló elemek hálózatáról beszélünk, amely az önszerveződés még alig ismert elveinek segítségével éri el a stabilitást. Úgy fogalmazhatunk, hogy a biológia központi felfogása változott meg. Rendszerbiológiáról egyfelől azért beszélhetünk, mert a sokféle adatunkat közös rendszerbe tudjuk szervezni, másrészt kísérleti módszereink is kezdenek alkalmassá válni arra, hogy például bizonyos sejtek összes génjének válaszait egyszerre, rendszerszinten tanulmányozhassuk a hálózati modellek alapján.
Hogyan alkalmazható mindez a gyakorlatban? Mi a teendő, ha például egy patogén baktérium vagy vírus ellen kívánunk hatóanyagot kifejleszteni? A mai stratégia szerint először a kórokozó génjeit kell megismernünk, majd összehasonlítanunk az ember génjeivel. Találunk olyan géneket, amelyek nagyon különböznek a mi génjeinktől. Ha ezeket, illetve az ezek által termelt fehérjéket meg tudjuk támadni egy hatóanyaggal, annak várhatóan nem lesz mellékhatása az emberre. Bizonyos vírusok – mint az influenza vagy a HIV – esetében azonosították azokat a fehérjéket, amelyek kulcsfontosságúak, és nem hasonlítanak az ember fehérjéire. Ezek ellen olyan hatóanyag tervezhető, amely nagyon erősen fog hozzájuk kötődni, így meggátolja működésüket, például megszakítja a vírus életciklusát. A tervezés során a kutatók az enzimfehérje és a potenciális gátlóanyagok térbeli modelljeit próbálják egymáshoz illeszteni számítógéppel és kiválasztani azokat, amelyek várhatóan a legerősebben kötődnek majd. Az ilyen alapon kifejlesztett hatóanyagok némelyike igen biztató sikertörténet még akkor is, ha hatásuk egyelőre nem százszázalékos!

A fenti szöveg a november 7-én elhangzott előadás rövidített változata. Megtekinthető 12-én (szombaton) 10.40-kor a Duna Televízió és 13-án (vasárnap) 10 órakor az MTV, valamint 14-én (hétfőn) 00.25-kor az M2 műsorán. A következő előadást 14-én 19.30-kor a Budapesti Műszaki és Gazdaságtudományi Egyetem Kozma László termében (Budapest XI., Magyar tudósok körútja 2.) Schaff Zsuzsa tartja A vírusok és a rák címmel. A részvétel ingyenes, az előadások teljes szövegét a hozzászólásokkal és a vitával együtt a www.mindentudas.hu weblapon találják meg az érdeklődők.

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Google News
A legfrissebb hírekért kövess minket az Magyar Nemzet Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.