SCQ

Bioinformatica implică integrarea computerelor, instrumentelor software și bazelor de date într-un efort de a aborda întrebările biologice. Abordările bioinformatice sunt adesea utilizate pentru inițiative majore care generează seturi mari de date. Două activități importante la scară largă care utilizează Bioinformatica sunt genomica și proteomica. Genomica se referă la analiza genomilor. Un genom poate fi gândit ca setul complet de secvențe de ADN care codifică materialul ereditar care este transmis din generație în generație. Aceste secvențe de ADN includ toate genele (unitatea funcțională și fizică a eredității transmise de la părinte la descendenți) și transcrierile (copiile ARN care sunt pasul inițial în decodarea informațiilor genetice) incluse în genom. Astfel, genomica se referă la secvențierea și analiza tuturor acestor entități genomice, inclusiv gene și transcrieri, într-un organism. Proteomica, pe de altă parte, se referă la analiza setului complet de proteine sau proteom. În plus față de Genomică și proteomică, există mult mai multe domenii ale biologiei în care se aplică Bioinformatica (i.e., metabolomică, transcriptomică). Fiecare dintre aceste domenii importante în bioinformatică își propune să înțeleagă sistemele biologice complexe.

mulți oameni de știință se referă astăzi la următorul val în bioinformatică ca biologie a sistemelor, o abordare pentru a aborda întrebări biologice noi și complexe. Biologia sistemelor implică integrarea informațiilor genomice, proteomice și bioinformatice pentru a crea o viziune a întregului sistem asupra unei entități biologice.

wheel.gif

Figura 1. Roata înțelegerii biologice. Biologia sistemului se străduiește să înțeleagă toate aspectele unui organism și ale mediului său prin combinarea unei varietăți de domenii științifice.

de exemplu, modul în care funcționează o cale de semnalizare într-o celulă poate fi abordat prin biologia sistemelor. Genele implicate în cale, modul în care interacționează și modul în care modificările schimbă rezultatele în aval, toate pot fi modelate folosind biologia sistemelor. Orice sistem în care informațiile pot fi reprezentate digital oferă o aplicație potențială pentru bioinformatică. Astfel, Bioinformatica poate fi aplicată de la celule unice la ecosisteme întregi. Prin înțelegerea „listelor de părți” complete dintr-un genom, oamenii de știință câștigă o mai bună înțelegere a sistemelor biologice complexe. Înțelegerea interacțiunilor care apar între toate aceste părți într-un genom sau proteom reprezintă următorul nivel de complexitate din sistem. Prin aceste abordări, Bioinformatica are potențialul de a oferi perspective cheie în înțelegerea și modelarea modului în care se manifestă anumite boli umane sau stări sănătoase.

începutul bioinformaticii poate fi urmărit până la Margaret Dayhoff în 1968 și colecția ei de secvențe proteice cunoscute sub numele de atlasul secvenței și structurii proteinelor. Unul dintre primele experimente semnificative în bioinformatică a fost aplicarea unui program de căutare a similitudinii secvenței la identificarea originilor unei gene virale. În acest studiu, oamenii de știință au folosit unul dintre primele programe de calculator de căutare a similitudinii secvenței (numit FASTP), pentru a determina că conținutul v-sis, o secvență virală cauzatoare de cancer, a fost cel mai asemănător cu gena PDGF celulară bine caracterizată. Acest rezultat surprinzător a oferit informații mecaniciste importante pentru biologii care lucrează la modul în care această secvență virală provoacă cancer. De la această primă aplicare inițială a computerelor la biologie, domeniul bioinformaticii a explodat. Creșterea bioinformaticii este paralelă cu dezvoltarea tehnologiei de secvențiere a ADN-ului. În același mod în care dezvoltarea microscopului la sfârșitul anilor 1600 a revoluționat științele biologice, permițându-i lui Anton Van Leeuwenhoek să privească celulele pentru prima dată, tehnologia de secvențiere a ADN-ului a revoluționat domeniul bioinformaticii. Creșterea rapidă a bioinformaticii poate fi ilustrată prin creșterea secvențelor ADN conținute în depozitul public de secvențe de nucleotide numite GenBank.

computer.gif

Figura 2. Utilizarea computerelor pentru procesarea informațiilor biologice. Bogăția informațiilor de secvențiere a genomului a necesitat proiectarea software-ului și utilizarea computerelor pentru a procesa aceste informații.

proiectele de secvențiere a genomului au devenit flagship-urile multor inițiative bioinformatice. Proiectul de secvențiere a genomului uman este un exemplu al unui proiect de succes de secvențiere a genomului, dar multe alte genomi au fost, de asemenea, secvențiate și sunt secvențiate. De fapt, primele genomuri care au fost secvențiate au fost de viruși (adică., fagul MS2) și bacterii, genomul Haemophilus influenzae Rd fiind primul genom al unui organism viu liber care trebuie depus în băncile de date ale secvenței publice. Această realizare a fost primită cu mai puțină fanfară decât finalizarea genomului uman, dar devine clar că secvențierea altor genomi este un pas important pentru Bioinformatica de astăzi. Cu toate acestea, secvența genomului în sine are informații limitate. Pentru a interpreta informațiile genomice, trebuie făcută o analiză comparativă a secvențelor și un reactiv important pentru aceste analize sunt bazele de date de secvențe accesibile publicului. Fără bazele de date ale secvențelor (cum ar fi GenBank), în care biologii au capturat informații despre secvența lor de interes, o mare parte din informațiile bogate obținute din proiectele de secvențiere a genomului nu ar fi disponibile.

în același mod în care evoluțiile în microscopie au prefigurat descoperirile în biologia celulară, noile descoperiri în tehnologia informației și biologia moleculară prefigurează descoperirile în bioinformatică. De fapt, o parte importantă a domeniului bioinformaticii este dezvoltarea de noi tehnologii care permit științei bioinformaticii să se desfășoare într-un ritm foarte rapid. Pe partea computerului, internetul, noile dezvoltări de software, noi algoritmi și dezvoltarea tehnologiei cluster de calculatoare au permis bioinformaticii să facă salturi mari în ceea ce privește cantitatea de date care poate fi analizată eficient. Pe partea de laborator, noile tehnologii și metode, cum ar fi secvențierea ADN-ului, analiza serială a expresiei genelor (SAGE), microarrays și noile chimii de spectrometrie de masă s-au dezvoltat într-un ritm la fel de blister, permițând oamenilor de știință să producă date pentru analize într-un ritm incredibil. Bioinformatica oferă atât tehnologiile platformei care permit oamenilor de știință să se ocupe de cantitățile mari de date produse prin inițiative de Genomică și proteomică, cât și abordarea interpretării acestor date. În multe privințe, Bioinformatica oferă instrumentele pentru aplicarea metodei științifice la date la scară largă și ar trebui privită ca o abordare științifică pentru a pune multe tipuri noi și diferite de întrebări biologice.

data.gif

Figura 3. Tipuri potențiale de date bioinformatice. Bazele de date computerizate de informații biologice permit oamenilor de știință să genereze tot felul de date, de la generarea secvenței de proteine și prezicerea domeniilor proteice până la producerea chiar a structurilor 3D de proteine.

cuvântul bioinformatică a devenit un cuvânt „buzz” foarte popular în știință. Mulți oameni de știință consideră Bioinformatica interesantă, deoarece deține potențialul de a se arunca cu capul într-o lume cu totul nouă a teritoriului neexplorat. Bioinformatica este o nouă știință și un nou mod de gândire care ar putea duce la multe descoperiri biologice relevante. Deși tehnologia permite Bioinformatica, Bioinformatica este încă foarte mult despre biologie. Întrebările biologice conduc toate experimentele bioinformatice. Întrebările biologice importante pot fi abordate de bioinformatică și includ înțelegerea conexiunii genotip-fenotip pentru boala umană, înțelegerea structurii relațiilor funcționale pentru proteine și înțelegerea rețelelor biologice. Bioinformaticienii găsesc adesea că reactivii necesari pentru a răspunde la aceste întrebări biologice interesante nu există. Astfel, o mare parte a muncii unui bioinformatician este construirea de instrumente și tehnologii ca parte a procesului de a pune întrebarea. Pentru mulți, Bioinformatica este foarte populară, deoarece oamenii de știință își pot aplica atât biologia, cât și abilitățile informatice la dezvoltarea reactivilor pentru cercetarea bioinformatică. Mulți oameni de știință au descoperit că Bioinformatica este un nou teritoriu interesant de întrebări științifice, cu un mare potențial de a aduce beneficii sănătății umane și societății.

viitorul bioinformaticii este integrarea. De exemplu, integrarea unei mari varietăți de surse de date, cum ar fi datele clinice și genomice, ne va permite să folosim simptomele bolii pentru a prezice mutațiile genetice și invers. Integrarea datelor GIS, cum ar fi hărțile, sistemele meteorologice, cu datele privind sănătatea culturilor și genotipul, ne va permite să prezicem rezultatele reușite ale experimentelor agricole. Un alt domeniu viitor de cercetare în bioinformatică este genomica comparativă la scară largă. De exemplu, dezvoltarea de instrumente care pot face comparații pe 10 căi ale genomilor va împinge înainte rata de descoperire în acest domeniu al bioinformaticii. De-a lungul acestor linii, modelarea și vizualizarea rețelelor complete de sisteme complexe ar putea fi utilizate în viitor pentru a prezice modul în care sistemul (sau celula) reacționează, de exemplu, la un medicament. Un set tehnic de provocări se confruntă cu Bioinformatica și este abordat de computere mai rapide, progrese tehnologice în spațiul de stocare pe disc și lățime de bandă crescută, dar de departe unul dintre cele mai mari obstacole cu care se confruntă Bioinformatica astăzi, este numărul mic de cercetători în domeniu. Acest lucru se schimbă pe măsură ce Bioinformatica se deplasează în prim-planul cercetării, dar acest decalaj în expertiză a dus la lacune reale în cunoașterea bioinformaticii în comunitatea de cercetare. În cele din urmă, o întrebare cheie de cercetare pentru viitorul bioinformaticii va fi cum să comparăm computațional observațiile biologice complexe, cum ar fi modelele de expresie a genelor și rețelele de proteine. Bioinformatica este despre transformarea observațiilor biologice într-un model pe care un computer îl va înțelege. Aceasta este o sarcină foarte dificilă, deoarece biologia poate fi foarte complexă. Această problemă a modului de digitizare a datelor fenotipice, cum ar fi comportamentul, electrocardiogramele și sănătatea culturilor într-o formă lizibilă pe computer oferă provocări interesante pentru viitorii bioinformaticieni.

(acest articol se bazează pe un interviu cu Francis Ouellette, directorul Centrului de Bioinformatică UBC)



+