SCQ

Bioinformatiikkaan kuuluu tietokoneiden, ohjelmistotyökalujen ja tietokantojen integrointi biologisten kysymysten ratkaisemiseksi. Bioinformatiikan lähestymistapoja käytetään usein suurissa aloitteissa, jotka tuottavat suuria tietokokonaisuuksia. Kaksi tärkeää bioinformatiikkaa hyödyntävää laajamittaista toimintaa ovat genomiikka ja proteomiikka. Genomiikka viittaa genomien analyysiin. Genomin voidaan ajatella olevan täydellinen joukko DNA-sekvenssejä, jotka koodaavat perinnöllistä materiaalia, joka siirtyy sukupolvelta toiselle. Nämä DNA-sekvenssit sisältävät kaikki geenit (toiminnallinen ja fyysinen perinnöllisyyden yksikkö siirretään vanhemmalta jälkeläiselle) ja transkriptit (RNA kopiot, jotka ovat ensimmäinen askel dekoodaus geneettisen informaation) sisältyvät genomin. Genomiikka tarkoittaa siis kaikkien näiden genomisten entiteettien, myös geenien ja transkriptien, sekvensointia ja analysointia eliössä. Proteomiikka taas tarkoittaa kokonaisen valkuaisainejoukon eli proteomin analysointia. Genomiikan ja proteomiikan lisäksi on monia muitakin biologian aloja, joilla sovelletaan bioinformatiikkaa (i.e., metabolomiikka, transkriptomiikka). Jokainen näistä bioinformatiikan tärkeistä osa-alueista pyrkii ymmärtämään monimutkaisia biologisia järjestelmiä.

monet tiedemiehet kutsuvat nykyään bioinformatiikan seuraavaa aaltoa systeemibiologiaksi, lähestymistavaksi uusien ja monimutkaisten biologisten kysymysten ratkaisemiseksi. Systeemibiologiassa on kyse genomiikan, proteomiikan ja bioinformatiikan informaation integroinnista, jotta voidaan luoda kokonainen systeeminäkymä biologisesta kokonaisuudesta.

wheel.gif

Kuva 1. Biologisen ymmärryksen pyörä. Systeemibiologia pyrkii ymmärtämään eliön ja sen ympäristön kaikkia näkökohtia eri tieteenalojen yhdistämisen kautta.

esimerkiksi sitä, miten signalointireitti toimii solussa, voidaan käsitellä systeemibiologian avulla. Reitissä mukana olevat geenit, miten ne vuorovaikuttavat ja miten modifikaatiot muuttavat loppupään tuloksia, voidaan mallintaa systeemibiologian avulla. Mikä tahansa järjestelmä, jossa tieto voidaan esittää digitaalisesti, tarjoaa mahdollisen bioinformatiikan sovelluksen. Näin bioinformatiikkaa voidaan soveltaa yksittäisistä soluista kokonaisiin ekosysteemeihin. Ymmärtämällä perimän täydelliset ”osaluettelot” tiedemiehet ovat saamassa paremman käsityksen monimutkaisista biologisista järjestelmistä. Ymmärtäminen vuorovaikutukset, jotka tapahtuvat kaikkien näiden osien genomin tai proteomi edustaa seuraava taso monimutkaisuus järjestelmässä. Näiden lähestymistapojen avulla bioinformatiikka voi tarjota avaintietoja siitä, miten ymmärrämme ja mallinnamme, miten tietyt ihmisen sairaudet tai terveet tilat ilmenevät.

bioinformatiikan alku voidaan jäljittää Margaret Dayhoffiin vuonna 1968 ja hänen proteiinisekvenssien kokoelmaansa, joka tunnetaan nimellä ”The Atlas of Protein Sequence and Structure”. Yksi varhaisista merkittävistä bioinformatiikan kokeista oli sekvenssien samankaltaisuuden etsintäohjelman soveltaminen viruksen geenin alkuperän tunnistamiseen. Tässä tutkimuksessa tutkijat käyttivät yhtä ensimmäisistä sekvenssin samankaltaisuutta tutkivista tietokoneohjelmista (nimeltään FASTP) selvittääkseen, että syöpää aiheuttavan virusjakson V-sis: n sisältö muistutti eniten hyvin tunnettua solukkoa pdgf-geeniä. Tämä yllättävä tulos tarjosi tärkeitä mekanistinen oivalluksia biologit työskentelevät miten tämä virus sekvenssi aiheuttaa syöpää. Tästä tietokoneiden ensimmäisestä biologian soveltamisesta lähtien bioinformatiikan ala on räjähtänyt. Bioinformatiikan kasvu on samansuuntainen DNA: n sekvensointiteknologian kehityksen kanssa. Samalla tavalla kuin mikroskoopin kehitys 1600-luvun lopulla mullisti Biologiset tieteet sallimalla Anton Van Leeuwenhoekin tutkia soluja ensimmäistä kertaa, DNA: n sekvensointitekniikka on mullistanut bioinformatiikan alan. Bioinformatiikan nopeaa kasvua voidaan havainnollistaa genbank-nimisessä nukleotidisekvenssien julkisessa säilytyspaikassa olevien DNA-sekvenssien kasvulla.

computer.gif

kuva 2. Tietokoneiden käyttö biologisten tietojen käsittelyyn. Genomisekvenssitiedon runsaus on vaatinut ohjelmistojen suunnittelua ja tietokoneiden käyttöä tämän tiedon käsittelyyn.

Genomisekvenssihankkeista on tullut monien bioinformatiikan aloitteiden lippulaiva. Human genome sequencing project on esimerkki onnistuneesta genomin sekvensointihankkeesta, mutta myös monia muita genomeja on sekvensoitu ja sekvensoidaan parhaillaan. Itse asiassa ensimmäiset sekvensoitavat genomit olivat viruksia (ts., phage MS2) ja bakteerit, joissa Haemophilus influenzae Rd: N genomi on ensimmäinen vapaan elävän organismin genomi, joka talletetaan julkisen sekvenssin tietopankkiin. Tämä saavutus otettiin vastaan vähemmällä fanfaarilla kuin ihmisen genomin valmistuminen, mutta on käymässä selväksi, että muiden genomien sekvensointi on tärkeä askel bioinformatiikan kannalta nykyään. Genomisekvenssistä itsessään on kuitenkin niukasti tietoa. Genomitiedon tulkitsemiseksi on tehtävä sekvenssien vertaileva analyysi ja tärkeä reagenssi näille analyyseille ovat julkisesti saatavilla olevat sekvenssitietokannat. Ilman sekvenssien tietokantoja (kuten GenBank), joihin biologit ovat napanneet tietoa niiden kiinnostusjärjestyksestä, suuri osa genomin sekvensointihankkeista saadusta runsaasta tiedosta ei olisi saatavilla.

samalla tavalla mikroskopian kehitys enteili solubiologian löytöjä, informaatioteknologian ja molekyylibiologian uudet löydöt enteilevät bioinformatiikan löytöjä. Itse asiassa tärkeä osa bioinformatiikan alaa on uuden teknologian kehittäminen, jonka avulla bioinformatiikan tiede voi edetä hyvin nopeasti. Tietokonepuolella Internet, uudet ohjelmistokehitykset, uudet algoritmit ja tietokoneklusteritekniikan kehittyminen ovat mahdollistaneet bioinformatiikan suuren harppauksen tehokkaasti analysoitavan datan määrässä. Laboratoriopuolella uudet teknologiat ja menetelmät, kuten DNA: n sekvensointi, geeniekspression sarjatutkimus (SAGE), mikroarrayt ja uudet massaspektrometriset kemikaalit, ovat kehittyneet yhtä hurjaa vauhtia, minkä ansiosta tutkijat voivat tuottaa dataa analyysejä varten uskomattomalla nopeudella. Bioinformatiikka tarjoaa sekä alustateknologioita, joiden avulla tutkijat voivat käsitellä genomiikka-ja proteomiikka-aloitteiden avulla tuotettuja suuria tietomääriä, että näiden tietojen tulkitsemista. Bioinformatiikka tarjoaa monin tavoin työkaluja tieteellisen menetelmän soveltamiseen laajamittaiseen dataan, ja se tulisi nähdä tieteellisenä lähestymistapana, jolla voidaan esittää monia uusia ja erityyppisiä biologisia kysymyksiä.

data.gif

kuva 3. Mahdolliset Bioinformatiatyypit. Tietokonepohjaisten tietokantojen biologisten tietojen avulla tiedemies voi tuottaa kaikenlaisia tietoja, tuottaa proteiinin sekvenssin ja ennustaa proteiini verkkotunnuksia jopa tuottaa 3D rakenteita proteiineja.

sanasta bioinformatiikka on tullut hyvin suosittu ”buzz” – sana tieteessä. Monet tutkijat pitävät bioinformatiikkaa jännittävänä, koska siinä on mahdollisuus sukeltaa kokonaan uuteen maailmaan, kartoittamattomalle alueelle. Bioinformatiikka on uusi tiede ja uusi ajattelutapa, joka voisi mahdollisesti johtaa moniin oleellisiin biologisiin löytöihin. Vaikka teknologia mahdollistaa bioinformatiikan, bioinformatiikassa on silti paljon kyse biologiasta. Biologiset kysymykset ohjaavat kaikkia bioinformatiikan kokeiluja. Tärkeitä biologisia kysymyksiä voidaan käsitellä bioinformatiikan avulla, ja niihin kuuluvat ihmisen sairauden genotyyppi-fenotyyppi-yhteyden ymmärtäminen, proteiinien rakenteen toiminnan suhteiden ymmärtäminen ja biologisten verkostojen ymmärtäminen. Bioinformaatikot huomaavat usein, että reagensseja, joita tarvitaan näihin mielenkiintoisiin biologisiin kysymyksiin vastaamiseen, ei ole olemassa. Suuri osa bioinformaatikon työstä on siis työkalujen ja teknologioiden rakentamista osana kysymyksen esittämistä. Monille bioinformatiikka on hyvin suosittua, koska tutkijat voivat soveltaa sekä biologian että tietotekniikan taitojaan bioinformatiikan tutkimuksen reagenssien kehittämiseen. Monet tutkijat ovat havainneet, että bioinformatiikka on jännittävä uusi tieteellisen kyseenalaistamisen alue, jolla on suuri potentiaali hyödyttää ihmisten terveyttä ja yhteiskuntaa.

bioinformatiikan tulevaisuus on integraatio. Esimerkiksi erilaisten tietolähteiden, kuten kliinisten ja genomitietojen, integrointi antaa meille mahdollisuuden käyttää taudin oireita geneettisten mutaatioiden ennustamiseen ja päinvastoin. GIS-tietojen, kuten karttojen, sääjärjestelmien, yhdistäminen viljelykasvien terveystietoihin ja genotyyppitietoihin antaa meille mahdollisuuden ennustaa onnistuneita tuloksia maatalouskokeiluissa. Toinen bioinformatiikan tulevaisuuden tutkimusala on laajamittainen vertaileva genomiikka. Esimerkiksi sellaisten työkalujen kehittäminen, joilla voidaan tehdä 10-suuntaisia vertailuja genomeista, edistää löytöastetta tällä bioinformatiikan alalla. Näiden linjojen mukaisesti monimutkaisten järjestelmien täydellisten verkkojen mallinnusta ja visualisointia voitaisiin tulevaisuudessa käyttää ennustamaan, miten järjestelmä (tai solu) reagoi esimerkiksi lääkkeeseen. Bioinformatiikka on teknisesti haastavaa, ja siihen vastataan nopeammilla tietokoneilla, levymuistitilan teknologisella kehityksellä ja lisääntyneellä kaistanleveydellä, mutta ylivoimaisesti yksi suurimmista bioinformatiikan nykyisistä esteistä on alan tutkijoiden vähäinen määrä. Tämä on muuttumassa bioinformatiikan siirtyessä tutkimuksen eturintamaan, mutta tämä asiantuntemuksen viive on johtanut todellisiin aukkoihin bioinformatiikan tietämyksessä tutkimusyhteisössä. Bioinformatiikan tulevaisuuden kannalta keskeinen tutkimuskysymys on myös se, miten laskennallisesti voidaan vertailla monimutkaisia biologisia havaintoja, kuten geenien ilmentymismalleja ja proteiiniverkostoja. Bioinformatiikassa on kyse biologisten havaintojen muuntamisesta malliksi, jonka tietokone ymmärtää. Tehtävä on hyvin haastava, sillä biologia voi olla hyvin monimutkaista. Tämä ongelma fenotyyppisten tietojen, kuten käyttäytymisen, elektrokardiogrammien ja viljelykasvien terveyden digitoinnista tietokoneella luettavaan muotoon tarjoaa jännittäviä haasteita tuleville bioinformaatikoille.

(tämä artikkeli perustuu UBC: n Bioinformatiikkakeskuksen johtajan Francis Ouelletten haastatteluun)



+