monissa sekvensoitavissa kirjastojen valmistelupaketeissa on mahdollisuus luoda ns. ”Short-read” – sekvensoinnissa ehjästä genomisesta DNA: sta lohkotaan useita miljoonia lyhyitä DNA-pätkiä, joita kutsutaan ”readeiksi”. Yksittäiset lukemat voidaan yhdistää pariloppuisiksi lukemiksi, mikä tarjoaa joitakin etuja bioinformatiikan loppupään analysointialgoritmeille. Pariloppuisen lukeman rakennetta kuvataan tässä.
Kuva. 1
Kuva. 1 näyttää kaavamaisen näkymän Illumina pariksi loppuun lukea. On ainutlaatuinen sovitin sekvenssi molemmissa päissä pariksi-end lukea, merkitty ”Lue 1 sovitin”ja” lue 2 sovitin”.
”Read 1”, jota usein kutsutaan ”eteenpäin luettavaksi”, ulottuu ”Read 1 – adapterista” 5′ – 3′ – suuntaan kohti ”Read 2” eteenpäin kulkevaa DNA-juostetta pitkin.
”Read 2”, jota usein kutsutaan ”käänteiseksi lukemaksi”, ulottuu ”Read 2 – adapterista” 5′ – 3′ – suuntaan kohti ”Read 1” käänteistä DNA-juostetta pitkin.
sanojen ”Lue 1” ja ”lue 2” väliin on lisätty mielivaltainen DNA-sekvenssi, jota kutsumme ”sisäiseksi sekvenssiksi”. Tämän jakson pituus mitataan ”sisempänä etäisyytenä”. Määritelmän mukaan” insertti ”on” Lue 1″,” sisempi etäisyys ”- sekvenssi ja”lue 2”. Ja ”insertin” pituus on ”insertin koko”. Yksittäinen ” fragmentti ”sisältää” Lue 1-adapteri”,” Lue 1″,” sisäinen sekvenssi”,” Lue 2 ”ja”lue 2-adapteri”. Ja tämän ”fragmentin” pituus on vain ”fragmentin pituus”.
Kuva. 2
Kuva. 2 näyttää tyypillisen insertin kokojakauman Illumina Nextera XT DNA-kirjaston Valmistuspaketille. Tämä on todennäköisyysjakauma ja vaihtelee jonkin verran jokaisen XT-pakkauksella valmistetun DNA-näytteen osalta. Jakauma osoittaa piikin insertin koon noin 300 bp. Jakauma on hieman leptokurttinen ja positiivisesti vinoutunut siten, että pienin inserttikoko on noin 40 bp ja suurin inserttikoko noin 850 bp.
huomaa, että jakauman positiivisesta vinoutumisesta johtuen on olemassa huomattava määrä parilukijoita, joiden kokonaispituus on melko pitkä (verrattuna vain yksittäisiin lukuihin itseensä). Tämä kokonaispituuden kasvu on hyödyllistä sekvenssin kohdistusalgoritmeille, de novo-kokoonpanoalgoritmeille, toistuvien sekvenssien kattamiselle ja insertioiden, poistojen ja inversioiden havaitsemiselle.