Hva er sammenkoblede leser?

Mange sekvenseringsbibliotek forberedelse kits inkluderer et alternativ for å generere såkalte «sammenkoblede-end leser». I» short-read «sekvensering, intakt genomisk DNA er skåret i flere millioner korte DNA fragmenter kalt «leser». Individuelle leser kan kobles sammen for å lage sammenkoblede-end leser, noe som gir noen fordeler for nedstrøms bioinformatikk dataanalysealgoritmer. Strukturen til en sammenkoblet lesning er beskrevet her.

Fig. 1

Fig. 1 viser en skjematisk visning av En Illumina parret-end lese. Det er en unik adapter sekvens på begge ender av paret-end lese, merket «Les 1 Adapter» og «Les 2 Adapter».

«Read 1″, ofte kalt» forward read», strekker seg fra » Read 1 Adapter «i 5′ – 3′ retning mot» Read 2 » langs forward DNA-strengen.

«Read 2», ofte kalt «reverse read», strekker seg fra » Read 2 Adapter «i 5′ – 3′ retning mot» Read 1 » langs den omvendte DNA-strengen.

det er en vilkårlig DNA-sekvens satt inn mellom «Les 1» og «Les 2», som vi kaller «Indre sekvens». Lengden på denne sekvensen måles som «Indre avstand». Per definisjon er «Sett inn» sammenkoblingen av «Les 1», «Indre avstand» – sekvensen og «Les 2″. Og lengden på» Sett inn «er» Sett inn størrelse». Et enkelt » Fragment «inkluderer» Les 1 Adapter», «Les 1», «Indre sekvens», » Les 2 «og» Les 2 Adapter». Og lengden på dette «Fragmentet» er bare «Fragmentlengden».

Fig. 2

Fig. 2 viser en typisk settestørrelsesfordeling For Illumina Nextera XT DNA Bibliotek Forberedelse Kit. Dette er en probabilistisk fordeling og vil variere noe for HVER DNA-prøve som er utarbeidet MED XT-settet. Fordelingen viser en toppinnsatsstørrelse rundt 300 bp. Fordelingen er noe leptokurtisk og positivt skjev med en minimum innsatsstørrelse rundt 40 bp og maksimal innsatsstørrelse rundt 850 bp.

Merk at på grunn av fordelingens positivt skjeve natur er det et betydelig antall sammenkoblede endeleser med en ganske lang total lengde(sammenlignet med bare personen leser seg selv). Denne økningen i total lengde er gunstig for sekvensjusteringsalgoritmer, de novo monteringsalgoritmer, som spenner over repeterende sekvenser og deteksjon av innsettinger, slettinger og inversjoner.



+