Hvad er parret – end læser?

mange sekventeringsbiblioteksforberedelsessæt indeholder en mulighed for at generere såkaldte “paired-end reads”. I” kortlæst ” sekventering forskydes intakt genomisk DNA i flere millioner korte DNA-fragmenter kaldet “læser”. Individuelle læsninger kan parres sammen for at skabe parrede slutlæsninger, hvilket giver nogle fordele for nedstrøms bioinformatik dataanalysealgoritmer. Strukturen af en parret slutlæsning er beskrevet her.

Fig. 1

Fig. 1 viser et skematisk billede af en Illumina parret ende læse. Der er en unik adaptersekvens i begge ender af den parrede ende læst, mærket “Læs 1 Adapter” og “læs 2 Adapter”.

“Læs 1″, ofte kaldet” fremadlæsning”, strækker sig fra” læs 1 – adapteren “i 5′ – 3′ retning mod” Læs 2 ” langs den fremadrettede DNA-streng.

“Læs 2″, ofte kaldet” omvendt læsning”, strækker sig fra” læs 2 – adapteren “i 5′ – 3′ retningen mod” Læs 1 ” langs den omvendte DNA-streng.

der er en vilkårlig DNA-sekvens indsat mellem “Læs 1” og “læs 2”, som vi kalder den “indre sekvens”. Længden af denne sekvens måles som “indre afstand”. Per definition er ” Indsæt “sammenkædningen af” Læs 1″,” indre afstand “- sekvensen og”læs 2″. Og længden af” Indsæt “er”Indsæt størrelse”. Et enkelt ” Fragment “inkluderer” Læs 1 Adapter”,” Læs 1″,” indre sekvens”,” Læs 2 “og”læs 2 Adapter”. Og længden af dette” Fragment “er bare”Fragmentlængden”.

Fig. 2

Fig. 2 viser en typisk fordeling af indsatsstørrelsen for DNA-bibliotekets FORBEREDELSESSÆT. Dette er en probabilistisk fordeling og vil variere noget for hver DNA-prøve, der er fremstillet med gensplejset. Fordelingen viser en spidsindsatsstørrelse omkring 300 bp. Fordelingen er noget leptokurtisk og positivt skæv med en minimum insert størrelse omkring 40 bp og maksimal insert størrelse omkring 850 bp.

Bemærk, at på grund af fordelingens positivt skæve karakter er der et betydeligt antal parrede endelæsninger med en ret lang total længde (sammenlignet med bare den enkelte læser sig selv). Denne stigning i total længde er gavnlig for sekvensjusteringsalgoritmer, de novo samlingsalgoritmer, der spænder over gentagne sekvenser og påvisning af Indsætninger, sletninger og inversioner.



+