Vad är parade slutläsningar?

många sekvenseringsbiblioteksberedningssatser innehåller ett alternativ för att generera så kallade ”Parade slutläsningar”. I” kortläst ”sekvensering skärs intakt genomiskt DNA i flera miljoner korta DNA-fragment som kallas ”läser”. Individuella läsningar kan paras ihop för att skapa Parade slutläsningar, vilket ger vissa fördelar för nedströms bioinformatikdataanalysalgoritmer. Strukturen för en parad slutläsning beskrivs här.

Fig. 1

Fig. 1 visar en schematisk bild av en Illumina parad-end läsning. Det finns en unik adaptersekvens i båda ändarna av den parade ändläsningen, märkt ”Läs 1 Adapter” och ”Läs 2 Adapter”.

”Läs 1”, ofta kallad ”framåtläsning”, sträcker sig från ”Läs 1 – adaptern” i 5′ – 3′ – riktningen mot ”Läs 2” längs den främre DNA-strängen.

”Läs 2”, ofta kallad ”omvänd läsning”, sträcker sig från ”Läs 2 – adaptern” i 5′ – 3′ – riktningen mot ”Läs 1” längs den omvända DNA-strängen.

det finns en godtycklig DNA-sekvens infogad mellan ”Läs 1” och ”Läs 2”, som vi kallar ”inre sekvensen”. Längden på denna sekvens mäts som ”inre avstånd”. Per definition är ”Infoga ”sammanfogningen av” Läs 1″,” inre avstånd ”- sekvensen och”Läs 2”. Och längden på ”Infoga” är ”Infoga storlek”. Ett enda ”Fragment” inkluderar ”Läs 1 Adapter”, ”Läs 1”, ”inre sekvens”, ”Läs 2″och” Läs 2 Adapter”. Och längden på detta” Fragment ”är bara”Fragmentlängden”.

Fig. 2

Fig. 2 visar en typisk insatsstorleksfördelning för Illumina Nextera XT DNA Library Preparation Kit. Detta är en probabilistisk fördelning och kommer att variera något för varje DNA-prov som bereds med XT-satsen. Fördelningen visar en toppinsatsstorlek runt 300 bp. Fördelningen är något leptokurtisk och positivt skev med en minsta insatsstorlek runt 40 bp och maximal insatsstorlek runt 850 bp.

Observera att på grund av fördelningens positivt snedställda natur finns ett betydande antal Parade slutläsningar med en ganska lång total längd (jämfört med bara individen läser sig). Denna ökning i total längd är fördelaktig för sekvensinriktningsalgoritmer, de novo-monteringsalgoritmer, som spänner över repetitiva sekvenser och detektering av Infogningar, borttagningar och inversioner.



+