sok szekvenáló könyvtár előkészítő készlet tartalmaz egy lehetőséget az úgynevezett “párosított végű olvasások”létrehozására. A “rövid olvasású” szekvenálás során az ép genomi DNS-t több millió rövid DNS-fragmensre nyírják, amelyeket “olvasnak”. Az egyes olvasások párosíthatók páros végű olvasások létrehozásához, ami bizonyos előnyöket kínál a downstream bioinformatikai adatelemzési algoritmusok számára. A párosított végű olvasás szerkezetét itt ismertetjük.
Fig. 1
Fig. Az 1. ábra egy Illumina párosított végű olvasmány sematikus nézetét mutatja. A párosított olvasóvég mindkét végén egyedi adaptersorozat található, “Read 1 Adapter” és “Read 2 Adapter”felirattal.
az”Read 1″, amelyet gyakran “forward read” – nek hívnak, az “Read 1 Adapter” – től az 5′ – 3′ irányban a “Read 2” felé terjed az előre haladó DNS-szál mentén.
a”Read 2″, amelyet gyakran “fordított olvasásnak” neveznek, a “Read 2 Adapter” – től az 5′ – 3′ irányban az “Read 1” felé terjed a fordított DNS-szál mentén.
egy tetszőleges DNS-szekvencia van beillesztve az “1.olvasás” és a “2. olvasás” közé, amelyet “Belső szekvenciának”nevezünk. Ennek a sorozatnak a hosszát “belső távolságként”mérjük. Definíció szerint az “Insert” a “Read 1”, A “Belső távolság” szekvencia és a “Read 2″összefűzése. A “Beszúrás” hossza pedig a “Beszúrás mérete”. Egyetlen ” töredék “tartalmazza a” Read 1 Adapter”,” Read 1″,” belső szekvencia”,” Read 2 “és”Read 2 Adapter”. Ennek a “töredéknek” a hossza pedig csak a “töredék hossza”.
Fig. 2
ábra. A 2. ábra az Illumina Nextera XT DNS könyvtár előkészítő készlet tipikus lapkaméret-eloszlását mutatja. Ez egy valószínűségi eloszlás, amely némileg eltér az XT készlettel készített DNS-mintáktól. Az eloszlás a lapka csúcsméretét mutatja 300 bp körül. Az eloszlás kissé leptokurt és pozitívan ferde, a minimális lapkaméret 40 bp körül, a maximális lapkaméret pedig 850 bp körül van.
vegye figyelembe, hogy az eloszlás pozitívan ferde jellege miatt jelentős számú párosított végű olvasmány van, amelyek teljes hossza meglehetősen hosszú (összehasonlítva csak az egyén olvassa magukat). A teljes hossz növekedése előnyös a szekvenciaillesztési algoritmusok, a De novo összeszerelési algoritmusok, az ismétlődő szekvenciák és a Beszúrások, törlések és inverziók észlelésére.