ce sunt asociate-end citește?

multe seturi de pregătire a bibliotecii de secvențiere includ o opțiune pentru a genera așa-numitele „citiri pereche”. În secvențierea „citită scurt”, ADN-ul genomic intact este tăiat în câteva milioane de fragmente scurte de ADN numite”citește”. Citirile individuale pot fi asociate împreună pentru a crea citiri pereche, ceea ce oferă unele beneficii pentru algoritmii de analiză a datelor bioinformatice din aval. Structura unei citiri pereche este descrisă aici.

Fig. 1

Fig. 1 prezintă o vedere schematică a unui Illumina pereche-end citit. Există o secvență de adaptor unic pe ambele capete ale pereche-end citit, etichetate” Citește 1 adaptor „și”citește 2 Adaptor”.

„Citește 1”, adesea numit „citește înainte”, se extinde de la „Citește 1 adaptor” în direcția 5′ – 3′ spre „citește 2” de-a lungul catenei ADN înainte.

„Citește 2”, adesea numit „citire inversă”, se extinde de la „Citește 2 adaptor” în direcția 5′ – 3′ spre „citește 1” de-a lungul firului ADN invers.

există o secvență ADN arbitrară inserată între „Citește 1” și „citește 2”, pe care o vom numi „secvența interioară”. Lungimea acestei secvențe este măsurată ca”distanța interioară”. Prin definiție, „inserția „este concatenarea” citirii 1″, a secvenței” distanței interioare „și a”citirii 2″. Și lungimea ” inserției „este”dimensiunea inserției”. Un singur „Fragment” include „Read 1 Adapter”, „Read 1”, „inner sequence”, „Read 2″și” Read 2 Adapter”. Iar lungimea acestui ” Fragment „este doar”lungimea fragmentului”.

Fig. 2

Fig. 2 prezintă o distribuție tipică a dimensiunii inserției pentru kitul de pregătire a Bibliotecii ADN Illumina Nextera XT. Aceasta este o distribuție probabilistică și va varia oarecum pentru fiecare probă de ADN care este pregătită cu kitul XT. Distribuția prezintă o dimensiune maximă a inserției în jurul valorii de 300 bp. Distribuția este oarecum leptokurtică și înclinată pozitiv, cu o dimensiune minimă a inserției în jurul valorii de 40 bp și o dimensiune maximă a inserției în jurul valorii de 850 bp.

rețineți că, datorită naturii pozitive a distribuției, există un număr semnificativ de citiri pereche cu o lungime totală destul de lungă (în comparație cu doar persoana care se citește). Această creștere a lungimii totale este benefică pentru algoritmii de aliniere a secvențelor, algoritmii de asamblare de novo, care acoperă secvențe repetitive și detectarea inserțiilor, ștergerilor și inversiunilor.



+