What are emparelhed-end reads?

muitos kits de preparação de bibliotecas sequenciadas incluem uma opção para gerar as chamadas “leituras emparelhadas”. Em sequenciação de “Leitura curta”, o DNA genômico intacto é cortado em vários milhões de fragmentos de DNA curtos chamados”reads”. Leituras individuais podem ser emparelhadas em conjunto para criar leituras emparelhadas, o que oferece alguns benefícios para algoritmos de análise de dados bioinformáticos a jusante. A estrutura de uma leitura emparelhada é descrita aqui.

Fig. 1

Fig. 1 mostra uma visão esquemática de uma leitura ilumina emparelhada. Há uma sequência de adaptador única em ambas as extremidades da leitura emparelhada, rotulada “Read 1 adaptador”e” Read 2 Adaptador”.

“Read 1″, muitas vezes chamado de” forward read”, estende – se a partir do” Read 1 Adaptador “na direção 5′ – 3′ para” Read 2 ” ao longo da cadeia de DNA forward.

“Read 2″, muitas vezes chamado de” read reversa”, se estende do” Read 2 adaptador “na direção de 5′ – 3′ para” Read 1 ” ao longo da cadeia reversa de DNA.

existe uma sequência de ADN arbitrária inserida entre” ler 1 “e” ler 2″, que vamos chamar de”sequência interna”. O comprimento desta sequência é medido como a”distância interior”. Por definição, a” inserção “é a concatenação de” leitura 1″, a sequência” distância interior “e”leitura 2″. E o comprimento do ” Inserir “é O”inserir tamanho”. Um único “fragmento” inclui o “Read 1 Adapter”, “Read 1”, “Inner sequence”, “Read 2″e” Read 2 Adapter”. E o comprimento deste ” fragmento “é apenas o”comprimento do fragmento”.

Fig. 2

Fig. 2 mostra uma distribuição típica de tamanho de inserção para o Kit de Preparação da biblioteca de DNA Illumina Nextera XT. Esta é uma distribuição probabilística e vai variar um pouco para cada amostra de DNA que é preparada com o kit XT. A distribuição mostra um pico de tamanho de inserção em torno de 300 bp. A distribuição é um pouco leptokurtica e positivamente distorcida com um tamanho mínimo de inserção em torno de 40 bp e tamanho máximo de inserção em torno de 850 bp.

Note que devido à natureza positivamente distorcida da distribuição há um número significativo de leituras emparelhadas com um comprimento total bastante longo (em comparação com apenas o indivíduo lê-se). Este aumento no comprimento total é benéfico para algoritmos de alinhamento de seqüências, algoritmos de montagem de novo, abrangendo sequências repetitivas e a detecção de inserções, deleções e inversões.



+