a seleção dependente de frequência negativa contribui para a manutenção de um polimorfismo global no DNA mitocondrial

construção de linhas de introgressão Mito-nuclear
Fundação das populações de evolução experimental
a manutenção das populações de evolução experimental
conjuntos sequenciados e mitogenomas
Estimation of the mtDNA haplotype frequencies
análises estatísticas
estimativas da força da selecção dependente da frequência

construção de linhas de introgressão Mito-nuclear

para isolar os efeitos genéticos da mtDNA do genoma nuclear, nossos experimentos foram baseados em linhas de introgressão mitonuclear (MNILs). A construção de nossos MNILs é explicada em detalhe em Kurbalija Novicic et al. . Brevemente, todos os MNILs usados foram criados a partir de linhas isofemale (IFLs), cada uma das quais foi fundada por uma única fêmea acasalada originária de uma única população natural comum (Gorge Sicevo-Sérvia, S 43°19’55.58″ n 22°0837.98″). As linhas foram primeiro genotipadas para seu haplótipo mtDNA usando enzimas de restrição e selecionamos seis IFLs, três dos quais carregavam haplotipos HI e três haplotipos HII, cada um dos quais foi então backcrossed com um sétimo IFL comum (“D”). Em cada MNIL, backcrossing foi realizado por emparelhar 10 fêmeas virgens de uma dada IFL com 20 machos da linha D. Usámos este procedimento de retrospecção introgressiva repetida para 12 gerações subsequentes para substituir o genoma nuclear de um dado IFL pelo genoma nuclear d comum (> 99,95% substituído). Note que IFLs não foram inbred ou de outra forma feitos isogênicos. Para excluir a possibilidade de contaminação durante a introgressão, a integridade do mtDNA de todos os MNILs foram validados na geração 5, 8 e 12 por genotipagem de uma amostra de moscas de cada MNIL. Nós também pesquisamos a presença de Wolbachia em todos os MNILs, por um teste PCR usando primers específicos 16S rDNA Wolbachia usando métodos detalhados em García-Martínez et al. . Usámos duas estirpes diferentes de Drosophila contendo Wolbachia como controlos positivos (D. melanogaster stock no. 5, Bloomington Stock Centre, D. simulans, Riverside strain). Estes testes de PCR foram negativos para todos os nossos MNILs, bem como para a linha D. Todas as linhas foram mantidas e todos os experimentos realizados em condições laboratoriais constantes, a 19 °C, 60% de umidade relativa, luz de 300 lx, e em um Fotoperíodo de 12 h luz: 12 h escuro.

Fundação das populações de evolução experimental

antes dos experimentos, nós amalgamamos os três MNILs Carregando HI em uma população fonte HI e os três MNILs em uma população fonte HII para homogeneizar a potencial variação genética nuclear através de MNILs. Isso foi feito misturando 100 moscas adultas de cada MNIL, em duas gaiolas populacionais (i.e., N = 3 × 100 moscas por gaiola) (gaiolas de Plexiglas, L25 cm x W15 cm xH15 cm, com 3 pratos cada contendo 30 ml de farinha de milho) e mantendo-os para uma geração subsequente completa em condições laboratoriais normais. As duas populações-fonte, assim, carregavam o haplótipo hii ou hii mtDNA, expresso em um fundo genético Nuclear outbred e comum (i.e., D). Moscas Virgens destas duas populações de origem foram então seladas e usadas para encontrar as populações de evolução experimental.

iniciámos n = 12 populações de evolução experimental. Em cada população, n = 100 moscas Virgens (razão de sexo 1:1) com 3-5 dias de idade foram introduzidas a partir das populações-fonte em uma gaiola populacional (L25 cm x W15 cm xH15 cm). Variámos a frequência inicial dos haplotipos HII e HII e as condições de recursos alimentares entre as populações, utilizando um desenho cruzado de 2 × 2 (n = 3 populações por célula), da seguinte forma. Em metade das gaiolas, 80% das moscas fundadoras eram da população de origem HI e 20% da população de origem HII. Na outra metade, 20% das moscas fundadoras eram da população de origem HI e 80% da população de origem HII. Em termos de condições de recursos alimentares, a quantidade de meio (tanto em volume como em superfície) foi idêntica nos dois grupos de tratamento, enquanto a variação na concentração de nutrientes na população foi manipulada da seguinte forma. Metade das gaiolas (“homogenous food conditions”) continha 3 pratos alimentares idênticos, cada um com 30 ml de meio de farinha de milho padrão (YC) contendo 1,5% de levedura. A outra metade das gaiolas (condições alimentares heterogéneas) continha também 3 pratos cada com 30 ml de meio padrão, mas estes diferiam em concentração de leveduras (il-0,375%, YC – 1,5%, YH – 6%).

a manutenção das populações de evolução experimental

as populações foram mantidas no laboratório de uma forma que assegurou gerações discretas, 40 dias / ciclo , a 19 °C, 60% de humidade relativa e um ciclo de 12 h luz: 12 h escuro. No dia 40, os três pratos de comida antigos foram substituídos por três novos e moscas foram permitidos no total 9 dias para oviposição . Os novos pratos, contendo ovos e larvas, foram então retirados de qualquer adulto e transferidos para uma nova gaiola para iniciar a próxima geração. Todas as moscas adultas em cada gaiola velha foram então contadas, uma vez que estavam mortas.

conjuntos sequenciados e mitogenomas

antes da estimativa de frequência dos haplótipos (ver abaixo), sequenciámos e reunimos todos os haplotipos de mtDNA utilizados. O DNA foi extraído das seis linhas IF (HI: 1, 3, 5; HII: 21, 25, 29) usadas para criar as MNILs, usando um protocolo de precipitação Salt-etanol. As moscas foram primeiro maceradas suavemente e colocadas em tampão de preparação (100 mM NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) juntamente com a proteinase K, vortexada e incubada a 50 °C durante a noite. As amostras foram então congeladas durante a noite. Para precipitar o DNA, adicionamos NaCl saturado várias vezes antes de adicionar 95% de etanol, e nós giramos o DNA em um sedimento. O sedimento de ADN foi suspenso em tampão TE 4 (pH = 7, 6). A qualidade e a quantidade do ADN foram avaliadas utilizando NanoDrop, Qubit e Bioanalisador, seguindo-se uma avaliação do comprimento dos fragmentos num gel de agarose.

bibliotecas de sequenciamento foram preparadas a partir de 100 ng de DNA usando o kit de preparação de biblioteca de DNA livre TruSeq. As seis amostras foram então sequenciadas a 125 leituras BP emparelhadas em duas faixas em um sistema Illumina HiSeq2500 usando química de sequenciamento v4. No total, sequenciamos em média 194 milhões de leituras para cada biblioteca. Mitogenomas das seis amostras foram então montados usando um subconjunto de 5% do número total de leituras de cada biblioteca. As leituras foram alimentadas para o algoritmo MITObim V 1.8 e o MIRA V 4.0.2 montador, para realizar assembleias guiadas, usando a Drosophila pseudoobscura mitogenome (GenBank: Fj899745.1) como genoma de referência. Todos os conjuntos obtidos eram mitogenomas circulares com um tamanho de quase 16kbp. As assembleias finais foram então alinhadas usando ClustalW e MAFFT, e manualmente curadas para obter uma montagem final polida para cada haplótipo. Os mitogenomas montados foram anotados usando DOGMA e MITOS , usando configurações padrão de parâmetros, e finalmente curados manualmente.

avaliar a validade de nossa mitogenome montagem, todos Drosophila subobscura dnamt sequências disponíveis no GenBank (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, rrnS, a + T região rica, e vários trna), no total, abrangendo mais de 50% do total da assembléia, foram alinhadas contra a nossa mitogenomes. Sem exceção, estes mostraram identidade sequencial > 99%.

vários SNPs únicos foram encontrados em cada um dos seis haplotipos mitogenome (ver abaixo), dos quais dois consistentemente distinguiram os grupos haplotipos HI e HII. A profundidade de cobertura para cada SNP foi verificada através do mapeamento das leituras usadas para a montagem mitogenome usando Bowtie v 1.2 . Estes esforços confirmaram todos os SNPs identificados na etapa de montagem. Aqui, focamos nos dois principais grupos haplotipos I e II, que mostram um padrão impressionante e consistente de polimorfismo dentro da população através de populações(Fig. 1) e diferenças fenotípicas funcionais (ver introdução). Embora os SNPs ocorram dentro de cada um dos dois grupos haplotipos, tais SNPs são raros (por exemplo ) e não são consistentemente polimórficos.

Estimation of the mtDNA haplotype frequencies

We used pool-seq to estimate haplotype frequency evolution, by sequencing samples of flies from the 5th and 10th generation of each experimental evolution population. Em cada amostra, 105 moscas selecionadas aleatoriamente por gaiola foram agrupadas e submetidas a extração de DNA (em grupos de 15) e a preparações de bibliotecas sequenciadoras, como descrito acima. As amostras N = 24 foram então sequenciadas a 125 leituras BP emparelhadas em duas faixas em um sistema Illumina HiSeq2500, usando química de sequenciamento v4. O nosso esforço conjunto-seq foi concebido para fornecer uma profundidade de sequenciamento suficiente para uma estimativa precisa das frequências haplotype mtDNA, mas não permite análises detalhadas do genoma nuclear.Sequenciamos, em média, 66 milhões de leituras para cada biblioteca. Leituras de cada biblioteca foram então mapeadas de volta para os seis mitogenomas montados, retendo apenas mapeamentos únicos e zero-inadequados usando Bowtie v 1.2 . O número de leituras mapeadas para os dois SNPs que distinguiram os tipos HI e HII (em Nad5 e em 12S rRNA) foi então contado e usado como nossa estimativa da frequência relativa de cada haplótipo principal (HI ou HII) em cada amostra.

análises estatísticas

para cada amostra, todas as leituras de mapeamento para os dois PNS diagnósticos (ver abaixo) foram contadas como sendo de tipo HI ou de tipo HII. A proporção de HL lê para os dois SNPs diferentes foram muito estreitamente correlacionados de fato ao longo das 24 amostras (r = 0,987), de tal forma que ambos os marcadores forneceram estimativas virtualmente idênticas. Aqui, nós usamos a proporção média em ambos os SNPs aqui para estimar a frequência de HI presente em cada pool-seq amostra.

Evolução pode ser definida como mudanças no genótipo freqüências dentro de uma população, e nosso projeto nos permitiu derivar duas temporalmente separados de medidas repetidas de cada geração haplótipo frequência de mudanças em nossa evoluindo cada linha como Δf0–5 = (f5 – f0)/5 ou Δf5–10 = (f10 – f5)/5, onde os subscritos indicam a geração na qual a amostra foi coletada. Além disso, estimamos Δf0–10 = (f10 – f0)/10 para avaliar a variação líquida da frequência de haplotipos. Como apenas dois genótipos estavam envolvidos, a frequência de HI: fI = 1-fII, e assim restringimos nossas análises a mudanças na frequência de um dos haplotipos. Para cada estimativa de Δf, também derivamos um coeficiente de seleção dependente de frequência (SI) correspondente à força da seleção necessária para causar a alteração observada nas frequências de haplotipos (ver abaixo).

cada linha em evolução representa uma unidade observacional no nosso design, pelo que analisámos os nossos dados usando medidas repetidas ANOVAs (isto é, dentro dos indivíduos ANOVAs). Aqui, cada linha representa o sujeito, e a frequência inicial de HI (0.2 ou 0.8) e condição ambiental (homogênea ou heterogênea) foram dois fatores entre os sujeitos, e as duas medidas repetidas (de Δf ou SI) tomadas em intervalos geracionais diferentes foram tratadas como um fator dentro dos sujeitos. Nestas análises, os fatores focais entre sujeitos testam os efeitos dos nossos tratamentos experimentais e os fatores internos testam se o padrão de evolução mudou durante o curso da nossa experiência. Esta estratégia analítica baseia-se no fato de que rastreamos a dinâmica de frequência em linhas replicadas e independentes e o efeito não focal da deriva genética aleatória, que se prevê ser substancial para a dinâmica mtDNA, faz parte do termo residual de nossos modelos inferenciais. Os testes f convencionais dos factores entre indivíduos foram validados utilizando testes de permutação, baseados em 9999 permutações aleatórias de dados. O SI médio para diferentes grupos foi avaliado utilizando IC de 95% a partir de 9999 replicados de dados de bootstrap.

estimativas da força da selecção dependente da frequência

também desejámos avaliar mais explicitamente se a força da selecção dependente da frequência com HI e HII diferia entre os dois tratamentos experimentais ambientais (homogéneos / heterogéneos). Para permitir isso, derivamos medidas simples de seleção dependente de frequência a partir de nossos dados empíricos usando a seguinte lógica. Anterior explícita de modelagem de dados não-experimentais neste sistema tem mostrado que o melhor ajuste com o haplótipo frequência dinâmico de dados ocorre onde não há positivos ou negativos de selecção sobre estes dnamt haplótipos mas onde não há negativa de frequência dependentes de seleção que é igualmente forte em ambos os haplótipos . Consideramos os dois haplotipos mtDNA HI e HII, com as frequências pI e pII (pI + pII = 1) e fitnesses WI e WII. Por uma mudança de geração no pI, em seguida, é dada por

$$ \Delta {p}_I=\frac{p_I{p}_{II}\left({W}_I-{W}_{II}\right)}{\overline{W}} $$

Observações de ambas as populações naturais (ver Fig. 1; arquivo adicional 1) e populações replicadas de gaiolas de laboratório também sugerem que a seleção é simétrica com um equilíbrio para os dois haplotipos HI e HII nas proximidades de pI = pII = 0,5. Assumindo (i) uma frequência de equilíbrio de pI = pII = 0.5, (ii) que o haplótipo de fitness está linearmente relacionada com a frequência do haplótipo e (iii) que a seleção é simétrico, todas as quais são suportadas por estudos anteriores , obtemos

$$ {W}_I=1-{p}_I{s}_I $$

$$ {W}_{II}=1-{p}_{II}{s}_I $$

onde sI é a frequência de seleção dependente do coeficiente. Dado que $ \overline{W}={p}_I{W}_I+{p}_{II}{W}_{II} $, podemos estimar sI a partir de nossas observações empíricas de ΔpI como

$$ {s}_I=\frac{-\Delta {p}_I{p}_I-\Delta {p}_I{p}_{II}}{-\Delta {p}_I{p_{II}}^2-{p_I{p}_{II}}^2+{p_I}^2{p}_{II}-\Delta {p}_I{p_I}^2} $$

Definida desta forma, a sI pressupõe uma escala arbitrária, mas é positivo quando de ΔpI mudanças para o atrator e negativo, quando alterações de distância do atrator. Para cada gaiola, estimamos duas medidas repetidas independentes do sI com base nas alterações observadas na frequência de haplotipos entre as gerações 0-5 e 5-10, respectivamente. Notamos que a nossa medida será precisa quando o verdadeiro equilíbrio estiver próximo de pI = pi = 0,5, mas mais aproximado se o verdadeiro equilíbrio se desviar desta condição.