La selección dependiente de frecuencia negativa contribuye al mantenimiento de un polimorfismo global en ADN mitocondrial

Construcción de líneas de introgresión Mito-nuclear
Fundación de las poblaciones de evolución experimental
Mantenimiento de las poblaciones de evolución experimental
Conjuntos de secuenciación y mitogenoma
Estimación de las frecuencias de haplotipos de ADNmt
Análisis estadísticos
Estimaciones de la fuerza de la selección dependiente de frecuencia

Construcción de líneas de introgresión Mito-nuclear

Para aislar los efectos genéticos del ADNmt del genoma nuclear, nuestros experimentos se basaron en líneas de introgresión mitonuclear (MNIL). La construcción de nuestros MNILs se explica en detalle en Kurbalija Novicic et al. . En pocas palabras, todos los MNIL utilizados fueron creados a partir de líneas isofemales (IFL), cada una de las cuales fue fundada por una sola hembra apareada recolectada en estado salvaje originaria de una única población natural común (Garganta de Sicevo-Serbia, S 43°19’55.58″ N 22°0837.98″). Las líneas se genotiparon primero para su haplotipo de ADNmt utilizando enzimas de restricción y seleccionamos seis IFL, tres de los cuales llevaban haplotipos HI y tres haplotipos HII, cada uno de los cuales se cruzó con un séptimo IFL común («D»). En cada MNIL, el retrocruzamiento se realizó emparejando a 10 hembras vírgenes de un IFL dado con 20 machos de la línea D. Utilizamos este procedimiento repetido de retrocruzamiento introgresor durante 12 generaciones posteriores para reemplazar el genoma nuclear de un IFL dado con el genoma nuclear D común (> 99,95% reemplazado). Tenga en cuenta que los IFL no fueron endogámicos ni se hicieron isogénicos. Para excluir la posibilidad de contaminación durante la introgresión, la integridad del ADNMT de todos los MNIL se validó en las generaciones 5, 8 y 12 mediante el genotipado de una muestra de moscas de cada MNIL. También se examinó la presencia de Wolbachia en todos los MNILs, mediante un ensayo de PCR utilizando cebadores específicos de Wolbachia ADNr 16S, utilizando métodos detallados en García-Martínez et al. . Utilizamos dos cepas diferentes de Drosophila que contenían Wolbachia como controles positivos(D. melanogaster stock no. 5, Bloomington Stock Centre, D. simulans, Riverside). Estos ensayos de PCR fueron negativos para todos nuestros MNILs, así como para la línea D. Todas las líneas se mantuvieron y todos los experimentos se realizaron en condiciones de laboratorio constantes, a 19 ° C, humedad relativa del 60%, luz de 300 lx, y a un fotoperíodo de 12 h de luz: 12 h de oscuridad.

Fundación de las poblaciones de evolución experimental

Antes de los experimentos, fusionamos los tres MNILs que llevan HI en una población fuente HI y los tres MNILs HII en una población fuente HII para homogeneizar la variación genética nuclear potencial a través de MNILs. Esto se hizo mezclando 100 moscas adultas de cada MNIL, en dos jaulas de población (p.ej., N = 3 × 100 moscas por jaula) (Jaulas de plexiglás, L25 cm x W15 cm x H15 cm, con 3 platos conteniendo cada uno 30 ml de harina de maíz) y manteniéndolos para una generación completa posterior en condiciones normales de laboratorio. Las dos poblaciones de origen, por lo tanto, portaban el haplotipo HI o el HII mtDNA, expresado en un trasfondo genético nuclear hereditario y común (es decir, D). Las moscas vírgenes de estas dos poblaciones de origen se sexuaron y se utilizaron para fundar las poblaciones de evolución experimental.

Iniciamos N = 12 poblaciones de evolución experimental. En cada población, se introdujeron N = 100 moscas vírgenes (proporción de sexos 1:1) de 3 a 5 días de edad de las poblaciones de origen en una jaula de población (L25 cm x W15 cm x H15 cm). Variamos la frecuencia inicial de los haplotipos HI e HII y las condiciones de los recursos alimentarios entre las poblaciones, utilizando un diseño cruzado de 2 × 2 (N = 3 poblaciones por célula), de la siguiente manera. En la mitad de las jaulas, el 80% de las moscas fundadoras eran de la población de origen HI y el 20% de la población de origen HII. En la otra mitad, el 20% de las moscas fundadoras eran de la población de origen HI y el 80% de la población de origen HII. En términos de las condiciones de los recursos alimentarios, la cantidad de medio (tanto por volumen como por superficie) fue idéntica en los dos grupos de tratamiento, mientras que dentro de la población la variación en la concentración de nutrientes se manipuló de la siguiente manera. La mitad de las jaulas (condiciones alimentarias homogéneas) contenían 3 platos de alimentos idénticos, cada uno con 30 ml de medio de harina de maíz estándar (YC) que contenía un 1,5% de levadura. La otra mitad de las jaulas (condiciones alimentarias heterogéneas) también contenía 3 platos cada uno con medio estándar de 30 ml, pero estos diferían en la concentración de levadura (IL-0,375%, YC – 1,5%, YH – 6%).

Mantenimiento de las poblaciones de evolución experimental

Las poblaciones se mantuvieron en el laboratorio de una manera que garantizó generaciones discretas, 40 días/ciclo , a 19 °C, humedad relativa del 60% y un ciclo de 12 h luz: 12 h oscuridad. En el día 40, los tres platos de comida antiguos fueron reemplazados por tres nuevos y se permitió la oviposición de moscas en un total de 9 días . Los nuevos platos, que contenían huevos y larvas, se retiraron de los adultos y se transfirieron a una nueva jaula para comenzar la próxima generación. Se contaron todas las moscas adultas en cada jaula vieja, una vez muertas.

Conjuntos de secuenciación y mitogenoma

Antes de la estimación de la frecuencia de haplotipos (ver más abajo), secuenciamos y ensamblamos todos los haplotipos de ADNmt utilizados. El ADN se extrajo de las seis líneas IF (HI: 1, 3, 5; HII: 21, 25, 29) utilizadas para crear las MNILs, utilizando un protocolo de precipitación de sal-etanol. Las moscas primero se maceraron suavemente y se colocaron en un tampón de preparación (100 mm NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) junto con proteinasa K, se agitaron en vórtice y se incubaron a 50 °C durante la noche. Las muestras se congelaron durante la noche. Para precipitar el ADN, agregamos NaCl saturado varias veces antes de agregar etanol al 95%, y hacemos girar el ADN en una bolita. El pellet de ADN se suspendió en el tampón TE 4 (pH = 7,6). La calidad y la cantidad de ADN se evaluaron utilizando NanoDrop, Qubit y Bioanalizador, seguido de una evaluación de la longitud del fragmento en un gel de agarosa.

Se prepararon bibliotecas de secuenciación a partir de 100 ng de ADN utilizando el kit de preparación de bibliotecas de ADN sin PCR de TruSeq. Las seis muestras se secuenciaron a lecturas de extremo emparejado de 125 bp en dos carriles en un sistema Illumina HiSeq2500 utilizando química de secuenciación v4. En total, secuenciamos en promedio 194 millones de lecturas para cada biblioteca. Los mitogenomas de las seis muestras se ensamblaron utilizando un subconjunto del 5% del número total de lecturas de cada biblioteca. Las lecturas fueron alimentadas al algoritmo MITObim V 1.8 y al MIRA V 4.0.2 ensamblador, para realizar ensamblajes guiados, utilizando el mitogenoma Drosophila pseudoobscura (GenBank: FJ899745. 1) como genoma de referencia. Todos los ensamblajes obtenidos fueron mitogenomas circulares con un tamaño de casi 16 kbp. Los ensamblajes finales se alinearon utilizando ClustalW y MAFFT, y se curaron manualmente para obtener un ensamblaje final pulido para cada haplotipo. Los mitogenomas ensamblados se anotaron utilizando DOGMA y MITOS , utilizando la configuración de parámetros predeterminada, y finalmente se curaron manualmente.

Para evaluar la validez de nuestro ensamblaje de mitogenomas, todas las secuencias de ADNmt de Drosophila subobscura disponibles en GenBank (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, RRNs, la región rica en A + T y varios arnt), en total cubriendo más del 50% del ensamblaje total, se alinearon contra nuestros mitogenomas. Sin excepción, estos mostraron > 99% de identidad de secuencia.

Se encontraron varios SNP únicos en cada uno de los seis haplotipos mitogenómicos (ver más abajo), de los cuales dos distinguieron consistentemente los grupos de haplotipos HI e HII. La profundidad de cobertura para cada SNP se verificó mapeando las lecturas utilizadas para el ensamblaje del mitogenoma utilizando Bowtie v 1.2 . Estos esfuerzos confirmaron todos los SNP identificados en la etapa de ensamblaje. Aquí, nos centramos en los dos grupos principales de haplotipos I y II, que muestran un patrón llamativo y consistente de polimorfismo dentro de la población a través de las poblaciones (Fig. 1) y diferencias fenotípicas funcionales (ver Introducción). Aunque los SNP ocurren dentro de cada uno de los dos grupos de haplotipos, tales SNP son raros (por ejemplo ) y no son polimórficos de manera consistente.

Estimación de las frecuencias de haplotipos de ADNmt

Se utilizó el pool-seq para estimar la evolución de las frecuencias de haplotipos, secuenciando muestras de moscas de la 5a y 10a generación de cada población de evolución experimental. En cada muestra, 105 moscas seleccionadas al azar por jaula se agruparon y se sometieron a extracción de ADN (en grupos de 15) y preparaciones de biblioteca de secuenciación como se describió anteriormente. Las muestras N = 24 fueron secuenciadas a lecturas de extremos pares de 125 pb en dos carriles en un sistema Illumina HiSeq2500, utilizando química de secuenciación v4. Nuestro esfuerzo de pool-seq fue diseñado para proporcionar suficiente profundidad de secuenciación para una estimación precisa de las frecuencias de haplotipos de ADNmt, pero no permite análisis detallados del genoma nuclear.

Secuenciamos, en promedio, 66 millones de lecturas para cada biblioteca. Las lecturas de cada biblioteca se asignaron a los seis mitogenomas ensamblados, conservando solo asignaciones únicas y sin coincidencias utilizando Bowtie v 1.2 . El número de lecturas mapeadas a los dos SNP que distinguían los tipos HI e HII (en Nad5 y en 12S rRNA) se contaron y utilizaron como nuestra estimación de la frecuencia relativa de cada haplotipo principal (HI o HII) en cada muestra.

Análisis estadísticos

Para cada muestra, todas las lecturas asignadas a los dos SNP de diagnóstico (véase más adelante) se contabilizaron como de tipo HI o de tipo HII. La proporción de lecturas de HI para los dos SNP diferentes se correlacionó muy estrechamente entre las 24 muestras (r = 0,987), de modo que ambos marcadores proporcionaron estimaciones prácticamente idénticas. Aquí, usamos la proporción media entre ambos SNP para estimar la frecuencia de HI presente en cada muestra de pool-seq.

La evolución se puede definir como cambios en las frecuencias de genotipos dentro de una población, y nuestro diseño nos permitió derivar dos medidas repetidas separadas temporalmente de cambios de frecuencia de haplotipos por generación en cada línea evolutiva como Δf0–5 = (f5 – f0)/5 o Δf5–10 = (f10 – f5)/5, donde los subíndices denotan la generación en la que se recolectó la muestra. Además, estimamos Δf0–10 = (f10 – f0)/10 para evaluar el cambio neto de frecuencia de haplotipos. Debido a que solo dos genotipos estaban involucrados, la frecuencia de HI: fI = 1-fII, por lo que restringimos nuestros análisis a los cambios en la frecuencia de uno de los haplotipos. Para cada estimación de Δf, también derivamos un coeficiente de selección dependiente de la frecuencia (SI) correspondiente a la fuerza de selección requerida para causar el cambio observado en las frecuencias de haplotipos (ver a continuación).

Cada línea evolutiva representa una unidad observacional en nuestro diseño, por lo que analizamos nuestros datos utilizando ANOVAs de medidas repetidas (es decir, ANOVAs dentro de los sujetos). Aquí, cada línea representa al sujeto, y la frecuencia inicial de HI (0,2 o 0,8) y la condición ambiental (homogénea o heterogénea) fueron dos factores entre sujetos, y las dos medidas repetidas (de Δf o SI) tomadas a diferentes intervalos generacionales se trataron como un factor dentro de los sujetos. En estos análisis, los factores focales entre sujetos evalúan los efectos de nuestros tratamientos experimentales y los factores dentro de los sujetos evalúan si el patrón de evolución cambió durante el curso de nuestro experimento. Esta estrategia analítica se basa en el hecho de que rastreamos la dinámica de frecuencia en líneas replicadas e independientes y el efecto no focal de la deriva genética aleatoria, que se predice que será sustancial para la dinámica del ADNmt, forma parte del término residual de nuestros modelos inferenciales. Las pruebas F convencionales de los factores entre sujetos se validaron mediante pruebas de permutación, basadas en 9.999 permutaciones aleatorias de datos. La media del I para los diferentes grupos se evaluó utilizando IC del 95% de 9999 réplicas de datos de arranque.

Estimaciones de la fuerza de la selección dependiente de frecuencia

También deseábamos evaluar de manera más explícita si la fuerza de la selección dependiente de frecuencia en HI e HII difería entre los dos tratamientos experimentales ambientales (homogéneos / heterogéneos). Para permitir esto, derivamos medidas simples de selección dependiente de la frecuencia de nuestros datos empíricos utilizando la siguiente justificación. El modelado explícito previo de datos no experimentales en este sistema ha demostrado que el mejor ajuste con los datos dinámicos de frecuencia de haplotipos se produce cuando no hay selección positiva o negativa en estos haplotipos de ADNmt, pero si hay selección negativa dependiente de la frecuencia que es igualmente fuerte en ambos haplotipos . Consideramos los dos haplotipos de ADNmt HI e HII, con las frecuencias pI y pII ( pI + pII = 1) y los ajustes WI y WII. La generación de cambio en el pI es el dado por

$$ \Delta {p}_I=\frac{p_I{p}_{II}\left({W}_I-{W}_{II}\right)}{\overline{W}} $$

las Observaciones de ambas poblaciones naturales (ver Fig. 1; Archivo adicional 1) y las poblaciones replicadas de jaulas de laboratorio también sugieren que la selección es simétrica con un equilibrio para los dos haplotipos HI e HII en la vecindad de pI = pII = 0.5. Suponiendo (i) una frecuencia de equilibrio de pI = pII = 0.5, (ii) que la aptitud de los haplotipos está relacionada linealmente con la frecuencia de los haplotipos y (iii) que la selección es simétrica, todo lo cual está respaldado por estudios previos , alcanzamos

$$ {W}_I = 1 – {p}_I{s}_I $$

$$ {W}_{II} = 1 – {p}_{II}{s}_I $$

donde sI es el coeficiente de selección dependiente de la frecuencia. Dado que $ \overline{W}={p}_I{W}_I+{p}_{II}{W}_{II} $ entonces podemos estimar sI a partir de nuestras observaciones empíricas de ΔpI como

$$ {s}_I=\frac{-\Delta {p}_I{p}_I-\Delta {p}_I{p}_{II}}{-\Delta {p}_I{p_{II}}^2-{p_I{p}_{II}}^2+{p_I}^2{p}_{II}-\Delta {p}_I{p_I}^2} $$

Definido de esta manera, sI se asume una escala arbitraria, pero es positivo cuando de ΔpI de cambios hacia el atractor y negativo cuando se cambia de distancia del atractor. Para cada jaula, se estimaron dos medidas repetidas independientes de sI basadas en los cambios de frecuencia de haplotipos observados entre las generaciones 0-5 y 5-10, respectivamente. Notamos que nuestra medida será precisa cuando el equilibrio verdadero esté cerca de pI = pII = 0.5, pero más aproximada si el equilibrio verdadero se desvía de esta condición.