Negative frequenzabhängige Selektion trägt zur Aufrechterhaltung eines globalen Polymorphismus in der mitochondrialen DNA bei

Konstruktion von mito-nuklearen Introgressionslinien

Um die genetischen Effekte von mtDNA aus dem Kerngenom zu isolieren, basierten unsere Experimente auf mitonukleären Introgressionslinien (MNILs). Der Aufbau unserer MNILs wird in Kurbalija Novicic et al. . Kurz gesagt, alle verwendeten MNILs wurden aus isofemalen Linien (IFLs) hergestellt, von denen jede von einem einzigen wild gesammelten verpaarten Weibchen aus einer gemeinsamen natürlichen Population (Sicevo-Schlucht-Serbien, S 43 ° 19’55.58 “ N 22 ° 0837.98 „) gegründet wurde. Die Linien wurden zuerst mit Restriktionsenzymen auf ihren mtDNA-Haplotyp genotypisiert, und wir wählten sechs IFLs aus, von denen drei HI-Haplotypen und drei HII-Haplotypen trugen, von denen jeder dann mit einer gemeinsamen siebten IFL („D“) rückkreuzt wurde. In jedem MNIL wurde die Rückkreuzung durchgeführt, indem 10 jungfräuliche Weibchen aus einer bestimmten IFL mit 20 Männchen aus der D-Linie gepaart wurden. Wir verwendeten dieses wiederholte introgressive Rückkreuzungsverfahren für 12 nachfolgende Generationen, um das Kerngenom einer gegebenen IFL durch das gemeinsame Outbred D-Kerngenom (> 99,95% ersetzt) zu ersetzen. Beachten Sie, dass IFLs nicht Inzucht oder anderweitig isogen gemacht wurden. Um die Möglichkeit einer Kontamination während der Introgression auszuschließen, wurde die mtDNA-Integrität aller MNILs bei Generation 5, 8 und 12 durch Genotypisierung einer Probe von Fliegen aus jedem MNIL validiert. Wir haben auch auf das Vorhandensein von Wolbachia in allen MNILs gescreent, durch einen PCR-Assay unter Verwendung von 16S rDNA Wolbachia-spezifischen Primern unter Verwendung von Methoden, die in García-Martínez et al. . Wir verwendeten zwei verschiedene Drosophila-Stämme, die Wolbachia als Positivkontrollen enthielten (D. melanogaster Stock no. 5, Bloomington Stock Centre, D. simulans, Riverside strain). Diese PCR-Assays waren für alle unsere MNILs sowie für die D-Linie negativ. Alle Linien wurden beibehalten und alle Experimente unter konstanten Laborbedingungen durchgeführt, bei 19 ° C, 60% relativer Luftfeuchtigkeit, Licht von 300 lx und bei einer Photoperiode von 12 h Licht: 12 h dunkel.

Gründung der experimentellen Evolutionspopulationen

Vor den Experimenten haben wir die drei MNILs, die HI tragen, zu einer HI-Quellpopulation und die drei HII-MNILs zu einer HII-Quellpopulation zusammengeführt, um mögliche kerngenetische Variationen über MNILs hinweg zu homogenisieren. Dies wurde durch Mischen von 100 erwachsenen Fliegen aus jedem MNIL in zwei Populationskäfigen (d.h., N = 3 × 100 Fliegen pro Käfig) (Plexiglaskäfige, L25 cm x B15 cm x H15 cm, mit 3 Schalen mit je 30 ml Maismehl) und halten diese für eine nachfolgende volle Generation unter Standardlaborbedingungen. Die beiden Quellpopulationen trugen somit entweder den HI- oder den HII-mtDNA-Haplotyp, der in einem ausgezüchteten und gemeinsamen kerngenetischen Hintergrund (d. h. D) exprimiert wurde. Jungfräuliche Fliegen aus diesen beiden Quellpopulationen wurden dann sexed und verwendet, um die experimentellen Evolutionspopulationen zu finden.

Wir initiierten N = 12 experimentelle Evolutionspopulationen. In jeder Population wurden N = 100 jungfräuliche Fliegen (Geschlechterverhältnis 1: 1) im Alter von 3-5 Tagen aus den Quellpopulationen in einen Populationskäfig (L25 cm x B15 cm x H15 cm) eingeführt. Wir variierten die Starthäufigkeit von HI- und HII-Haplotypen und Nahrungsressourcenbedingungen über Populationen hinweg unter Verwendung eines 2 × 2-gekreuzten Designs (N = 3 Populationen pro Zelle) auf folgende Weise. In der Hälfte der Käfige stammten 80% der Gründungsfliegen aus der HI-Quellpopulation und 20% aus der HII-Quellpopulation. In der anderen Hälfte stammten 20% der Gründungsfliegen aus der HI-Quellpopulation und 80% aus der HII-Quellpopulation. In Bezug auf die Nahrungsressourcenbedingungen war die Menge an Medium (sowohl nach Volumen als auch nach Oberfläche) in den beiden Behandlungsgruppen identisch, während die Variation der Nährstoffkonzentration innerhalb der Population wie folgt manipuliert wurde. Die Hälfte der Käfige (homogene Futterbedingungen) enthielt 3 identische Futterschalen mit jeweils 30 ml Standardmaismehlmedium (YC) mit 1,5% Hefe. Die andere Hälfte der Käfige (heterogene Futterbedingungen) enthielt ebenfalls 3 Schalen mit je 30 ml Standardmedium, diese unterschieden sich jedoch in der Hefekonzentration (YL-0,375%, YC- 1,5%, YH- 6%).

Aufrechterhaltung der experimentellen Evolutionspopulationen

Die Populationen wurden im Labor auf eine Weise aufrechterhalten, die diskrete Generationen, 40 Tage / Zyklus, bei 19 ° C, 60% relativer Luftfeuchtigkeit und einem 12-h-Licht: 12-h-Dunkelzyklus sicherstellte. Am Tag 40 wurden die drei alten Futterschalen durch drei neue ersetzt und Fliegen durften insgesamt 9 Tage zur Eiablage . Die neuen Schalen, die Eier und Larven enthielten, wurden dann von Erwachsenen befreit und in einen neuen Käfig gebracht, um die nächste Generation zu starten. Alle erwachsenen Fliegen in jedem alten Käfig wurden dann gezählt, sobald sie tot waren.

Sequenzierung und Mitogenomanordnungen

Vor der Haplotypfrequenzschätzung (siehe unten) sequenzierten und montierten wir alle verwendeten mtDNA-Haplotypen. DNA wurde aus den sechs IF-Linien (HI: 1, 3, 5; HII: 21, 25, 29) extrahiert, die zur Erzeugung der MNILs verwendet wurden, unter Verwendung eines Salz-Ethanol-Fällungsprotokolls. Fliegen wurden zunächst schonend mazeriert und in Präparationspuffer (100 mM NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) zusammen mit Proteinase K gegeben, vortext und über Nacht bei 50°C inkubiert. Die Proben wurden dann über Nacht eingefroren. Um DNA auszufällen, fügten wir mehrmals gesättigtes NaCl hinzu, bevor wir 95% Ethanol hinzufügten, und wir drehten die DNA zu einem Pellet. Das DNA-Pellet wurde in TE 4-Puffer (pH = 7,6) suspendiert. Die DNA-Qualität und -quantität wurde mit NanoDrop, Qubit und Bioanalyzer bewertet, gefolgt von einer Fragmentlängenbewertung auf einem Agarosegel.

Sequenzierungsbibliotheken wurden aus 100 ng DNA mit dem TruSeq PCRfree DNA Library preparation Kit hergestellt. Die sechs Proben wurden dann in zwei Spuren auf einem Illumina HiSeq2500-System unter Verwendung der v4-Sequenzierchemie auf 125 bp-Lesevorgänge am gepaarten Ende sequenziert. Insgesamt sequenzierten wir durchschnittlich 194 Millionen Lesevorgänge für jede Bibliothek. Mitogenome aus den sechs Proben wurden dann unter Verwendung einer 5% igen Teilmenge der Gesamtzahl der Lesevorgänge aus jeder Bibliothek zusammengestellt. Lesevorgänge wurden dem mitobim V 1.8-Algorithmus und dem MIRA V 4.0 zugeführt.2 assembler, um geführte Assemblierungen unter Verwendung des Drosophila pseudoobscura-Mitogenoms (GenBank: FJ899745.1) als Referenzgenom durchzuführen. Alle erhaltenen Baugruppen waren kreisförmige Mitogenome mit einer Größe von fast 16 kbp. Die endgültigen Baugruppen wurden dann mit ClustalW und MAFFT ausgerichtet und manuell kuratiert, um eine endgültige polierte Baugruppe für jeden Haplotyp zu erhalten. Die zusammengesetzten Mitogenome wurden mit DOGMA und MITOS mit Standardparametereinstellungen annotiert und schließlich manuell kuratiert.

Um die Validität unserer Mitogenomassemblierung zu beurteilen, wurden alle auf der GenBank verfügbaren mtDNA-Sequenzen von Drosophila subobscura (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, rRNS, die A + T-reiche Region und mehrere Trna), die insgesamt mehr als 50% der Gesamtassemblierung abdeckten, gegen unsere Mitogenome ausgerichtet. Diese zeigten ausnahmslos > 99% Sequenzidentität.

In jedem der sechs Mitogenom-Haplotypen (siehe unten) wurden mehrere eindeutige SNPs gefunden, von denen zwei konsequent die HI- und HII-Haplotypgruppen unterschieden. Die Abdeckungstiefe für jedes SNP wurde verifiziert, indem die für die Mitogenomassemblierung verwendeten Lesewerte unter Verwendung von Bowtie v 1.2 zurück abgebildet wurden. Diese Bemühungen bestätigten alle im Montageschritt identifizierten SNPs. Hier konzentrieren wir uns auf die beiden wichtigsten Haplotypgruppen I und II, die ein auffälliges und konsistentes Muster des Polymorphismus innerhalb der Population über Populationen hinweg zeigen (Abb. 1) und funktionelle phänotypische Unterschiede (siehe Einleitung). Obwohl SNPs innerhalb jeder der beiden Haplotypgruppen auftreten, sind solche SNPs selten (z. B. ) und nicht konsistent polymorph.

Schätzung der mtDNA Haplotyp Frequenzen

Wir verwendeten Pool-seq Haplotyp Frequenzentwicklung zu schätzen, durch Sequenzierung von Proben von Fliegen aus der 5. und 10. In jeder Probe wurden 105 zufällig ausgewählte Fliegen pro Käfig gepoolt und einer DNA-Extraktion (in Gruppen von 15) und Sequenzierungsbibliothekspräparaten wie oben beschrieben unterzogen. Die N = 24 Proben wurden dann in zwei Spuren auf einem Illumina HiSeq2500-System unter Verwendung der v4-Sequenzierchemie auf 125 bp-Lesevorgänge am gepaarten Ende sequenziert. Unsere Pool-Seq-Bemühungen wurden entwickelt, um eine ausreichende Sequenzierungstiefe für eine genaue Schätzung der mtDNA-Haplotypfrequenzen bereitzustellen, erlaubt jedoch keine detaillierten Analysen des Kerngenoms.

Wir sequenzierten im Durchschnitt 66 Millionen Lesevorgänge für jede Bibliothek. Lesevorgänge aus jeder Bibliothek wurden dann den sechs zusammengesetzten Mitogenomen zugeordnet, wobei nur eindeutige und nicht übereinstimmende Zuordnungen unter Verwendung von Bowtie v 1.2 beibehalten wurden. Die Anzahl der Lesevorgänge, die den beiden SNPs zugeordnet waren, die die HI- und HII-Typen unterschieden (in Nad5 und in 12S rRNA), wurden dann gezählt und als Schätzung der relativen Häufigkeit jedes Haupthaplotyps (HI oder HII) in jeder Probe verwendet.

Statistische Analysen

Für jede Stichprobe wurden alle Lesevorgänge, die den beiden diagnostischen SNPs zugeordnet waren (siehe unten), entweder als vom Typ HI oder vom Typ HII gezählt. Der Anteil der HI-Lesewerte für die beiden verschiedenen SNPs korrelierte in den 24 Stichproben sehr eng (r = 0.987), so dass beide Marker praktisch identische Schätzungen lieferten. Hier, Wir haben den mittleren Anteil über beide SNPs hier verwendet, um die Häufigkeit von HI in jeder Pool-Seq-Stichprobe abzuschätzen.

Evolution kann als Änderung der Genotyphäufigkeit innerhalb einer Population definiert werden, und unser Design ermöglichte es uns, zwei zeitlich getrennte wiederholte Messungen der Haplotyphäufigkeitsänderungen pro Generation in jeder sich entwickelnden Linie entweder als Δf0–5 = (f5 – f0) / 5 oder Δf5–10 = (f10 – f5) / 5 wobei Indizes die Generation angeben, bei der die Probe gesammelt wurde. Zusätzlich schätzten wir Δf0-10 = (f10 – f0) / 10, um die Frequenzänderung des Netto-Haplotyps zu bewerten. Da nur zwei Genotypen beteiligt waren, ist die Häufigkeit von HI: fI = 1 – fII, und wir beschränken unsere Analysen daher auf Änderungen der Häufigkeit eines der Haplotypen. Für jede Schätzung von Δf haben wir auch einen frequenzabhängigen Selektionskoeffizienten (SI) abgeleitet, der der Stärke der Selektion entspricht, die erforderlich ist, um die beobachtete Änderung der Haplotypfrequenzen zu verursachen (siehe unten).

Jede sich entwickelnde Linie stellt eine Beobachtungseinheit in unserem Design dar, und wir analysierten daher unsere Daten unter Verwendung von ANOVAs mit wiederholten Messungen (d. H. ANOVAs innerhalb der Probanden). Hier repräsentiert jede Linie das Subjekt, und die Starthäufigkeit von HI (0,2 oder 0,8) und der Umgebungszustand (homogen oder heterogen) waren zwei Faktoren zwischen den Subjekten, und die beiden wiederholten Messungen (von Δf oder SI), die in unterschiedlichen Generationsintervallen durchgeführt wurden, wurden als Faktor innerhalb der Subjekte behandelt. In diesen Analysen, Der fokale Faktor zwischen den Probanden testet die Auswirkungen unserer experimentellen Behandlungen und der Faktor innerhalb der Probanden testet, ob sich das Evolutionsmuster im Verlauf unseres Experiments geändert hat. Diese analytische Strategie stützt sich auf die Tatsache, dass wir die Frequenzdynamik in replizierten und unabhängigen Linien verfolgen und der nicht fokale Effekt der zufälligen genetischen Drift, der für die mtDNA-Dynamik als wesentlich vorhergesagt wird, bildet einen Teil des Restterms unserer Inferenzmodelle. Konventionelle F-Tests der Faktoren zwischen den Probanden wurden unter Verwendung von Permutationstests validiert, basierend auf 9999 zufälligen Permutationen von Daten. Der mittlere SI für verschiedene Gruppen wurde unter Verwendung von 95% KIS aus 9999 Bootstrap-Replikaten von Daten bewertet.

Schätzungen der Stärke der frequenzabhängigen Selektion

Wir wollten auch genauer beurteilen, ob sich die Stärke der frequenzabhängigen Selektion bei HI und HII in den beiden experimentellen Umweltbehandlungen (homogen / heterogen) unterschied. Um dies zu ermöglichen, haben wir aus unseren empirischen Daten einfache Maße der frequenzabhängigen Selektion mit der folgenden Begründung abgeleitet. Frühere explizite Modellierung von nicht-experimentellen Daten in diesem System hat gezeigt, dass die beste Anpassung mit Haplotyp Frequenz dynamischen Daten auftritt, wo es keine positive oder negative Selektion auf diesen mtDNA Haplotypen, aber wo es negative frequenzabhängige Selektion, die auf beiden Haplotypen gleich stark ist . Wir betrachten die beiden mtDNA-Haplotypen HI und HII mit den Frequenzen pI und pII (pI + pII = 1) und den Fitnesspunkten WI und WII. Die Änderung des pI pro Generation ist dann gegeben durch

$$ \ Delta {p}_I=\frac{p_I{p}_{II}\links({W}_I-{W}_{II}\rechts)}{\overline{W}} $$

Beobachtungen aus beiden natürlichen Populationen (siehe Abb. 1; Zusätzliche Datei 1) und replizierte Laborkäfigpopulationen legen auch nahe, dass die Selektion symmetrisch ist mit einem Gleichgewicht für die beiden Haplotypen HI und HII in der Nähe von pI = pII = 0,5. Angenommen (i) eine Gleichgewichtsfrequenz von pI = pII = 0.5, (ii) dass die Haplotyp-Fitness linear mit der Haplotyp-Häufigkeit zusammenhängt und (iii) dass die Selektion symmetrisch ist, was alle durch frühere Studien gestützt wird, erreichen wir

$$ { W}_I=1-{p}_I{s}_I $$
$$ { W}_{II}=1-{p}_{II}{s}_I $$

wobei sI der frequenzabhängige Selektionskoeffizient ist. Da \( \overline{W}={p}_I{W}_I+{p}_{II}{W}_{II} \) können wir dann SI aus unseren empirischen Beobachtungen von ΔpI als schätzen

$$ { s}_I=\frac{-\Delta {p}_I{p}_I-\Delta {p}_I{p}_{II}}{-\Delta {p}_I{p_{II}}^2-{p_I{p}_{II}}^2+{p_I}^2{p}_{II}-\Delta {p}_I{p_I}^2} $$

Auf diese Weise definiert, nimmt sI eine beliebige Skala an, ist aber positiv, wenn sich ΔpI zum Attraktor hin ändert, und negativ, wenn es sich vom Attraktor weg ändert. Für jeden Käfig schätzten wir zwei unabhängige wiederholte Messungen von sI basierend auf den beobachteten Haplotyp-Frequenzänderungen zwischen den Generationen 0-5 bzw. 5-10. Wir stellen fest, dass unser Maß genau ist, wenn das wahre Gleichgewicht nahe pI = pII = 0,5 liegt, aber ungefährer, wenn das wahre Gleichgewicht von dieser Bedingung abweicht.



+