negativ frekvensafhængig selektion bidrager til opretholdelsen af en global polymorfisme i mitokondrie-DNA

konstruktion af Mito-nukleare introgressionslinjer

for at isolere de genetiske virkninger af mtDNA fra det nukleare genom var vores eksperimenter baseret på mitonukleære introgressionslinjer (mnils). Konstruktionen af vores MNILs forklares detaljeret i Kurbalija Novicic et al. . Kort sagt blev alle anvendte MNILs oprettet fra isofemale linjer (IFLs), som hver blev grundlagt af en enkelt vildsamlet parret kvinde, der stammer fra en fælles enkelt naturlig befolkning (Sicevo Gorge-Serbien, S 43 Til 19’55,58″ N 22 til 0837,98″). Linjer blev først genotypet for deres mtDNA-haplotype ved hjælp af begrænsningssymboler, og vi valgte seks IFL ‘ er, hvoraf tre bar HI-haplotyper og tre HII-haplotyper, som hver derefter blev krydset med en fælles syvende IFL (“D”). I hver MNIL, backcrossing blev udført ved parring 10 jomfruhunner fra en given IFL med 20 hanner fra D-linjen. Vi brugte denne gentagne introgressive backcrossing-procedure i 12 efterfølgende generationer til at erstatte det nukleare genom af en given IFL med det fælles udbrødte d-nukleare genom (> 99,95% erstattet). Bemærk, at IFL ‘ er ikke blev indavlet eller på anden måde gjort isogene. For at udelukke muligheden for kontaminering under introgression blev mtDNA-integriteten af alle MNILs valideret ved generation 5, 8 og 12 ved genotypebestemmelse af en prøve af fluer fra hver MNIL. Vi screenede også for tilstedeværelsen af Ulvbachia i alle MNILs, ved en PCR-analyse ved hjælp af 16S rDNA Ulvbachia-specifikke primere ved hjælp af metoder, der er beskrevet i Garca. . Vi brugte to forskellige Drosophila-stammer indeholdende Ulvbachia som positive kontroller (D. melanogaster stock no. 5, Bloomington Stock Center, D. simulans, Riverside strain). Disse PCR-analyser var negative for alle vores MNILs såvel som for D-linjen. Alle linjer blev opretholdt, og alle eksperimenter blev udført under konstante laboratoriebetingelser ved 19 liter C, 60% relativ fugtighed, lys på 300 LH og ved en fotoperiode på 12 h lys: 12 h mørk.

grundlæggelse af de eksperimentelle evolutionspopulationer

forud for eksperimenterne samlede vi de tre MNILs, der bar HI ind i en HI-kildepopulation, og de tre HII-MNILs til en HII-kildepopulation for at homogenisere potentiel nuklear genetisk variation på tværs af MNILs. Dette blev gjort ved at blande 100 voksne fluer fra hver MNIL i to populationsbure (dvs., N = 3 100 fluer pr. bur) (Pleksiglas bure, L25 cm H15 cm H15 cm, med 3 retter hver indeholdende 30 ml majsmel) og vedligeholdelse af disse til en efterfølgende fuld generation under standard laboratoriebetingelser. De to kildepopulationer bar således enten HI eller HII mtDNA haplotype, udtrykt i en udbredt og almindelig nuklear genetisk baggrund (dvs.D). Jomfrufluer fra disse to kildepopulationer blev derefter kønnet og brugt til at finde de eksperimentelle evolutionspopulationer.

vi indledte N = 12 eksperimentelle evolutionspopulationer. I hver population blev N = 100 jomfrufluer (kønsforhold 1:1) i alderen 3-5 dage indført fra kildepopulationerne i et befolkningsbur (L25 cm H15 cm hh15 cm). Vi varierede startfrekvensen for HI-og HII-haplotyper og fødevareressourcebetingelser på tværs af populationer ved hjælp af et 2-liters 2 krydset design (N = 3 populationer pr.celle) på følgende måde. I halvdelen af burene var 80% af de grundlæggende fluer fra HI source-befolkningen og 20% fra HII source-befolkningen. I den anden halvdel var 20% af de grundlæggende fluer fra HI source-befolkningen og 80% fra HII source-befolkningen. Med hensyn til fødevareressourcebetingelser var mængden af medium (både efter volumen og overfladeareal) identisk i de to behandlingsgrupper, mens inden for populationsvariation i næringsstofkoncentration blev manipuleret som følger. Halvdelen af burene (homogene fødevareforhold) indeholdt 3 identiske madretter, hver med 30 ml standard majsmelmedium (YC) indeholdende 1,5% gær. Den anden halvdel af burene (heterogene fødevareforhold) indeholdt også 3 retter hver med 30 ml standardmedium, men disse varierede i gærkoncentration (YL-0,375%, YC – 1,5%, YH – 6%).

vedligeholdelse af de eksperimentelle evolutionspopulationer

populationer blev opretholdt i laboratoriet på en måde, der sikrede diskrete generationer , 40 dage/cyklus, ved 19 liter C, 60% relativ fugtighed og en 12 h lys: 12 h mørk cyklus. På Dag 40 blev de tre gamle madretter erstattet af tre nye, og fluer blev tilladt i alt 9 dage til oviposition . De nye retter, der indeholder æg og larver, blev derefter ryddet fra alle voksne og overført til et nyt bur for at starte den næste generation. Alle voksne fluer i hvert gammelt bur blev derefter talt, når de var døde.

Sekventerings-og mitogenomsamlinger

forud for haplotype-frekvensestimeringen (se nedenfor) sekventerede og samlede vi alle anvendte mtDNA-haplotyper. DNA blev ekstraheret fra de seks if-linjer (HI: 1, 3, 5; HII: 21, 25, 29), Der blev brugt til at oprette MNILs, ved hjælp af en salt-ethanoludfældningsprotokol. Fluer blev først forsigtigt macereret og anbragt i præparatbuffer (100 mM NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) sammen med proteinase K, virvlet og inkuberet ved 50 liter C natten over. Prøver blev derefter frosset natten over. For at udfælde DNA tilsatte vi mættet NaCl flere gange, før vi tilsatte 95% ethanol, og vi spandt DNA ‘ et i en pellet. DNA-pelleten blev suspenderet i TE 4-buffer (pH = 7,6). DNA-kvalitet og-kvantitet blev vurderet ved hjælp af NanoDrop, Kvbit og Bioanalysator efterfulgt af fragmentlængdevurdering på en agarosegel.

Sekventeringsbiblioteker blev fremstillet ud fra 100 ng DNA ved hjælp af PCRfree DNA library preparation kit. De seks prøver blev derefter sekventeret til 125 BP parrede endelæsninger i to baner på et Illumina Hisek2500-system ved hjælp af v4-sekventeringskemi. I alt sekventerede vi i gennemsnit 194 millioner læsninger for hvert bibliotek. Mitogenomer fra de seks prøver blev derefter samlet ved hjælp af en 5% delmængde af det samlede antal læsninger fra hvert bibliotek. Læser blev fodret til mitobim V 1.8 algoritme og MIRA V 4.0.2 assembler, til at udføre guidede samlinger ved hjælp af Drosophila pseudoobscura mitogenom (GenBank: FJ899745.1) som referencegenom. Alle opnåede samlinger var cirkulære mitogenomer med en størrelse på næsten 16 KBP. De endelige samlinger blev derefter justeret ved hjælp af Clustalv og MAFFT og manuelt kurateret for at opnå en endelig poleret samling for hver haplotype. De samlede mitogenomer blev kommenteret ved hjælp af dogmer og MITOER ved hjælp af standardparameterindstillinger og til sidst kurateret manuelt.

for at vurdere gyldigheden af vores mitogenomsamling var alle Drosophila subobscura mtDNA-sekvenser tilgængelige på GenBank (Kos1, Kos2, Kos3, Cob, Nad1, Nad2, Nad3, Nad5, rrnl, rrn ‘ er, den A + T-rige region og flere trna), der i alt dækkede mere end 50% af den samlede samling, justeret mod vores mitogenomer. Uden undtagelse viste disse > 99% sekvensidentitet.

flere unikke SNP ‘ er blev fundet i hver af de seks mitogenom haplotype (se nedenfor), hvoraf to konsekvent adskiller Hi-og HII-haplotypegrupperne. Dækningsdybde for hver SNP blev verificeret ved at kortlægge de læsninger, der blev brugt til mitogenomsamlingen ved hjælp af Butterfly v 1.2 . Disse bestræbelser bekræftede alle SNP ‘ er identificeret i samlingstrinnet. Her fokuserer vi på de to vigtigste haplotype grupper i og II, som viser et slående og konsistent mønster af polymorfisme inden for befolkningen på tværs af populationer (Fig. 1) og funktionelle fænotypiske forskelle (se Indledning). Selvom SNP ‘er forekommer inden for hver af de to haplotypegrupper, er sådanne SNP’ er sjældne (f.eks.) og er ikke konsekvent polymorfe.

estimering af mtDNA-haplotypefrekvenserne

vi brugte poolsekv til at estimere haplotypefrekvensudvikling ved at sekvensere prøver af fluer fra 5.og 10. generation af hver eksperimentel evolutionspopulation. I hver prøve blev 105 tilfældigt udvalgte fluer pr. bur samlet og underkastet DNA-ekstraktion (i grupper på 15) og sekventeringsbibliotekspræparater som beskrevet ovenfor. N = 24 prøverne blev derefter sekventeret til 125 BP parrede endelæsninger i to baner på et Illumina Hisek2500-system ved hjælp af v4-sekventeringskemi. Vores pool-sekv-indsats var designet til at give tilstrækkelig sekventeringsdybde til nøjagtig estimering af mtDNA-haplotypefrekvenser, men tillader ikke detaljerede analyser af det nukleare genom.

vi sekventerede i gennemsnit 66 millioner læsninger for hvert bibliotek. Læser fra hvert bibliotek blev derefter kortlagt tilbage til de seks samlede mitogenomer og bevarede kun unikke og nul-mismatch-kortlægninger ved hjælp af Butterfly v 1.2 . Antallet af læsninger, der kortlægges til de to SNP ‘ er, der adskiller Hi-og HII-typerne (i Nad5 og i 12S rRNA) blev derefter talt og brugt som vores skøn over den relative frekvens af hver hovedhaplotype (HI eller HII) i hver prøve.

statistiske analyser

for hver prøve blev alle læsninger kortlægning til de to diagnostiske SNP ‘ er (se nedenfor) talt som værende af enten type HI eller type HII. Andelen af HI reads for de to forskellige SNP ‘ er var meget tæt korreleret faktisk på tværs af de 24 prøver (r = 0.987), således at begge markører gav næsten identiske estimater. Her, vi brugte den gennemsnitlige andel på tværs af begge SNP ‘ er her for at estimere hyppigheden af HI til stede i hver pool-sek-prøve.

Evolution kan defineres som ændringer i genotypefrekvenser inden for en population, og vores design tillod os at udlede to midlertidigt adskilte gentagne målinger af PR.generation haplotype frekvensændringer i vores hver udviklende linje som enten Pripf0–5 = (f5 – f0)/5 eller Pripf5–10 = (f10 – f5)/5, hvor abonnementer angiver den generation, hvor prøven blev opsamlet. Derudover estimerede vi Pristf0 – 10 = (f10 – f0)/10 for at vurdere netto haplotype frekvensændring. Fordi kun to genotyper var involveret, hyppigheden af HI: fI = 1 – fII, og vi begrænser således vores analyser til ændringer i hyppigheden af en af haplotyperne. For hvert estimat af Kurf afledte vi også en frekvensafhængig selektionskoefficient (SI) svarende til den selektionsstyrke, der kræves for at forårsage den observerede ændring i haplotypefrekvenser (se nedenfor).

hver udviklende linje repræsenterer en observationsenhed i vores design, og vi analyserede derfor vores data ved hjælp af gentagne målinger ANOVAs (dvs.inden for emner ANOVAs). Her repræsenterer hver linje emnet, og startfrekvensen for HI (0,2 eller 0,8) og miljømæssig tilstand (homogen eller heterogen) var to faktorer mellem forsøgspersoner, og de to gentagne målinger (af Lutf eller SI) taget med forskellige generationsintervaller blev behandlet som en faktor inden for forsøgspersoner. I disse analyser, fokal mellem-emner faktorer test for effekter af vores eksperimentelle behandlinger og inden-emner faktor tester, om udviklingsmønsteret ændrede sig i løbet af vores eksperiment. Denne analytiske strategi trækker på det faktum, at vi sporer frekvensdynamik i replikerede og uafhængige linjer og den ikke-fokale effekt af tilfældig genetisk drift, som forudsiges at være væsentlig for mtDNA-dynamik, udgør en del af restperioden for vores inferentielle modeller. Konventionelle F-test af faktorerne mellem forsøgspersoner blev valideret ved hjælp af permutationstest baseret på 9999 tilfældige permutationer af data. Gennemsnitlig SI for forskellige grupper blev vurderet ved hjælp af 95% CI ‘ er fra 9999 bootstrap-replikater af data.

estimater af styrken af frekvensafhængig selektion

vi ønskede også mere eksplicit at vurdere, om styrken af frekvensafhængig selektion på HI og HII var forskellig på tværs af de to miljømæssige eksperimentelle behandlinger (homogen / heterogen). For at tillade dette, vi afledte enkle mål for frekvensafhængig udvælgelse fra vores empiriske data ved hjælp af følgende begrundelse. Tidligere eksplicit modellering af ikke-eksperimentelle data i dette system har vist, at den bedste pasform med haplotypefrekvensdynamiske data forekommer, hvor der ikke er nogen positiv eller negativ selektion på disse mtDNA-haplotyper, men hvor der er negativ frekvensafhængig selektion, der er lige så stærk på begge haplotyper . Vi betragter de to mtDNA haplotyper HI og HII, med frekvenserne pI og pII (pI + pII = 1) og fitnesses vi og VII. Generationsændringen i pI gives derefter af

$$ \Delta {p}_I= \ frac{p_I{p}_{II} \ venstre ({B}_I – {B} _ {II}\højre)} {\overline{B}} $$

observationer fra begge naturlige populationer (se Fig. 1; Yderligere fil 1) og replikerede laboratorieburpopulationer antyder også, at udvælgelsen er symmetrisk med en ligevægt for de to haplotyper HI og HII i nærheden af pI = pII = 0,5. Forudsat (i) en ligevægtsfrekvens på pI = pII = 0.5, (ii) at haplotype fitness er lineært relateret til haplotype frekvens og (iii) at udvælgelsen er symmetrisk , som alle understøttes af tidligere undersøgelser, opnår vi

$$ {V}_I=1 – {p}_I{s}_I $$
$$ {V} _ {II}=1 – {p}_{II} {s}_I $$

hvor sI er den frekvensafhængige udvælgelseskoefficient. I betragtning af at \ (\overline{V}={p}_I{V}_I + {p}_{II} {V}_{II} \) kan vi derefter estimere sI ud fra vores empiriske observationer af

$$ {s}_I=\frac{-\Delta {p}_I{p}_I – \ Delta {p}_I{P} _ {II}} {- \Delta {p}_I{p_{II}}^2 – {p_I{p}_{II}}^2 + {p_I}^2{P}_{II} – \ Delta {p}_I{p_I}^2} $$

defineret på denne måde, si antager en vilkårlig skala, men er positiv, når af Prippi skifter mod attraktoren og negativ, når den skifter væk fra attraktoren. For hvert bur estimerede vi to uafhængige gentagne målinger af sI baseret på de observerede haplotypefrekvensændringer mellem generationer 0-5 og 5-10, henholdsvis. Vi bemærker, at vores mål vil være præcis, når den sande ligevægt er nær pI = pII = 0,5, men mere omtrentlig, hvis den sande ligevægt afviger fra denne tilstand.



+