negativt frekvensberoende urval bidrar till upprätthållandet av en global polymorfism i mitokondriellt DNA

konstruktion av Mito-nukleära introgressionslinjer
grundandet av de experimentella evolutionspopulationerna
underhåll av de experimentella evolutionspopulationerna
sekvensering och mitogenomaggregat
uppskattning av mtDNA-haplotypfrekvenserna
statistiska analyser
uppskattningar av styrkan i frekvensberoende val

konstruktion av Mito-nukleära introgressionslinjer

för att isolera de genetiska effekterna av mtDNA från kärngenomet baserades våra experiment på mitonukleära introgressionslinjer (MNILs). Konstruktionen av våra MNILs förklaras i detalj i Kurbalija Novicic et al. . I korthet skapades alla använda MNILs från isofemale lines (IFLs), som var och en grundades av en enda vildsamlad parad kvinna med ursprung i en gemensam enda naturlig befolkning (Sicevo Gorge-Serbien, s 43 19’55.58″ N 22 0837.98″). Linjer genotypades först för sin mtDNA-haplotyp med hjälp av restriktionsenzymer och vi valde sex IFL, varav tre bar HI-haplotyper och tre HII-haplotyper, var och en korsades sedan med en gemensam sjunde IFL (”D”). I varje MNIL, backcrossing utfördes genom parning 10 Jungfru kvinnor från en given IFL med 20 män från D-linjen. Vi använde detta upprepade introgressiva backcrossing-förfarande för 12 efterföljande generationer för att ersätta kärngenomet för en given IFL med det gemensamma utblodade d-kärngenomet (> 99.95% ersatt). Observera att IFL inte inavlades eller på annat sätt gjordes isogena. För att utesluta risken för kontaminering under introgression validerades mtDNA-integriteten hos alla MNILs vid generation 5, 8 och 12 genom genotypning av ett prov av flugor från varje MNIL. Vi screenade också för närvaron av Wolbachia i alla MNILs, genom en PCR-analys med användning av 16S rDNA Wolbachia-specifika primers med hjälp av metoder som beskrivs i Garctuica-Marttuberniz et al. . Vi använde två olika Drosophila-stammar innehållande Wolbachia som positiva kontroller (D. melanogaster stock no. 5, Bloomington Stock Center, D. simulans, Riverside strain). Dessa PCR-analyser var negativa för alla våra MNILs såväl som För D-linjen. Alla linjer bibehölls och alla experiment utfördes under konstanta laboratoriebetingelser, vid 19 kcal C, 60% relativ fuktighet, ljus på 300 lx och vid en fotoperiod på 12 h ljus: 12 h mörk.

grundandet av de experimentella evolutionspopulationerna

före experimenten sammanförde vi de tre MNILs som bär HI till en HI-källpopulation och de tre HII MNILs till en HII-källpopulation för att homogenisera potentiell kärngenetisk variation över MNILs. Detta gjordes genom att blanda 100 vuxna flugor från varje MNIL i två befolkningsburar (dvs.(Plexiglasburar, L25 cm x W15 cm xH15 cm, med 3 rätter vardera innehållande 30 ml majsmjöl) och underhåll av dessa för en efterföljande full generation under normala laboratorieförhållanden. De två källpopulationerna Bar således antingen HI eller HII mtDNA haplotyp, uttryckt i en outbred och gemensam kärngenetisk bakgrund (dvs. D). Jungfruflugor från dessa två källpopulationer könsbestämmades sedan och användes för att hitta de experimentella evolutionspopulationerna.

vi initierade n = 12 experimentella evolutionspopulationer. I varje population infördes N = 100 jungfruflugor (könsförhållande 1:1) i åldern 3-5 dagar från källpopulationerna i en populationsbur (L25 cm x W15 cm xH15 cm). Vi varierade startfrekvensen för HI – och HII-haplotyper och livsmedelsresursförhållanden över populationer, med hjälp av en 2-2-korsad design (N = 3-populationer per cell), på följande sätt. I hälften av burarna var 80% av de grundande flugorna från HI-källpopulationen och 20% från HII-källpopulationen. I den andra hälften var 20% av de grundande flugorna från HI-källpopulationen och 80% från HII-källpopulationen. När det gäller livsmedelsresursförhållanden var mängden medium (både i volym och ytarea) identisk i de två behandlingsgrupperna medan inom populationsvariationen i näringsämneskoncentration manipulerades enligt följande. Hälften av burarna (homogena livsmedelsförhållanden) innehöll 3 identiska maträtter, var och en med 30 ml standard majsmjölmedium (YC) innehållande 1,5% jäst. Den andra halvan av burarna (heterogena livsmedelsförhållanden) innehöll också 3 rätter vardera med 30 ml standardmedium, men dessa skilde sig i jästkoncentration (YL-0,375%, YC – 1,5%, YH – 6%).

underhåll av de experimentella evolutionspopulationerna

populationerna bibehölls i laboratoriet på ett sätt som säkerställde diskreta generationer, 40 dagar/cykel , vid 19 kcal C, 60% relativ fuktighet och en 12 h ljus: 12 h mörk cykel. På dag 40 ersattes de tre gamla maträtterna med tre nya och flugor tilläts totalt 9 dagar för oviposition . De nya rätterna, innehållande ägg och larver, rensades sedan från alla vuxna och överfördes till en ny bur för att starta nästa generation. Alla vuxna flugor i varje gammal bur räknades sedan, när de var döda.

sekvensering och mitogenomaggregat

före haplotypfrekvensuppskattningen (se nedan) sekvenserade och monterade vi alla mtDNA-haplotyper som användes. DNA extraherades från de sex IF-linjerna (HI: 1, 3, 5; HII: 21, 25, 29) som användes för att skapa MNILs med hjälp av ett salt-etanolutfällningsprotokoll. Fluor macererades först försiktigt och placerades i beredningsbuffert (100 mM NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) tillsammans med proteinas K, vortexed och inkuberades vid 50 kcal C över natten. Prover frystes sedan över natten. För att fälla ut DNA tillsatte vi mättad NaCl flera gånger innan vi tillsatte 95% etanol och vi snurrade DNA i en pellet. DNA-pelleten suspenderades i te 4-Buffert (pH = 7,6). DNA-kvalitet och kvantitet bedömdes med NanoDrop, Qubit och Bioanalyzer, följt av fragmentlängdbedömning på en agarosgel.

Sekvenseringsbibliotek framställdes från 100 ng DNA med användning av TruSeq PCRfree DNA library preparation kit. De sex proverna sekvenserades sedan till 125 bp-Parade slutläsningar i två körfält på ett Illumina HiSeq2500-system med användning av v4-sekvenseringskemi. Totalt sekvenserade vi i genomsnitt 194 miljoner läsningar för varje bibliotek. Mitogenomer från de sex proverna samlades sedan med hjälp av en 5% delmängd av det totala antalet läsningar från varje bibliotek. Läsningar matades till mitobim V 1.8-algoritmen och MIRA V 4.0.2 assembler, för att utföra guidade sammansättningar, med Drosophila pseudoobscura mitogenome (GenBank: FJ899745.1) som referensgenom. Alla erhållna aggregat var cirkulära mitogenomer med en storlek på nästan 16 KBP. De slutliga församlingarna justerades sedan med ClustalW och MAFFT och kuraterades manuellt för att erhålla en slutlig polerad montering för varje haplotyp. De sammansatta mitogenomerna antecknades med DOGMA och MITOS , med standardparameterinställningar och slutligen manuellt kuraterade.

för att bedöma giltigheten av vår mitogenomenhet, alla Drosophila subobscura mtDNA-sekvenser tillgängliga på GenBank (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, rrnS, A + T-rika regionen och flera trna), totalt täcker mer än 50% av den totala enheten, justerades mot våra mitogenomer. Utan undantag visade dessa > 99% sekvensidentitet.

flera unika SNP: er hittades i var och en av de sex mitogenomhaplotyperna (se nedan), varav två konsekvent utmärkte HI-och HII-haplotypgrupperna. Täckningsdjupet för varje SNP verifierades genom att kartlägga de läsningar som användes för mitogenomaggregatet med Bowtie v 1.2 . Dessa ansträngningar bekräftade alla SNP som identifierades i monteringssteget. Här fokuserar vi på de två huvudsakliga haplotypgrupperna I och II, som visar ett slående och konsekvent mönster av polymorfism inom befolkningen över populationer (Fig. 1) och funktionella fenotypiska skillnader (se Introduktion). Även om SNP: er förekommer inom var och en av de två haplotypgrupperna är sådana SNP: er sällsynta (t.ex.) och är inte konsekvent polymorfa.

uppskattning av mtDNA-haplotypfrekvenserna

vi använde pool-seq för att uppskatta haplotypfrekvensutveckling genom att sekvensera prover av flugor från 5: e och 10: e generationen av varje experimentell evolutionspopulation. I varje prov poolades 105 slumpmässigt utvalda flugor per bur och utsattes för DNA-extraktion (i grupper om 15) och sekvenseringsbiblioteksberedningar som beskrivits ovan. N = 24-proverna sekvenserades sedan till 125 bp-Parade slutläsningar i två körfält på ett Illumina HiSeq2500-system med användning av v4-sekvenseringskemi. Vår pool-seq-insats var utformad för att ge tillräckligt sekvenseringsdjup för exakt uppskattning av mtDNA-haplotypfrekvenser, men tillåter inte detaljerade analyser av kärngenomet.

vi sekvenserade i genomsnitt 66 miljoner läsningar för varje bibliotek. Läsningar från varje bibliotek kartlades sedan tillbaka till de sex monterade mitogenomerna och behöll endast unika och nollmatchade mappningar med Bowtie v 1.2 . Antalet läsningar som kartlägger till de två SNP: erna som skilde HI-och HII-typerna (i Nad5 och i 12s rRNA) räknades sedan och användes som vår uppskattning av den relativa frekvensen för varje huvudhaplotyp (HI eller HII) i varje prov.

statistiska analyser

för varje prov, alla läser kartläggning till de två diagnostiska SNP: erna (se nedan) räknades som antingen typ HI eller typ HII. Andelen HI-läsningar för de två olika SNP: erna var mycket nära korrelerade faktiskt över 24-proverna (r = 0.987), så att båda markörerna gav nästan identiska uppskattningar. Här använde vi medelandelen över båda SNP: erna här för att uppskatta frekvensen av HI närvarande i varje pool-seq-prov.

Evolution kan definieras som förändringar i genotypfrekvenser inom en population, och vår design gjorde det möjligt för oss att härleda två temporärt separerade upprepade mått på per generation haplotypfrekvensförändringar i vår varje utvecklande linje som antingen Aubbif0–5 = (f5 – f0)/5 eller Aubbif5–10 = (f10 – f5)/5 där Prenumerationer anger den generation där provet samlades in. Dessutom har vi uppskattat Ubic0-10 = (f10 – f0)/10 för att bedöma netto haplotypfrekvensförändring. Eftersom endast två genotyper var inblandade, frekvensen av HI: fI = 1 – fII, och vi begränsar således våra analyser till förändringar i frekvensen hos en av haplotyperna. För varje uppskattning av XXL, härledde vi också en frekvensberoende selektionskoefficient (SI) som motsvarar styrkan i urvalet som krävs för att orsaka den observerade förändringen i haplotypfrekvenser (se nedan).

varje utvecklande linje representerar en observationsenhet i vår design, och vi analyserade därför våra data med hjälp av upprepade mått ANOVAs (dvs. inom-ämnen ANOVAs). Här representerar varje rad ämnet, och startfrekvensen för HI (0,2 eller 0,8) och miljöförhållanden (homogent eller heterogent) var två faktorer mellan ämnen, och de två upprepade måtten (av Kazakf eller SI) som togs med olika generationsintervall behandlades som en faktor inom ämnen. I dessa analyser testar focal between-subjects factors för effekter av våra experimentella behandlingar och inom-subjects factor testar om utvecklingsmönstret förändrades under vårt experiment. Denna analytiska strategi bygger på det faktum att vi spårar frekvensdynamik i replikerade och oberoende linjer och den icke-fokala effekten av slumpmässig genetisk drift, som förutspås vara väsentlig för mtDNA-dynamik, utgör en del av den återstående termen för våra inferentiella modeller. Konventionella F-test av faktorerna mellan försökspersonerna validerades med hjälp av permutationstester, baserat på 9999 slumpmässiga permutationer av data. Medelvärde SI för olika grupper bedömdes med 95% ki från 9999 bootstrap-replikater av data.

uppskattningar av styrkan i frekvensberoende val

vi ville också mer uttryckligen bedöma om styrkan i frekvensberoende val på HI och HII skilde sig över de två miljöexperimentbehandlingarna (homogen / heterogen). För att tillåta detta härledde vi enkla mått på frekvensberoende urval från våra empiriska data med hjälp av följande motivering. Tidigare explicit modellering av icke-experimentella data i detta system har visat att den bästa passformen med haplotypfrekvensdynamiska data inträffar där det inte finns något positivt eller negativt urval på dessa mtDNA-haplotyper men där det finns negativt frekvensberoende urval som är lika starkt på båda haplotyperna . Vi betraktar de två mtDNA-haplotyperna HI och HII, med frekvenserna pI och pII (pI + pII = 1) och fitnesses WI och WII. Förändringen per generation i pI ges sedan av

$$ \Delta {p}_I= \ frac{p_i{p}_{II} \ vänster ({W}_I – {W} _ {II}\höger)} {\overline{W}} $$

observationer från båda naturliga populationerna (se Fig. 1; Ytterligare fil 1) och replikerade laboratorieburpopulationer föreslår också att urvalet är symmetriskt med en jämvikt för de två haplotyperna HI och HII i närheten av pI = pII = 0.5. Förutsatt (i) en jämviktsfrekvens av pI = pII = 0.5, (ii) att haplotypkondition är linjärt relaterad till haplotypfrekvens och (iii) att urvalet är symmetriskt, som alla stöds av tidigare studier, uppnår vi

$$ {W}_I = 1 – {p}_I{s}_I $$

$$ {W} _ {II} = 1 – {p} _ {II}{s}_I $$

där sI är den frekvensberoende urvalskoefficienten. Med tanke på att \ (\overline{W}={p}_I{W}_I+{p}_{II}{W}_{II}\) kan vi sedan uppskatta sI från våra empiriska observationer av

$$ {s}_I= \ frac {- \Delta {p}_I{p}_I- \ Delta {p}_I{P}_{II}} {- \Delta {p}_i{p_{II}}^2 – {p_I{p} _ {II}}^2 + {p_I}^2{p}_{II}- \ Delta {p}_I{p_I}^2} $$

definierat på detta sätt antar sI en godtycklig skala men är positiv när av Xhamster ändras mot attraktorn och negativ när den ändras bort från attraktorn. För varje bur uppskattade vi två oberoende upprepade mått på sI baserat på de observerade haplotypfrekvensförändringarna mellan generationerna 0-5 respektive 5-10. Vi noterar att vårt mått kommer att vara exakt när den sanna jämvikten är nära pI = pII = 0,5 men mer ungefärlig om den sanna jämvikten avviker från detta tillstånd.