Negativ frekvensavhengig seleksjon bidrar til opprettholdelsen av en global polymorfisme i mitokondrielt DNA / BMC Økologi Og Evolusjon

Konstruksjon av Mito-nukleære introgresjonslinjer
Grunnleggelsen av de eksperimentelle evolusjonspopulasjonene
Vedlikehold av eksperimentelle evolusjonspopulasjoner
Sekvensering og mitogenom samlinger
Estimering av mtDNA haplotype frekvenser
Statistiske analyser
Estimater av styrken av frekvensavhengig seleksjon

Konstruksjon av Mito-nukleære introgresjonslinjer

for å isolere de genetiske effektene av mtDNA fra det nukleære genomet, ble våre eksperimenter basert på mitonukleære introgresjonslinjer (MNILs). Byggingen av Våre MNILs er forklart i detalj I Kurbalija Novicic et al. . Kort sagt, alle MNILs brukt ble laget fra isofemale linjer (IFLs), som hver ble grunnlagt av en enkelt vill-samlet parret kvinne med opprinnelse fra en felles enkelt naturlig befolkning (Sicevo Gorge-Serbia, S 43°19’55.58″ N 22°0837.98″). Linjer ble først genotypet for deres mtDNA haplotype ved hjelp av restriksjonsenzymer, og vi valgte seks Ifl, hvorav tre bar HI haplotyper og tre HII haplotyper, hver av dem ble deretter tilbakekrysset med en felles syvende IFL («D»). I HVER MNIL ble backcrossing utført ved å parre 10 jomfruhunner fra EN gitt IFL med 20 menn Fra D-linjen. Vi brukte denne gjentatte introgressive backcrossing-prosedyren for 12 påfølgende generasjoner for å erstatte det nukleare genomet AV EN gitt IFL med det vanlige utavlede d-nukleære genomet (> 99,95% erstattet). Merk at IFLs ikke var innavlet eller på annen måte gjort isogen. For å utelukke muligheten for forurensning under introgression ble mtDNA-integriteten til Alle MNILs validert ved generasjon 5, 8 og 12 ved genotyping av en prøve fluer fra hver MNIL. Vi har også vist For Tilstedeværelse Av Wolbachia i alle MNILs, VED EN PCR-analyse ved HJELP av 16s rDNA Wolbachia-spesifikke primere ved hjelp av metoder beskrevet I Garcupuna-Mart5eznez et al. . Vi brukte to forskjellige Drosophila-stammer som inneholdt Wolbachia som positive kontroller(d. melanogaster stock no. 5, Bloomington Stock Centre, D. simulans, Riverside strain). DISSE PCR-analysene var negative for alle Våre MNILs så vel som For D-linjen. Alle linjer ble opprettholdt og alle eksperimenter utført under konstante laboratorieforhold, ved 19 °C, 60% relativ fuktighet, lys på 300 lx og ved en fotoperiode på 12 timer lys: 12 timer mørk.

Grunnleggelsen av de eksperimentelle evolusjonspopulasjonene

Før forsøkene slo vi sammen de tre Mnilene som bærer HI inn i EN HI-kildepopulasjon og de tre HII-Mnilene inn i EN HII-kildepopulasjon for å homogenisere potensiell nukleær genetisk variasjon over MNILs. Dette ble gjort ved å blande 100 voksne fluer fra HVER MNIL, i to populasjonsbur (dvs., N = 3 × 100 fluer per bur) (Pleksiglasmerder, L25 cm X B15 cm xh15 cm, med 3 retter som hver inneholder 30 ml maismel) og opprettholder disse for en påfølgende full generasjon under standard laboratorieforhold. De to kildepopulasjonene bar således ENTEN HI eller hii mtDNA haplotype, uttrykt i en utavlet og felles nukleær genetisk bakgrunn (dvs.D). Jomfrufluer fra disse to kildepopulasjonene ble deretter sexet og pleide å finne de eksperimentelle evolusjonspopulasjonene.

vi initierte N = 12 eksperimentelle evolusjonspopulasjoner. I hver populasjon ble N = 100 jomfrufluer (kjønnsratio 1:1) i alderen 3-5 dager introdusert fra kildepopulasjonen inn i et populasjonsbur (L25 cm X W15 cm xh15 cm). Vi varierte startfrekvensen FOR HI-og HII-haplotyper og matressursbetingelser på tvers av populasjoner, ved å bruke en 2 × 2 krysset design (N = 3 populasjoner per celle), på følgende måte. I halvparten av burene var 80% av grunnfluene FRA HI-kildepopulasjonen og 20% fra hii-kildepopulasjonen. I den andre halvdelen var 20% av de grunnleggende fluene FRA HI-kildepopulasjonen og 80% fra hii-kildepopulasjonen. Når det gjelder matressursbetingelser, var mengden medium (både volum og overflate) identisk i de to behandlingsgruppene, mens populasjonsvariasjon i næringskonsentrasjon ble manipulert som følger. Halvparten av merdene (homogene matforhold) inneholdt 3 identiske matretter, hver med 30 ml standard maismelmedium (YC) som inneholdt 1,5% gjær. Den andre halvdelen av burene (heterogene matforhold) inneholdt også 3 retter hver med 30 ml standardmedium, men disse varierte i gjærkonsentrasjon(YL-0,375%, YC-1,5%, YH – 6%).

Vedlikehold av eksperimentelle evolusjonspopulasjoner

Populasjoner ble opprettholdt i laboratoriet på en måte som sikret diskrete generasjoner, 40 dager/syklus , ved 19 °C, 60% relativ fuktighet og en 12 h lys: 12 h mørk syklus. På dag 40 ble de tre gamle matrettene erstattet av tre nye og fluer ble tillatt i totalt 9 dager for oviposisjon . De nye rettene, som inneholdt egg og larver, ble deretter fjernet fra alle voksne og overført til et nytt bur for å starte neste generasjon. Alle voksne fluer i hvert gammelt bur ble deretter telt, når de var døde.

Sekvensering og mitogenom samlinger

Før haplotype frekvens estimering (se nedenfor), vi sekvensert og samlet alle mtDNA haplotyper brukt. DNA ble ekstrahert fra DE SEKS IF-linjene (HI: 1, 3, 5; HII: 21, 25, 29) som ble brukt til å lage MNILs, ved hjelp av en salt-etanol-utfellingsprotokoll. Fluer ble først forsiktig oppblusset og plassert i forberedelsesbuffer (100 mM Nacl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) sammen med proteinase K, virvlet og inkubert ved 50 °C over natten. Prøvene ble deretter frosset over natten. FOR å utfelle DNA, vi lagt mettet NaCl flere ganger før du legger 95% etanol, og vi spunnet DNA i en pellet. DNA-pelleten ble suspendert I te 4 buffer (pH = 7,6). DNA kvalitet og kvantitet ble vurdert Ved Hjelp Av NanoDrop, Qubit og Bioanalyzer, etterfulgt av fragment lengde vurdering på en agarose gel.

Sekvenseringsbiblioteker ble utarbeidet fra 100 NG DNA ved Hjelp Av TruSeq PCRfree DNA library preparation kit. De seks prøvene ble deretter sekvensert til 125 bp parret-end leser i to baner På En Illumina HiSeq2500 system ved hjelp av v4 sekvensering kjemi. Totalt sekvenserte vi i gjennomsnitt 194 millioner leser for hvert bibliotek. Mitogenomer fra de seks prøvene ble deretter samlet ved hjelp av en 5% delmengde av det totale antall leser fra hvert bibliotek. Leser ble matet Til MITObim V 1.8 algoritmen OG MIRA v 4.0.2 assembler, for å utføre guidede forsamlinger, ved hjelp Av Drosophila pseudoobscura mitogenome (GenBank: FJ899745. 1) som referansegenom. Alle oppnådde forsamlinger var sirkulære mitogenomer med en størrelse på nesten 16kbp. De endelige forsamlingene ble deretter justert ved Hjelp Av ClustalW og MAFFT, og manuelt kuratert for å oppnå en endelig polert samling for hver haplotype. De monterte mitogenomene ble kommentert ved HJELP AV DOGMER og MITOER, ved hjelp av standardparameterinnstillinger, og til slutt manuelt kuratert.

for å vurdere gyldigheten av vår mitogenome montering, alle Drosophila subobscura mtDNA sekvenser tilgjengelig På GenBank (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, rrnS, A + T rich region, og flere trna), totalt dekker mer enn 50% av den totale montering, ble justert mot våre mitogenomer. Uten unntak viste disse > 99% sekvensidentitet.

Flere unike Snper ble funnet i hver av de seks mitogenome haplotype (se nedenfor), hvorav to konsekvent utmerket HI og HII haplotype grupper. Dekningsdybde for HVER SNP ble verifisert ved å kartlegge lesingene som ble brukt til mitogenome-samlingen ved Hjelp Av Bowtie v 1.2 . Dette arbeidet bekreftet Alle SNPs identifisert i forsamlingen trinn. Her fokuserer vi på de to viktigste haplotypegruppene I OG II, som viser et slående og konsistent mønster av polymorfisme i befolkningen på tvers av populasjoner(Fig. 1) og funksjonelle fenotypiske forskjeller(Se Innledning). Selv Om Snper forekommer innenfor hver av de to haplotypegruppene, er Slike Snper sjeldne (f. eks.) og er ikke konsekvent polymorfe.

Estimering av mtDNA haplotype frekvenser

vi brukte pool-seq for å estimere haplotype frekvensutvikling, ved å sekvensere prøver av fluer fra 5.og 10. generasjon av hver eksperimentell evolusjonspopulasjon. I hver prøve ble 105 tilfeldig valgte fluer per bur samlet og utsatt FOR DNA-ekstraksjon (i grupper på 15) og sekvenseringsbibliotekpreparater som beskrevet ovenfor. N = 24 prøvene ble deretter sekvensert til 125 bp parret-end leser i to baner På En Illumina HiSeq2500 system, ved hjelp av v4 sekvensering kjemi. Vår pool-seq-innsats ble designet for å gi tilstrekkelig sekvenseringsdybde for nøyaktig estimering av mtDNA haplotype-frekvenser, men tillater ikke detaljerte analyser av det nukleare genomet.

vi sekvenserte i gjennomsnitt 66 millioner leser for hvert bibliotek. Leser fra hvert bibliotek ble deretter kartlagt tilbake til de seks monterte mitogenomene, og beholdt bare unike og null-mismatch mappings ved Hjelp Av Bowtie v 1.2 . Antall lesekartlegging til de to Snp – ene som skiller HI-og HII-typene (I Nad5 og i 12s rRNA) ble deretter telt og brukt som vårt estimat av den relative frekvensen av hver hoved haplotype (HI eller HII) i hver prøve.

Statistiske analyser

for hver prøve ble alle lesekartlegginger til de to diagnostiske Snp-ene (se nedenfor) regnet som ENTEN AV TYPE HI eller TYPE hii. Andelen HI-leser for de to forskjellige Snpene var veldig nært korrelert faktisk over de 24 prøvene (r = 0.987), slik at begge markørene ga nesten identiske estimater. Her, vi brukte den gjennomsnittlige andelen på tvers av Begge SNPs her for å anslå frekvensen AV HI stede i hver pool-seq prøve.

Evolusjon kan defineres som endringer i genotypefrekvenser i en populasjon, og vårt design tillot oss å utlede to temporalt separerte gjentatte mål per generasjon haplotype frekvensendringer i vår hver utviklende linje som Enten Δ 0 – 5 = (f5-f0)/5 eller Δ 5–10 = (f10 – f5) / 5 hvor abonnementer angir generasjonen hvor prøven ble samlet inn. I tillegg estimerte Vi ③f0 – 10 = (f10 – f0)/10 for å vurdere netto haplotype frekvensendring. Fordi bare to genotyper var involvert, frekvensen AV HI: fI = 1-fII, og vi begrenser dermed våre analyser til endringer i frekvensen av en av haplotypene. For hvert Estimat Av Δ utledet vi også en frekvensavhengig seleksjonskoeffisient (SI) som tilsvarer styrken på seleksjonen som kreves for å forårsake den observerte endringen i haplotypefrekvenser (se nedenfor).

hver utviklende linje representerer en observasjonsenhet i vårt design, og vi analyserte derfor våre data ved hjelp av gjentatte tiltak ANOVAs (dvs.innen-fag ANOVAs). Her representerer hver linje forsøkspersonen, og startfrekvensen FOR HI (0,2 eller 0,8) og miljøtilstand (homogen eller heterogen) var to faktorer mellom forsøkspersonene, og de to gjentatte tiltakene (Av Δ eller SI) tatt med ulike generasjonsintervaller ble behandlet som en innen forsøkspersonsfaktor. I disse analysene tester fokus mellom-fagfaktorene for effekter av våre eksperimentelle behandlinger og innenfaktorfaktorene om evolusjonsmønsteret endret seg i løpet av eksperimentet vårt. Denne analytiske strategien bygger på det faktum at vi sporer frekvensdynamikk i replikerte og uavhengige linjer, og den ikke-fokale effekten av tilfeldig genetisk drift, som antas å være betydelig for mtDNA-dynamikk, utgjør en del av restperioden for våre inferensielle modeller. Konvensjonelle f-tester av mellom-fagfaktorene ble validert ved hjelp av permutasjonstester, basert på 9999 tilfeldige permutasjoner av data. Gjennomsnittlig SI for ulike grupper ble vurdert ved bruk av 95% CI fra 9999 bootstrap replikater av data.

Estimater av styrken av frekvensavhengig seleksjon

vi ønsket også mer eksplisitt å vurdere om styrken av frekvensavhengig seleksjon på HI og HII var forskjellig på tvers av de to miljøforsøklige behandlingene (homogen / heterogen). For å tillate dette, utledet vi enkle mål av frekvensavhengig utvalg fra våre empiriske data ved hjelp av følgende begrunnelse. Tidligere eksplisitt modellering av ikke-eksperimentelle data i dette systemet har vist at den beste passformen med haplotype frekvensdynamiske data oppstår der det ikke er positiv eller negativ seleksjon på disse mtDNA haplotyper, men hvor det er negativ frekvensavhengig seleksjon som er like sterk på begge haplotyper . Vi betrakter de to mtDNA haplotypene HI OG HII, med frekvensene pI og pII (pI + pII = 1) OG fitnesses WI OG WII. Per-generasjonsendringen i pI er da gitt av

$$ \Delta {p}_I=\frac{p_I{p} _ {II} \ venstre({W}_I – {W} _ {II}\høyre)} {\overline{W}} $$

Observasjoner fra begge naturlige populasjoner (Se Fig. 1; Tilleggsfil 1) og replikerte laboratorieburpopulasjoner foreslår også at utvalget er symmetrisk med en likevekt for de to haplotypene HI OG HII i nærheten av pI = pII = 0.5. Forutsatt (i) en likevektsfrekvens av pI = pII = 0.5, (ii) at haplotype fitness er lineært relatert til haplotype frekvens og (iii) at valget er symmetrisk, som alle støttes av tidligere studier, oppnår vi

$$ {W}_i = 1 – {p}_i{s}_I $$

$$ {W} _ {II} = 1 – {p} _ {II}{s}_I $$

hvor sI er frekvensavhengig utvalgskoeffisient. Gitt at \ (\overline{W}={p}_I{W}_I + {p}_{II}{W}_{II} \) kan vi da estimere sI fra våre empiriske observasjoner av Δ som

$$ {s}_i=\Frac{-\Delta {p}_i{p}_i-\Delta {p}_i{P}_{II}}{-\Delta {p}_i{P_{II}}^2-{p_I{p}_{II}}^2+{p_I}^2{P}_{II}- \ Delta {p}_i{p_I}^2} $$

Definert på denne måten, antar sI en vilkårlig skala, men er positiv når Av Δ endres mot attraktoren og negativ når den endres bort fra attraktoren. For hvert bur estimerte vi to uavhengige gjentatte målinger av sI basert på de observerte haplotypefrekvensendringene mellom henholdsvis generasjonene 0-5 og 5-10. Vi merker oss at vårt mål vil være nøyaktig når den sanne likevekten er nær pI = pII = 0,5, men mer omtrentlig hvis den sanne likevekten avviker fra denne tilstanden.