selecția dependentă de frecvență negativă contribuie la menținerea unui polimorfism global în ADN-ul mitocondrial

construcția liniilor de Introgresie Mito-nucleare

pentru a izola efectele genetice ale ADNmt de genomul nuclear, experimentele noastre s-au bazat pe linii de introgresie mitonucleară (MNILs). Construcția MNILs noastre este explicată în detaliu în Kurbalija Novicic și colab. . Pe scurt, toate Mnil-urile utilizate au fost create din linii isofemale (IFLs), fiecare dintre acestea fiind fondată de o singură femelă împerecheată colectată sălbatic, originară dintr-o singură populație naturală comună (cheile Sicevo-Serbia, S 43, 19’55.58″ N 22, 0837.98″). Liniile au fost mai întâi genotipate pentru haplotipul lor ADNmt folosind enzime de restricție și am selectat șase IFL-uri, dintre care trei purtau haplotipuri HI și trei haplotipuri HII, fiecare dintre ele fiind apoi încrucișat cu un al șaptelea IFL comun („D”). În fiecare MNIL, backcrossing-ul a fost efectuat prin asocierea a 10 femele Virgine dintr-un IFL dat cu 20 de bărbați din linia D. Am folosit această procedură de backcrossing introgresivă repetată pentru 12 generații ulterioare pentru a înlocui genomul nuclear al unui IFL dat cu genomul nuclear d obișnuit (> 99,95% înlocuit). Rețineți că IFL-urile nu au fost consangvinizate sau făcute în alt mod izogene. Pentru a exclude posibilitatea contaminării în timpul introgresiei, integritatea ADNmt a tuturor Mnil-urilor a fost validată la generațiile 5, 8 și 12 prin genotiparea unui eșantion de muște din fiecare MNIL. De asemenea, am analizat prezența Wolbachiei în toate Mnil-urile, printr-un test PCR folosind primeri specifici 16S ADNR Wolbachia folosind metode detaliate în Garcia Oqusta-Mart Oqlnez și colab. . Am folosit două tulpini diferite de Drosophila care conțin Wolbachia ca martor pozitiv (stocul D. melanogaster nr. 5, Bloomington Stock Center, D. simulans, tulpina Riverside). Aceste teste PCR au fost negative pentru toate Mnil-urile noastre, precum și pentru linia D. S-au menținut toate liniile și s-au efectuat toate experimentele în condiții de laborator constante, la 19 CTC, 60% umiditate relativă, lumină de 300 lx, și la o fotoperioadă de 12 h lumină: 12 h întuneric.

fondarea populațiilor de evoluție experimentală

înainte de experimente, am amalgamat cele trei MNILs care transportă HI într-o singură populație sursă HI și cele trei MNILS HII într-o populație sursă HII pentru a omogeniza variația genetică nucleară potențială între MNILs. Acest lucru a fost realizat prin amestecarea a 100 de muște adulte din fiecare MNIL, în două cuști de populație (adică., N = 3 100 de muște pe cușcă) (cuști din Plexiglas, L25 cm x L15 cm xH15 cm, cu 3 vase fiecare conținând 30 ml de făină de porumb) și menținându-le pentru o generație completă ulterioară în condiții standard de laborator. Astfel, cele două populații sursă purtau fie haplotipul HI, fie haplotipul hii ADNmt, exprimat într-un fond genetic nuclear depășit și comun (adică D). Muștele virgine din aceste două populații sursă au fost apoi sexate și folosite pentru a găsi populațiile experimentale de evoluție.

am inițiat n = 12 populații de evoluție experimentală. În fiecare populație, n = 100 de muște Virgine (raport de sex 1:1) în vârstă de 3-5 zile au fost introduse din populațiile sursă într-o cușcă a populației (L25 cm x L15 cm xH15 cm). Am variat frecvența de pornire a haplotipurilor HI și HII și a condițiilor de resurse alimentare între populații, folosind un design încrucișat 2-2 (n = 3 populații pe celulă), în felul următor. În jumătate din cuști, 80% din muștele fondatoare provin din populația sursă HI și 20% din populația sursă HII. În cealaltă jumătate, 20% din muștele fondatoare provin din populația sursă HI și 80% din populația sursă HII. În ceea ce privește condițiile de resurse alimentare, cantitatea de mediu (atât în volum, cât și în suprafață) a fost identică în cele două grupuri de tratament, în timp ce variația populației în concentrația de nutrienți a fost manipulată după cum urmează. Jumătate din cuști (condiții alimentare omogene) conțineau 3 feluri alimentare identice, fiecare cu 30 ml de mediu standard de făină de porumb (YC) conținând 1,5% drojdie. Cealaltă jumătate a cuștilor (condiții alimentare eterogene) conținea, de asemenea, 3 feluri de mâncare fiecare cu 30 ml mediu standard, dar acestea diferă în concentrația de drojdie (il-0,375%, YC – 1,5%, YH – 6%).

menținerea evoluției experimentale populațiile

populațiile au fost menținute în laborator într-un mod care să asigure generații discrete, 40 zile/ciclu , la 19 CTC, 60% umiditate relativă și un ciclu 12 h lumină: 12 h întuneric. În ziua 40, cele trei feluri de mâncare vechi au fost înlocuite cu trei noi și muștele au fost permise în total 9 zile pentru ovipoziție . Noile feluri de mâncare, care conțin ouă și larve, au fost apoi eliminate de la orice adulți și transferate într-o cușcă nouă pentru a începe următoarea generație. Toate muștele adulte din fiecare cușcă veche au fost apoi numărate, odată ce au murit.

ansambluri de secvențiere și mitogenom

înainte de estimarea frecvenței haplotipului (vezi mai jos), am secvențiat și asamblat toate haplotipurile ADNmt utilizate. ADN-ul a fost extras din cele șase linii IF (HI: 1, 3, 5; HII: 21, 25, 29) utilizate pentru a crea MNILs, folosind un protocol de precipitare sare-etanol. Muștele au fost mai întâi macerate ușor și plasate în tampon de preparare (100 mM NaCl, 10 mM Tris-HCl, pH = 8,0, 0,5% SDS) împreună cu proteinaza K, vortexate și incubate la 50 centimetric C peste noapte. Probele au fost apoi înghețate peste noapte. Pentru a precipita ADN-ul, am adăugat NaCl saturat de mai multe ori înainte de a adăuga 95% etanol și am rotit ADN-ul într-o peletă. Peleta ADN a fost suspendată în tamponul TE 4 (pH = 7,6). Calitatea și cantitatea ADN – ului au fost evaluate folosind NanoDrop, Qubit și Bioanalyzer, urmate de evaluarea lungimii fragmentelor pe un gel de agaroză.

bibliotecile de secvențiere au fost preparate din 100 ng ADN folosind truseq PCRFREE ADN library preparation kit. Cele șase probe au fost apoi secvențiate la 125 BP citiri pereche în două benzi pe un Illumina HiSeq2500 sistem folosind chimie de secvențiere v4. În total, am secvențiat în medie 194 de milioane de lecturi pentru fiecare bibliotecă. Mitogenomii din cele șase probe au fost apoi asamblați folosind un subset de 5% din numărul total de lecturi din fiecare bibliotecă. Citirile au fost alimentate algoritmului MITObim V 1.8 și MIRA V 4.0.2 asamblor, pentru a efectua ansambluri ghidate, folosind mitogenomul Drosophila pseudoobscura (GenBank: FJ899745.1) ca genom de referință. Toate ansamblurile obținute au fost mitogenomi circulari cu o dimensiune de aproape 16kbp. Ansamblurile finale au fost apoi aliniate folosind ClustalW și MAFFT și organizate manual pentru a obține un ansamblu final lustruit pentru fiecare haplotip. Mitogenomii asamblați au fost adnotați folosind DOGMA și MITOS , folosind setările implicite ale parametrilor și, în cele din urmă, au fost curățați manual.

pentru a evalua validitatea ansamblului nostru mitogenom, toate secvențele de ADNmt Drosophila Subobscura disponibile pe GenBank (Cox1, Cox2, Cox3, Cob, Nad1, Nad2, Nad3, Nad5, rrnL, RRN, regiunea bogată a + T și mai multe Arnt), în total acoperind mai mult de 50% din ansamblul total, au fost aliniate împotriva mitogenomilor noștri. Fără excepție, acestea au arătat > 99% identitate de secvență.

mai multe SNP-uri unice au fost găsite în fiecare dintre cele șase haplotipuri mitogenome (vezi mai jos), dintre care două au distins în mod constant grupurile de haplotip HI și HII. Adâncimea de acoperire pentru fiecare SNP a fost verificată prin cartografierea citirilor utilizate pentru ansamblul mitogenom folosind Bowtie v 1.2 . Aceste eforturi au confirmat toate SNP identificate în etapa de asamblare. Aici, ne concentrăm asupra celor două grupuri principale de haplotip I și II, care arată un model izbitor și consistent al polimorfismului în cadrul populației între populații (Fig. 1) și diferențele fenotipice funcționale (vezi Introducere). Deși SNP-urile apar în fiecare dintre cele două grupuri de haplotip, astfel de SNP-uri sunt rare (de exemplu ) și nu sunt în mod constant polimorfe.

estimarea frecvențelor haplotipului ADNmt

am utilizat pool-seq pentru estimarea evoluției frecvenței haplotipului, prin secvențierea probelor de muște din generația a 5-A și a 10-a a fiecărei populații de evoluție experimentală. În fiecare probă, 105 muște selectate aleatoriu pe cușcă au fost grupate și supuse extracției ADN (în grupuri de 15) și preparatelor de bibliotecă de secvențiere așa cum este descris mai sus. Probele N = 24 au fost apoi secvențiate la 125 BP citiri pereche în două benzi pe un Illumina HiSeq2500 sistem, folosind chimia de secvențiere v4. Efortul nostru pool-seq a fost conceput pentru a oferi o adâncime suficientă de secvențiere pentru estimarea exactă a frecvențelor haplotipului ADNmt, dar nu permite analize detaliate ale genomului nuclear.

am secvențiat, în medie, 66 de milioane de citiri pentru fiecare bibliotecă. Citirile din fiecare bibliotecă au fost apoi mapate înapoi la cele șase mitogenomi asamblați, păstrând doar mapări unice și nepotrivire zero folosind Bowtie v 1.2 . Numărul de cartografiere a citirilor la cele două SNP-uri care au distins tipurile HI și HII (în Nad5 și în ARNr 12S) au fost apoi numărate și utilizate ca estimare a frecvenței relative a fiecărui haplotip principal (HI sau HII) în fiecare eșantion.

analize statistice

pentru fiecare eșantion, toate citirile mapate la cele două SNP-uri de diagnostic (vezi mai jos) au fost considerate ca fiind de tip HI sau de tip HII. Proporția citirilor HI pentru cele două SNP-uri diferite a fost foarte strâns corelată într-adevăr pe cele 24 de probe (r = 0.987), astfel încât ambii markeri au furnizat estimări practic identice. Aici, am folosit proporția medie în ambele SNP-uri aici pentru a estima frecvența HI prezentă în fiecare eșantion pool-seq.

evoluția poate fi definită ca modificări ale frecvențelor genotipului în cadrul unei populații, iar designul nostru ne–a permis să derivăm două măsuri repetate separate temporal ale modificărilor frecvenței haplotipului pe generație în fiecare linie în evoluție, fie ca fiind fie ca fiind de la 0 – 5 = (f5–f0)/5, Fie ca de la 5 – 10 = (f10-f5)/5, unde indicii denotă generația la care a fost colectată proba. În plus, s–a estimat că numărul de frecvențe de haplotip variază de la 0 la 10 = (f10 – f0)/10. Deoarece au fost implicate doar două genotipuri, frecvența HI: fI = 1-fII și astfel ne restricționăm analizele la modificări ale frecvenței unuia dintre haplotipuri. Pentru fiecare estimare a numărului de valori ale CIFF, am obținut, de asemenea, un coeficient de selecție dependent de frecvență (SI) corespunzător puterii de selecție necesare pentru a determina modificarea observată a frecvențelor haplotipului (a se vedea mai jos).

fiecare linie în evoluție reprezintă o unitate observațională în proiectarea noastră și, prin urmare, am analizat datele noastre folosind măsuri repetate ANOVAs (adică anovas în cadrul subiecților). Aici, fiecare linie reprezintă subiectul, iar frecvența de pornire a HI (0,2 sau 0,8) și a stării de mediu (omogene sau eterogene) au fost doi factori între subiecți, iar cele două măsuri repetate (de la xvf sau SI) luate la intervale diferite de generații au fost tratate ca un factor în cadrul subiecților. În aceste analize, factorii focali între subiecți testează efectele tratamentelor noastre experimentale și factorii din cadrul subiecților testează dacă modelul evoluției s-a schimbat pe parcursul experimentului nostru. Această strategie analitică se bazează pe faptul că urmărim dinamica frecvenței în linii replicate și independente, iar efectul non-focal al derivei genetice aleatorii, care se preconizează a fi substanțial pentru dinamica ADNmt, face parte din termenul rezidual al modelelor noastre inferențiale. Testele F convenționale ale factorilor între subiecți au fost validate folosind teste de permutare, pe baza a 9999 permutări aleatorii ale datelor. Media SI pentru diferite grupuri a fost evaluată utilizând 95% CI din 9999 replicate bootstrap de date.

estimări ale puterii selecției dependente de frecvență

de asemenea, am dorit să evaluăm mai Explicit dacă puterea selecției dependente de frecvență pe HI și HII a diferit între cele două tratamente experimentale de mediu (omogene / eterogene). Pentru a permite acest lucru, am derivat măsuri simple de selecție dependentă de frecvență din datele noastre empirice folosind următoarea rațiune. Modelarea explicită anterioară a datelor non-experimentale în acest sistem a arătat că cea mai bună potrivire cu datele dinamice ale frecvenței haplotipului are loc atunci când nu există o selecție pozitivă sau negativă pe aceste haplotipuri de ADNmt, dar în cazul în care există o selecție dependentă de frecvență negativă, care este la fel de puternică pe ambele haplotipuri . Considerăm cele două haplotipuri mtDNA HI și HII, cu frecvențele pI și pII (pI + pII = 1) și fitnessurile WI și WII. Schimbarea per generație în pI este apoi dată de

$$ \Delta {p}_I = \ frac{p_I{p} _ {II} \ stânga ({W}_I-{W} _ {ii}\dreapta)} {\overline{W}} $$

observații din ambele populații naturale(vezi Fig. 1; fișier suplimentar 1) și populațiile cuști de laborator replicate sugerează, de asemenea, că selecția este simetrică cu un echilibru pentru cele două haplotipuri HI și HII în vecinătatea pI = pII = 0,5. Presupunând (i) o frecvență de echilibru a pI = pII = 0.5, (ii ) că aptitudinea haplotipului este legată liniar de frecvența haplotipului și (iii) că selecția este simetrică, toate fiind susținute de studii anterioare, obținem

$$ {W}_I=1 – {p}_i{s}_I $$
$$ {W} _ {II}=1 – {p} _ {II}{s}_I $$

unde sI este coeficientul de selecție dependent de frecvență. Având în vedere că \ (\overline{W}={p}_I{W}_I + {p} _ {II}{w}_{II} \) putem apoi estima sI din observațiile noastre empirice ale lui

$$ {s}_I = \ frac{-\Delta {P}_i{p}_I – \ Delta {p}_i{P}_{II}} {- \Delta {p}_i{p_{II}}^2 – {p_I{p} _ {II}}^2 + {p_I}^2{p} _ {II} – \ Delta {p}_i{p_I}^2} $$

definit în acest fel, sI își asumă o scară arbitrară, dar este pozitiv atunci când de la Inqqpi se schimbă spre atractor și negativ atunci când se schimbă departe de atractor. Pentru fiecare cușcă, am estimat două măsurători repetate independente ale sI pe baza modificărilor de frecvență observate ale haplotipului între generațiile 0-5 și, respectiv, 5-10. Observăm că măsura noastră va fi precisă atunci când adevăratul echilibru este aproape pI = pII = 0,5, dar mai Aproximativ dacă adevăratul echilibru se abate de la această condiție.



+