the Cohenin complex: sequence homologies, interaction networks and shared motifs

homologs of cohosen proteins

SMC proteins

a PSI-BLAST search for sequence homologs of SMC1 and SMC3 from Saccharomyces cerevisiae paljasti homologeja monista eukaryooteista, archaea ja eubacteria (taulukko 1). Nämä homologiahaut tarjosivat perustan fylogeneettiselle puulle ja uusien sekvenssihomologien analyysille.

Taulukko 1 S. cerevisiae: n sisarkromatidikoheesioon osallistuvat proteiinit ja niiden sekvenssihomologit

SMC-fylogeneettinen puu, joka on luotu smc3-homologien linjauksesta (kuva 2), paljastaa viisi sukua: eukaryoottien Smc1-Smc4 ja viidennen ”esivanhempien” suvun, johon kuuluvat Eubacteria-ja archaea-suvun SMC: t. Tähän sukuun kuuluu myös joukko eukaryoottisia proteiineja S. cerevisiaesta, Schizosaccharomyces pombesta, Caenorhabditis elegansista, Drosophila melanogasterista ja ihmisistä. Jokaisessa eukaryootissa on SMC-proteiineja kaikista viidestä perheestä. Eukaryoottisia proteiineja esi-isien suvussa ovat Rad18 S. pombesta ja Rhc18: sta, Rad18 homolog S. cerevisiaesta. S. pomben rad18 osallistuu UV-säteilyn vaurioittaman DNA: n korjaamiseen . Sekvenssit C. elegans, Drosophila ja ihmisen että klusterin Rad18 sisällä esivanhempien suvussa ovat todennäköisesti Rad18 homologs. Tähän ryhmään kuuluu myös Spr18, SMC-proteiini, jota on ehdotettu rad18: n homodimeeriseksi kumppaniksi S. pombessa . Lisäksi Escherichia coli-bakteerin MukB kuuluu myös tähän esi-isien sukuun. MukB: n tiedetään olevan välttämätön kromosomin jakautumisen kannalta tällä lajilla . Rad18-homologien ryhmittymistä esi-isien SMC-proteiineihin ei havaita Cobben ja Heckin rakentamassa fylogeneettisessä puussa .

kuva 2
kuva2

Evolutionary tree SMC proteiineja, luotu phylip . Jokainen viidestä SMC perheet on korostettu ja merkitty. Esi-isissä esiintyvien eukaryoottisten proteiinien nimet on alleviivattu. Bootstrap-arvot 100 bootstrap-kokeesta on esitetty puun ensisijaisilla oksilla. Vesi, Aquifex aeolicus; ARATH, Arabidopsis thaliana; ARCFU, Archaeoglobus fulgidus; ASPN, aspergillus unique black; BACSU, kind of bacillus hienovarainen; CAEEL, Caenorhabditis elegant; caucr, Caulobacter crescentus; DROS, Drosophila; ECOLI, Escherichia coli; JAPPU, Japanilainen pallokala; METJA, Methanococcus jannaschii; MUS,hiiri; MYCGE, Mycoplasma genital; MYCHR, Mycoplasma Hyorhinis; mycpn, Mycoplasma pneumonia; pyrab, pyrococcus abyssii; pyrho, pyrococcus horikoshii; schp, schizosaccharomyces pombe; SYNSP, Synechocystis sp.; Thema, Thermotoga maritima; TREPA, Treponema pallidum; XENLA, XENO, Xenopus laevis; hiiva, Saccharomyces cerevisiae.

yksi smc3: n epätavallinen sekvenssi hiiressä (SMCD) on jo raportoitu kondroitiinisulfaattiproteoglykaanin muodossa . Tällä proteiinilla tiedetään olevan 100% sekvenssin identiteetti SMCD: hen . Tässä tunnistamme toisen uuden homolog, Mmip1, joka myös jakaa erittäin korkean sekvenssin identiteetin hiiren SMCD: n kanssa. Mmip1 (Mad interacting protein 1) tunnistettiin hiivan kahden hybridin seulasta proteiineille, jotka sitovat Mxi: tä, joka on bhlh: n (Helix-loop-helix) transkriptiotekijä . Mmip1 on perus helix-loop-helix vetoketju (bHLH-ZIP) proteiini, joka dimerisoituu voimakkaasti Mad1: n, Mxi: n, Mad3: n ja Mad4: n kanssa, mutta ei Max: n tai C-Myc: n kanssa . Mmip1: n Klustaali X-kohdistus SMCD: n kanssa paljastaa, että Mmip1: stä puuttuu ensimmäinen pallomainen domeeni ja ensimmäinen SMC-proteiineille yhteinen kelattu domeeni. Linjauksessa Mmip1: n ja SMCD: n välillä on 40% sekvenssidentiteetti koko SMCD: n pituudelta (1 217 aminohappoa). Mmip1-proteiinin pituudessa (485 aminohappoa) proteiinilla on kuitenkin 99-prosenttinen sekvenssidentiteetti SMCD: n kanssa. Nämä suuret sekvenssidentiteetit heijastuvat myös DNA-sekvensseihin, jotka koodaavat näitä proteiineja. Mmip1-proteiinia koodaava cDNA on 100-prosenttisesti identtinen smcd: tä koodaavan cDNA: n kanssa Mmip1-sekvenssin 2 612 emäsparilla.

aiemmin on arveltu, että eubakteeri sisältää yhtä esi-isien SMC-proteiinia . Psi-BLAST search for SMC homologs in the current work identified two SMC-related proteins in two species of eubacteria, B. subtilis ja Aquifex aeolicus. Kummassakin lajissa yksi sekvenssi on aiemmin tunnistettu SMC-homologiksi, kun taas toisen funktiota ei tunneta. Kaksi sekvenssiä B. subtilis jakaa 95% sekvenssin identiteetti, kun taas kaksi sekvenssiä A. aeolicus jakaa 20% sekvenssin identiteetti. Kaikissa neljässä homologissa on Walker A ja B-motiivi, ja kahdessa homologissa B. subtilis sisältää viisi SMC-proteiineille ominaista domeenia (Kuva 1a). A. AEOLICUS-proteiini, joka tunnetaan SMC-homologina (TrEMBL-liittymänumero O60878), sisältää myös viisi domeenia, mukaan lukien kaksi kiertynyttä kelaa, joita erottaa 180-200 jäämän sarana-alue. A. aeolicuksen toisessa homologissa (TrEMBL-liittymänumero O67124 ) on kuitenkin kaksi kelakäämiä (ennustettu käyttäen keloja), mutta niitä erottava sarana-alue koostuu vain noin 10-20 tähteestä. Nykyisessä SMC-dimeerimallissa sarana-alue mahdollistaa rakenteen taittamisen suunnilleen symmetriseksi kompleksiksi (Kuva 1b). Tästä A. aeolicus homolog, kuitenkin, hyvin lyhyt sarana alue rajoittaisi taitto. Tässä lajissa voitiin muodostaa kaksi homodimeeristä SMC-rakennetta, yksi viiden domeenin SMC: stä ja yksi neljän domainin SMC-homologista, josta puuttui sarana-domeeni. Kahden potentiaalisen SMC-homologin esiintyminen B. subtilisissa voi kuitenkin tarkoittaa, että eukaryooteille (esimerkiksi,) ehdotettu heterodimeerinen SMC-vuorovaikutusmalli voitaisiin laajentaa myös joihinkin prokaryootteihin. Cobben ja Heckin rakentamassa SMC-fylogeneettisessä puussa ei näy kahden SMC-homologin esiintymistä joissakin eubakteereissa .

SCC-proteiinit

SCC-proteiinit esiintyvät vain eukaryooteissa, eikä niitä tunneta yhtä hyvin kuin SMC-proteiineja. Scc1 (tunnistettu myös MCD1: ksi) liittyy fysikaalisesti kompleksissa olevaan SMC1-protomeeriin . Homologeja S. pombessa, Xenopus laevisissa, ihmisissä ja drosophilassa on tunnistettu Rad21-proteiineiksi (Taulukko 1), jotka osallistuvat ionisoivan säteilyn aiheuttamien DNA: n kaksijuosteisten katkosten korjaamiseen. Scc3 (aiemmin tunnistettu IRR1: ksi ) sisältää ydinsekvenssin (KS.myöhemmin) ja useita homologeja on tunnistettu (Taulukko 1). Scc3 homologit drosophilassa, hiiressä, ihmisessä ja Arabidopsiksessa ovat stromaliiniproteiiniperhe, jonka sekvenssidentiteetti on 20-25% (Taulukko 1). Drosophilassa hiirellä ja ihmisellä on kaksi stromaliiniproteiinia (DSA, dSA2; SA1, SA2; ja stag1, STAG2), jotka sijaitsevat tumassa, mutta niiden toimintaa ei tunneta. Lisäksi stag3 on tunnistettu ihmisillä ja sen on ehdotettu osallistuvan kromosomin pariutumiseen meioosin aikana.

Scc2 ja Scc4 ovat äskettäin tunnistettuja koossapitoisia kuormitustekijöitä . Homologeja Scc2: lle on todettu S. pombe (Mis4) ja Drosophila (Nipped-B), Coprinus cinereus (Rad9 ja ihminen (IDN3-B; TrEMBL-liittymisnumero Q9Y6Y3) (Taulukko 1). Mis4: ää S. pombessa tarvitaan yhtä suureen kromatidierotukseen anafaasissa, ja sen funktio on erillinen koosiinista . C. cinereus-bakteerin Rad9-geenituote on välttämätön meioosin normaalin loppuunsaattamisen kannalta. Nipped – B-geenituotteen ehdotetaan toimivan arkkitehtonisesti transkription tehostajien ja promoottoreiden välillä helpottaakseen tehostaja-promoottori-vuorovaikutusta . IDN3-B-geenin toimintaa ihmisellä ei tunneta, muuten se ilmaistaan ensisijaisesti hepatosellulaarisina karsinoomina (HCC) . On ehdotettu, että nämä SCC-molekyylit edustavat ”adheriinien” perhettä, joilla on yhteinen suuri sekvenssihomologian ydinalue .

Scc4 tunnistettiin avoimen lukukehyksen (ORF) YER147C: n tuotteeksi, ja se käsittää 624 aminohapon sarjan, joka sisältää AMP: ää sitovan motiivin. Tästä proteiinista tiedetään kuitenkin vain vähän muuta kuin vuorovaikutus Scc2: n kanssa ja osallistuminen sisarkromatidikoheesioon. Scc4: llä ei ole tunnistettavissa olevia sekvenssihomologeja joko kokosekvenssissä tai EST-tietokannoissa, joten se voi olla orvon geenin tuote.

Cohesion interaction network

cohesion interaction network luotiin keräämällä tietoja kahdesta proteome-tietokannasta ja kirjallisuudesta (kuva 3). Kuvassa 3 proteiinien välille piirretään viivat, jotka osoittavat tunnetut tai mahdolliset yhteisvaikutukset. Tiedot, joista interaktiot on johdettu, on merkitty yksityiskohtaisella avaimella, joka erottaa toisistaan kaksi proteomista tietokantaa (ja kunkin tietokannan eri tietolähteet) ja kirjallisuuden. Neljä proteiinia (Esp1, Trf4, Prp11 ja Tid3) vuorovaikuttavat suoraan S. cerevisiae-bakteerin SMC-tai SCC-proteiinien kanssa. Esp1: n ja Scc1: n vuorovaikutus tunnetaan tällä hetkellä toiminnallisella tasolla , ja sen merkityksestä on jo keskusteltu. Tämä vuorovaikutus on aikariippuvaista, eikä sitä ole tunnistettu hiivakaksihybridinäytössä, eikä tätä tietoa tällä hetkellä tallenneta YPD: hen.

kuva 3
kuva3

koheesiovaikuttamisverkosto. Proteiineja yhdistävät viivat kertovat tunnetuista tai mahdollisista vuorovaikutuksista, jotka on johdettu kahdesta proteomisesta tietokannasta ja kirjallisuudesta. Koossiini ja kuormitustekijät ovat keltaisella; lisäproteiinit, jotka osallistuvat koheesioon tai vuorovaikutuksessa koossiinin tai kuormitustekijöiden kanssa, ovat sinisellä; kaikki muut verkoston proteiinit ovat valkoisia. Laatikoilla hahmotellut proteiinit ovat osa makromolekyylikomplekseja. Prp11 on osa kompleksia spliseosomaalisessa reitissä ja Apc2 on osa anafaasia edistävää kompleksia (APC). Tid3p ja Spc24 ovat molemmat osa karanapaista runkoa. Kiinteät mustat viivat ilmaisevat proteiineja, jotka muodostavat dimeerisiä vuorovaikutuksia. 17 proteiinin koheesioverkkoon kuuluvat kaikki merkityt pois lukien Apc2, Tid4, Tid1 ja Rad51.

Trf4 on proteiini, joka osallistuu sekä mitoottiseen kromosomin tiivistymiseen että sisarkromatidin yhteenkuuluvuuteen . X: Ssä. laevis Trf4 vuorovaikuttaa Smc1: n ja Smc2: n kanssa , ja S. cerevisiae Trp4 vuorovaikuttaa Smc1: n ja trf5: n kanssa. Trf4-homologeja on tunnistettu lajeissa S. pombe, C. elegans, Drosophila, human ja Arabidopsis (Taulukko 2). Trf4 on aivan äskettäin tunnistettu DNA-polymeraasiksi, jolla on β-polymeraasin kaltaisia ominaisuuksia, ja se on nyt nimetty DNA-polymeraasi κ: ksi (ydin-DNA-polymeraasien neljäs luokka) . S. cerevisiae Trf4: n etähomologeja ovat kofeiinin aiheuttama solukuolemaproteiini I (Cid1) S. pombessa (13.4% sekvenssidentiteetti) ja polynukleotidiadenyylitransferaasientsyymi useista organismeista, mukaan lukien S. pombe (10, 2% sekvenssidentiteetti ja 9, 7% sekvenssidentiteetti). Cid1 on erityisen kiinnostava, koska sen ajateltiin osallistuvan S-M-tarkastuspisteen reitille S. pombessa . Trf4: n homologina Cid1 voisi olla linkki sisarkromatidisen koheesion ja tämän tarkastuspisteen reitin välillä.

Taulukko 2 S. cerevisiae ja niiden sekvenssihomologit

Prp11 on hiivakiertotekijä, joka osallistuu sprikeosomaalisen kokoonpanoreitin alkuvaiheisiin . Prp11 on 266 aminohappoproteiini, joka sisältää RNA: ta sitoville proteiineille yhteisen sinkkisormen domeenin . Tämä liitoskerroin muodostaa kompleksin kahden muun, Prp9: n ja Prp21: n kanssa, jotka yhdessä Prp5: n kanssa ovat tarpeen U2 snRNP: n sitomiseksi pre-mRNA: han . Tämän liitostekijän homologeja on S. pombessa, C. elegansissa, Drosophilassa, Arabidopsiksessa, hiiressä ja ihmisessä (Taulukko 2), ja kaikki sisältävät RNA: ta sitovan motiivin. Hiirillä ja ihmisillä homologina on SAP62 (spliseosomiin liittyvä proteiini), joka sitoutuu esi-mRNA: han prespliseosomisessa kompleksissa .

Tid3 (NCD80) on värttinänapaproteiini, jolla on homologeja useissa eukaryooteissa (Taulukko 2). Tid3: n ennustetaan olevan vuorovaikutuksessa Smc1: n ja Smc2: n kanssa, ja sen on kokeellisesti osoitettu olevan vuorovaikutuksessa spc24: n kanssa, joka on toinen karan naparungon komponentti. Myös tid3: n, Hec1: n ja ihmisten Smc1: n ja Smc2: n homologien välisiä yhteisvaikutuksia on havaittu . Tid3: n yhteisvaikutukset sekä koossiini-että kondensiinimakromolekyylien alayksiköiden kanssa asettavat sen Trf4: n ja Scc1: n rinnalle proteiinina, joka on kiinteästi mukana molemmissa mekanismeissa. On myös ehdotettu, että Hec1 voi osallistua kromatiinin kokoamiseen kinetokorin sentromeeriin ja säätelyyn . Spc24, yksi tid3: n vuorovaikutuskumppaneista, on myös vuorovaikutuksessa prp11: n kanssa, hiivan liitoskertoimen kanssa, joka liittyy koossiinikuormituskertoimiin vuorovaikutuksessa Scc2: n kanssa (kuva 3).

yhteinen DNA-alkuaine

17 proteiinia koossiiniverkossa koodaavien geenien ylävirtaan kuuluvilta alueilta (kuva 3) etsittiin yhteisiä motiiveja Alignacen avulla. Tunnistettiin kolme konsensusmotiivia, jotka olivat yhteisiä 17 geenin alajoukoille. Vain yhden motiivin havaittiin olevan suhteellisen spesifinen, mutta se vastasi vain 29: n SGD: n geenien alkupään sekvenssejä (KS.materiaalit ja menetelmät). Tämä motiivi on konsensus sekvenssi A6ACGCGTH2RXAAX ja sisältää mlui cell-cycle box (MCB) Elementti (konsensus sekvenssi ACGCGT) . Nykyisessä työssä löydetty laajennettu konsensusmotiivi oli läsnä scc1: tä, Scc3: a, Smc3: a, Pds1: tä, Eco1: tä ja Spc24: ää koodaavien geenien alkupäässä. Tämä motiivi sijaitsi 123-299 emäsparin (bp) välissä ylävirtaan näitä kuutta proteiinia koodaavista geeneistä. SGD: n tutkimus paljasti 23 geeniä, jotka sisälsivät tämän ylävirran motiivin. Kahdeksan näistä lisägeeneistä koodasi hypoteettisia proteiineja, joiden toimintaa ei tunneta. Näihin lisägeeneihin kuuluivat kuitenkin myös esiliinoja koodaavat (JEM1 ja PDI1n), transkriptiotekijäkomponentit (TFA1, RFA2, RNA polymeraasi II, SPT20 ja PRT1) sekä proteasomin YC-komponentti. Kun etsintää laajennettiin 2 000 bp ylävirtaan hiivan perimän 5′ kääntymättömiltä alueilta, havaittiin Trf4: ää koodaavan geenin sisältävän myös tämän konsensusmotiivin (1 560 bp ylävirtaan).

cohesion interaction network-verkostossa jaetut motiivit

Teiresias-hahmonlöytöalgoritmilla etsittiin yhteisiä motiiveja kahden tai useamman sekvenssin välillä koheesioverkon 17 proteiinista. Eniten proteiineja, joilla oli yhteinen motiivi, oli kolme, ja nämä olivat kolme SMC-proteiinia, joilla on korkea sekvenssidentiteetti ja joilla on samat tunnetut Prosiittiset motiivit (Taulukko 3). Mielenkiintoisempia olivat verkostosta löytyneet 24 proteiiniparien välistä kuviota. Useilla proteiineilla on useampi sekvenssimotiivi saman proteiinin kanssa. Kaikki jaetut motiivit olivat joko koheesioverkoston kahdelle proteiinille ominaisia tai kolmen ominaisuuden tapauksessa yhden muun proteiinisarjan jakamia.

Taulukko 3 PROSIITTISEKVENSSIMOTIIVEJA, joissa käytetään Profilescania sisarkromatidin koheesiomekanismiin osallistuvissa proteiineissa

yksi motiivi jakaa kaksi sekvenssiä verkossa ja yksi ylimääräinen sekvenssi, on dxxpenixlxkn motiivi jaettu sekvenssit Scc2, Chk1 ja kolmas S. cerevisiae proteiini PKH1 (hiiva ORF YDR490C) (Kuva 4). Sekä Chk1 että PKH1 ovat seriini/treoniini (ST) – proteiinikinaaseja, ja niiden scc2: n kanssa jakama motiivi sisältää osan PROSIITTI-St-kinaasin tunnusmotiivista (XXDKXXN(3), jossa X tarkoittaa mitä tahansa jäämää, (3) osoittaa, että edellinen jäämä toistuu kolme kertaa ja D on aktiivisen kohdan jäännös). Scc2: n sekvenssi ei täsmää ST-kinaasin tunnusmotiiviin tarkasti. ST-kinaasimotiivin 13 jäämästä Scc2: lla on neljä yhteensopimattomuutta, mutta mikä tärkeintä, aktiivisen kohdan asparagiinihappo säilyy.

Kuva 4
kuva4

säilyneen motiivin sekvenssien linjaus Scc2: ssa, Chk1: ssä ja Pkh1: ssä, johon sisältyy PROSIITTISERIINI/treoniini (S/T) – proteiinikinaasiaihe. Linjauksessa teiresiaksella tunnistetun aiheen säilyneet jäännökset ovat punaisella ja muut säilyneet paikat vihreällä. S/T-kinaasiaiheen kanssa yhtäpitävät jäämät on hahmoteltu laatikolla. Numero ennen kutakin motiivia osoittaa ensimmäisen jäännöksen sijainnin täydellisessä järjestyksessä. Prosiitti S/T-kinaasiaihe näkyy linjauksen alla. Vaihtoehtoiset jäämät on esitetty neliösulkeissa; X tarkoittaa mitä tahansa jäämää; aktiivisen kohdan asparagiinihappo on sininen.

toinen koheesioverkkoon kuulumattoman kolmannen proteiinin jakama motiivi oli Sxxsxlkkxlxt; tämä löytyy Scc1: stä, Scc2: sta ja hiivasta ORF YHR011W, joka on oletettu seryyli-Trna-syntetaasi (Kuva 5a). Tämä motiivi ei kuitenkaan kuulunut YHR011W: n Trna-ligaasi-motiiviin eikä mihinkään muuhunkaan tunnettuun motiiviin tässä järjestyksessä. Kolmas koheesioverkon ulkopuolelta tulevan proteiinin jakama motiivi oli SCC1: n, Smc1: n ja Plasmodium yoelii: n P-tyypin ATPaasin jakama NDXNXDDXDN (Kuva 5b). Scc4 on yksi koheesiokuormitustekijöistä, joille ei ole löydetty tunnettua homologiaihetta. Tällä proteiinilla havaittiin kuitenkin olevan 10-jäämien sekvenssimotiivi (GKXVALTNAK) Smc3: n kanssa (kuva 5c).

kuva 5
kuva5

sekvenssien täsmäytykset kolmelle teemalle, jotka proteiinit jakavat koheesioverkostossa. a) scc2: n ja Trf4: n verkossa jakama motiivi ja hiivasta saatu seryyli-Trna-syntetaasi (YHH1). (b) scc1: n, Smc1: n ja Plasmodium yoelii: n p-tyypin ATPaasin yhteinen motiivi. (C) cohesin loading factor Scc4: n ja SMC3: n yhteinen motiivi. Jokaisessa linjauksessa teiresiasta tunnistetun kuvion säilyneet jäännökset ovat punaisella ja muut säilyneet kohdat vihreällä. Numero ennen kutakin motiivia osoittaa ensimmäisen jäännöksen sijainnin täydellisessä järjestyksessä.

securiini Pds1 on anafaasi-inhibiittori , joka sisältää tuhoamiskotelon motiivin (RXXXLXXXXN), joka kohdistaa tämän proteiinin tuhoamiseen APC ubikitiiniligaasilla. Löysimme kolme tuhoa laatikko motiiveja Smc3, yksi saranan alueella (asemassa 682, RTRLESLKN) ja kaksi toisessa kelattu-kela domain (yksi asemassa 744 (RTSLNTKKN) ja yksi asemassa 920 (RLLLKLDN)). Löysimme myös Ken-box motif (ylimääräinen APC tunnustamista signaali ) SMC2 asemassa 304 (KENGLLN), ensimmäisessä kelattu-coil domain.



+