a kohéziós komplex: szekvenciahomológiák, interakciós hálózatok és megosztott motívumok

a kohéziós fehérjék homológjai

SMC fehérjék

a Saccharomyces cerevisiae-ből származó SMC1 és SMC3 szekvenciahomológjainak PSI-BLASTOS keresése számos eukariótafaj homológjait tárta fel, archaea és Eubacteria, amint arról korábban beszámoltunk (1.táblázat). Ezek a homológiai keresések szolgáltatták az alapot a filogenetikai fához és az új szekvencia homológok elemzéséhez.

1. táblázat a S. cerevisiae testvérkromatid kohéziójában részt vevő fehérjék és azok szekvencia homológjai

az SMC3 homológok összehangolásából létrehozott SMC filogenetikai fa (2.ábra) öt családot tár fel: smc1-Smc4 eukariótákból és egy ötödik őscsaládból, amely magában foglalja az Eubacteria és archaea SMC-ket. Ez az ősi család magában foglalja a S. cerevisiae, a Schizosaccharomyces pombe, a Caenorhabditis elegans, a Drosophila melanogaster és az emberek eukarióta fehérjéit is. Ezen eukarióták mindegyike rendelkezik SMC fehérjékkel mind az öt családból. Az eukarióta fehérjék közé tartozik az S. pombe-ból származó Rad18 és az Rhc18, a S. cerevisiae-ből származó Rad18 homológ. Az S. pombe Rad18 részt vesz az UV sugárzás által károsított DNS javításában . A C. elegans, a Drosophila és az ember szekvenciái, amelyek az ősi családon belül rad18-at tartalmaznak, valószínűleg Rad18 homológok. Ezen a csoporton belül is csoportosul az Spr18, egy SMC fehérje, amelyet a rad18 homodimer partnerének javasoltak S. pombe . Ezen túlmenően az Escherichia coli-ból származó MukB szintén ebben az ősi családban fekszik. Ismert, hogy a mukb elengedhetetlen a kromoszóma particionálásához ebben a fajban . A Rad18 homológok csoportosulása az ősi SMC fehérjékkel nem figyelhető meg a cobbe és Heck által épített filogenetikai fában .

ábra 2
2. ábra

evolúciós fa az SMC fehérjék számára, phylip segítségével létrehozva . Az öt SMC család mindegyikét kiemelik és felcímkézik. Az ősi családban jelen lévő eukarióta fehérjék neve alá van húzva. A 100 bootstrap próbából származó Bootstrap értékek a fa elsődleges ágain jelennek meg. Víz, Aquifex aeolicus; ARATH, Arabidopsis thaliana; ARCFU, Archaeoglobus fulgidus; ASPN, aspergillus egyedi fekete; BACSU, egyfajta bacillus finom; CAEEL, Caenorhabditis elegáns; CAUCR, Caulobacter crescentus; Drosophila; ECOLI, Escherichia coli; JAPPU, a japán gömbhal; METJA, Methanococcus jannaschii; MUS, egér; MYCGE,mycoplasma genitális; MYCHR, mycoplasma Hyorhinis; mycpn, mycoplasma pneumonia; pyrab, Pyrococcus abyssii; pyrho, Pyrococcus horikoshii; schp, Schizosaccharomyces pombe; SYNSP, Synechocystis sp.; THEMA, Thermotoga maritima; TREPA, Treponema pallidum; XENLA, XENO, Xenopus laevis; élesztő, Saccharomyces cerevisiae.

az SMC3 egyik szokatlan szekvencia homológja egérben (SMCD) már beszámoltak bamacan, kondroitin-szulfát proteoglikán formájában . Ez a fehérje ismert, hogy 100% – os szekvencia-azonossággal rendelkezik az SMCD-vel szemben . Itt azonosítunk egy másik új homológot, az Mmip1-et, amely szintén rendkívül magas szekvenciaazonosságot mutat az egér SMCD-vel. Az Mmip1-et (Mad interacting protein 1) egy élesztő két hibrid szűrőből azonosították az Mxi-t kötő fehérjék számára, amely egy alapvető hélix-hurok-hélix (bHLH) transzkripciós faktor . Az Mmip1 egy alapvető helix-loop-helix zipper (bHLH-ZIP) fehérje, amely erősen dimerizálódik Mad1, Mxi, Mad3 és Mad4 esetén, de nem max vagy c-Myc esetén . Az Mmip1 Clustal X összehangolása az SMCD-vel azt mutatja, hogy az Mmip1-ből hiányzik az első Gömbös domén és az első tekercselt tekercs domén, amely közös az SMC fehérjékkel. Az összehangolásban 40% – os szekvenciaazonosság van az Mmip1 és az SMCD között az SMCD teljes hosszában (1217 aminosav). Az Mmip1 fehérje (485 aminosav) hosszában azonban a fehérje 99% – os szekvencia-azonosságot mutat az SMCD-vel. Ezek a magas százalékos szekvencia-azonosságok tükröződnek az ezeket a fehérjéket kódoló DNS-szekvenciákban is. Az Mmip1 fehérjét kódoló cDNS 100% – ban azonos az SMCD-t kódoló cDNS-sel az Mmip1 szekvencia 2612 bázispárja felett.

korábban azt javasolták, hogy az eubaktériumok egyetlen ősi SMC fehérjét tartalmaznak . Az SMC homológok PSI-BLAST keresése a jelenlegi munkában két SMC-vel rokon fehérjét azonosított két eubaktériumfajban, B. subtilis és Aquifex Aeolicus. Mindkét fajban az egyik szekvenciát korábban SMC homológként azonosították, míg a második funkciója ismeretlen. A B. subtilis két szekvenciája 95% – os szekvenciaazonosságot mutat, míg az A. aeolicus két szekvenciája 20% – os szekvenciaazonosságot mutat. Mind a négy homológ tartalmaz egy Walker A és B motívumot, a B. subtilis két homológja pedig az SMC fehérjékre jellemző öt domént tartalmazza (1a ábra). Az A. az SMC homológként ismert AEOLICUS protein (TrEMBL csatlakozási szám O60878) tartalmazza az öt domént is, beleértve a két tekercselt tekercs domént, amelyeket 180-200 maradék csuklós régió választ el egymástól. Az A. aeolicus második homológja (TrEMBL csatlakozási szám O67124 ) azonban rendelkezik a két tekercselt tekercs doménnel (tekercsek segítségével megjósolva), de az őket elválasztó csuklórégió csak körülbelül 10-20 maradékból áll. Az SMC dimerek jelenlegi modelljében a csuklótartomány lehetővé teszi a szerkezet körülbelül szimmetrikus komplexummá történő összecsukását (1b ábra). Ehhez A. aeolicus homolog, azonban, a nagyon rövid csuklós régió korlátozná a hajtogatás tartományát. Ebben a fajban két homodimer SMC struktúra alakítható ki, az egyik az öt doménből SMC egy pedig a négy doménből SMC homológ hiányzik a csuklódomén. Két potenciális SMC homológ jelenléte a B. subtilisben azonban azt jelentheti, hogy az eukariótákra javasolt SMC kölcsönhatások heterodimer modellje (például ) néhány prokariótára is kiterjeszthető. Két SMC homológ jelenléte néhány eubaktériumban nem látható a COBBE és Heck által épített SMC filogenetikai fában .

SCC fehérjék

az SCC fehérjék csak eukariótákban vannak jelen, és nem olyan jól jellemezhetők, mint az SMC fehérjék. Az Scc1 (MCD1 néven is azonosítva) fizikailag kapcsolódik az smc1 protomer a komplexben . Az S. pombe , a Xenopus laevis , az emberek és a Drosophila homológjait Rad21 fehérjékként azonosítják (1.táblázat), amelyek részt vesznek az ionizáló sugárzás által kiváltott kettős szálú DNS-törések javításában. Az Scc3 (korábban IRR1 néven azonosítva ) nukleáris lokalizációs szekvenciát tartalmaz (lásd később), és számos homológot azonosítottak (1.táblázat). A Drosophila, az egér, az ember és az Arabidopsis Scc3 homológjai a stromalin fehérjék egy családja, amelyek 20-25% – ban osztoznak a szekvencia azonosságán (1.táblázat). A Drosophila-ban, az egérben és az emberben két stromalin fehérje található (dSA, dSA2; SA1, SA2; és STAG1, STAG2), amelyek a magban helyezkednek el, de funkciójuk ismeretlen. Ezenkívül a stag3-at emberekben azonosították, és a meiózis során javasolt a kromoszóma párosításában részt venni.

az Scc2 és az Scc4 a közelmúltban azonosított kohéziós terhelési tényezők . Az Scc2 homológjait s-ben azonosították. pombe (Mis4) és Drosophila (Nipped-B), Coprinus cinereus (Rad9 és humán (IDN3-B; TrEMBL csatlakozási szám Q9Y6Y3) (1.táblázat). Az S. pombe-ban található Mis4 az anafázisban az egyenlő kromatid elválasztáshoz szükséges, és a kohéziós funkciótól eltérő funkcióval rendelkezik . A C. cinereus Rad9 génterméke elengedhetetlen a meiózis normális befejezéséhez. A Nipped-B gén termék a transzkripciófokozók és a promoterek közötti architekturális működésre javasolt, hogy megkönnyítse az enhancer-promoter kölcsönhatásokat . Az IDN3-B gén funkciója emberben nem ismert, kivéve, hogy előnyösen hepatocelluláris karcinómákban (HCC) expresszálódik . Javasolták, hogy ezek az SCC molekulák az ‘adherinek’ családját képviselik, amelyek a szekvencia homológia nagy központi magtartományán osztoznak .

az Scc4-et az open reading frame (ORF) yer147c termékeként azonosították , és 624 aminosavból álló szekvenciát tartalmaz, amely AMP-kötő motívumot tartalmaz. Azonban az Scc2-vel való kölcsönhatáson és a testvérkromatid kohézió kialakításában való részvételen kívül keveset tudunk erről a fehérjéről. Az Scc4-nek nincs azonosítható szekvencia homológja sem a teljes szekvencia, sem az EST adatbázisokban, ezért egy árva gén terméke lehet.

kohéziós interakciós hálózat

kohéziós interakciós hálózatot hoztak létre két proteom adatbázisból és a szakirodalomból származó információk összegyűjtésével (3.ábra). A 3. ábrán a fehérjék között vonalakat húzunk az ismert vagy potenciális kölcsönhatások jelzésére. Az adatok, amelyekből az interakciók származnak, egy részletes kulcsban vannak feltüntetve, amely megkülönbözteti a két proteomikus adatbázist (és az egyes adatbázisokon belüli különböző adatforrásokat) és az irodalmat. Négy fehérje (Esp1, Trf4, Prp11 és Tid3) közvetlenül kölcsönhatásba lép az SMC vagy SCC fehérjékkel a S. cerevisiae-ben. Az Esp1 és az Scc1 kölcsönhatása jelenleg funkcionális szinten ismert, fontosságát már megvitatták. Ez a kölcsönhatás időfüggő, és nem azonosították az élesztő két hibrid képernyőn, és ez az információ jelenleg nincs rögzítve az YPD-ben.

ábra 3
3. ábra

a kohéziós interakciós hálózat. A fehérjéket összekötő vonalak két proteomikus adatbázisból és az irodalomból származó ismert vagy potenciális kölcsönhatásokat jeleznek. A kohézin és a terhelési tényezők sárga színűek; a kohézióban részt vevő vagy a kohéziós tényezőkkel kölcsönhatásba lépő további fehérjék vagy a terhelési tényezők kék színűek; a hálózat összes többi fehérje fehér. A dobozokkal vázolt fehérjék a makromolekuláris komplexek részét képezik. A Prp11 a spliceosomális út komplexének része, az Apc2 pedig az anafázist elősegítő komplex (APC) része. A Tid3p és az Spc24 egyaránt az orsó-pólus test részei. A szilárd fekete vonalak olyan fehérjéket jelölnek, amelyek dimer kölcsönhatásokat képeznek. A 17 fehérje kohéziós hálózata magában foglalja az összes jelöltet, kivéve az Apc2, Tid4, Tid1 és Rad51.

a Trf4 egy fehérje, amely részt vesz mind a mitotikus kromoszóma kondenzációban, mind a testvér-kromatid kohézióban . X-Ben. a laevis Trf4 kölcsönhatásba lép az Smc1-gyel és az Smc2-vel , az S. cerevisiae-ben pedig a Trp4 kölcsönhatásba lép az Smc1-gyel és a Trf5-tel , a TRF család egy másik tagjával. Trf4 homológokat azonosítottak az S. pombe, a C. elegans, a Drosophila, a human és az Arabidopsis fajokban (2.táblázat). A Trf4-et nemrégiben DNS-polimerázként azonosították, és ma már DNS-polimeráznak (a nukleáris DNS-polimerázok negyedik osztályának) nevezik . Az S. cerevisiae trf4 távoli homológjai közé tartozik a koffein által kiváltott sejthalál fehérje I (Cid1) S. pombe-ban (13.4% szekvencia-Azonosság) és a polinukleotid adeniltranszferáz enzimet számos organizmusból, köztük az S. pombe-ból és az emberből (sorrendben 10,2% és 9,7% szekvencia-Azonosság). A Cid1 különösen érdekes, mivel úgy gondolta, hogy szerepet játszik A S-M ellenőrzőpont útvonal S. pombe-ban . A Trf4 homológjaként a cid1 lehet a kapcsolat a testvérkromatid kohézió és az ellenőrzőpont útvonal között.

táblázat 2 három kohéziós kölcsönhatásban lévő fehérje S-ből. cerevisiae és szekvencia homológjaik

a Prp11 egy élesztő splicing faktor, amely részt vesz a spliceosomal összeszerelési út korai szakaszában . A Prp11 egy 266 aminosav fehérje, amely tartalmaz egy cink-ujj domént, amely közös az RNS-kötő fehérjékkel . Ez a splicing faktor komplexet képez két másikkal, a Prp9-gyel és a Prp21-gyel, amelyek a Prp5-tel együtt szükségesek az U2 snRNP pre-mRNS-hez való kötődéséhez . Ennek a splicing faktornak vannak homológjai S. pombe, C. elegans, Drosophila, Arabidopsis, egér és ember (2.táblázat), és mindegyik tartalmazza az RNS-kötő motívumot. Egérben és emberben a homológ a SAP62 (spliceosome-associated protein), egy spliceosomal protein, amely kötődik a pre-mRNS-hez a prespliceosomal komplexben .

Tid3 (NCD80) egy orsó pólusú testfehérje, amelynek homológjai vannak számos eukariótában (2.táblázat). Az előrejelzések szerint a Tid3 kölcsönhatásba lép az Smc1-gyel és az Smc2-vel, és kísérletileg kimutatták, hogy kölcsönhatásba lép az Spc24-gyel, az orsóoszlop testének egy másik összetevőjével. A tid3, Hec1, valamint a humán Smc1 és Smc2 homológok humán homológja között kölcsönhatásokat is megfigyeltek . A tid3 kölcsönhatása mind a kohéziós, mind a kondenzin makromolekulák alegységeivel a Trf4 és az Scc1 mellé helyezi, mint mindkét mechanizmus szerves részét képező fehérje. Azt is javasolják, hogy a Hec1 részt vegyen a kromatin összeállításában a centromérában és a kinetochore szabályozásában . Az Spc24, a Tid3 egyik interakciós partnere szintén kölcsönhatásba lép a Prp11-gyel, az élesztő splicing faktorral, amely az scc2-vel való kölcsönhatása révén kapcsolódik a kohéziós terhelési tényezőkhöz (3.ábra).

egy közös upstream DNS elem

a kohéziós hálózatban 17 fehérjét kódoló gének upstream régióit (3.ábra) kerestük közös motívumok segítségével AlignACE. Három konszenzusos motívumot azonosítottak,amelyek közösek voltak a 17 gének. Csak egy motívumot találtak viszonylag specifikusnak, azonban az SGD-ben csak 29 gén upstream szekvenciáját illesztették össze (lásd az anyagokat és módszereket). Ez a motívum az a6acgcgth2rxaax konszenzusos szekvenciával rendelkezik, és tartalmazza az MluI cell-cycle box (MCB) elemet (consensus sequence ACGCGT) . A jelenlegi munkában talált kiterjesztett konszenzus motívum az Scc1, Scc3, Smc3, Pds1, Eco1 és Spc24 kódoló gének upstream régióiban volt jelen. Ez a motívum 123-299 bázispár (bp) között helyezkedett el a hat fehérjét kódoló gének előtt. Az SGD kutatása 23 további gént tárt fel, amelyek ezt az upstream motívumot tartalmazzák. E további gének közül nyolc ismeretlen funkciójú hipotetikus fehérjéket kódolt. Ezek a további gének azonban magukban foglalták a chaperonokat (JEM1 és PDI1n), a transzkripciós faktor komponenseket (TFA1, RFA2, RNS polimeráz II, SPT20 és PRT1) és a proteaszóma YC komponensét is. Amikor a keresést 2000 bp-re kiterjesztették az élesztő Genom 5′ nem lefordított régióitól felfelé, a trf4-et kódoló génről is kiderült, hogy tartalmazza ezt a konszenzus motívumot (1560 bp upstream).

megosztott motívumok a kohéziós interakciós hálózaton belül

Teiresias, egy minta-felfedező algoritmust használtak a közös motívumok keresésére két vagy több szekvencia között a kohéziós hálózat 17 fehérjéjében. A legtöbb közös motívummal rendelkező fehérje három volt, és ez volt a három SMC fehérje, amelyek nagy szekvenciájú azonossággal rendelkeznek, és megosztják az ismert Prosit motívumokat (3.táblázat). Érdekesebbek voltak 24 a hálózatban lévő fehérjepárok között talált mintaegyezések. Számos fehérje egynél több szekvencia motívumot oszt meg ugyanazzal a fehérjével. Az összes közös motívum vagy a kohéziós hálózat két fehérjéjére jellemző volt, vagy három motívum esetében egy másik fehérjeszekvencia osztotta meg.

3. táblázat a profilescan segítségével elhelyezkedő Prosit szekvencia motívumok a testvérkromatid kohéziós mechanizmusban részt vevő fehérjékben

az egyik motívum, amelyet a hálózat két szekvenciája és egy további szekvencia oszt meg, a Dxxpenixlxkn motívum, amelyet az Scc2, a Chk1 és a harmadik S. cerevisiae protein PKH1 (élesztő ORF YDR490C) szekvenciái osztanak meg (4.ábra). Mind a Chk1, mind a PKH1 szerin/treonin (ST) protein kinázok, és az Scc2-vel megosztott motívum magában foglalja a PROSITE ST kináz aláírási motívum egy részét (XXDKXXN(3), ahol X bármilyen maradékot jelöl, (3) azt jelzi, hogy az előző maradékot háromszor megismételjük, és D az aktív hely maradéka). Az Scc2 szekvenciája nem egyezik pontosan az ST kináz aláírási motívummal. Az ST-kináz motívum 13 maradéka közül az Scc2-nek négy eltérése van, de fontos, hogy az aktív helyű aszparaginsav konzerválódik.

ábra 4
4. ábra

az scc2, Chk1 és Pkh1 konzervált motívum szekvenciájának összehangolása, amely magában foglalja a PROSITE szerin/treonin (S/T) protein kináz motívumot. Az igazításban a teiresias segítségével azonosított motívum konzervált maradványai pirosak, a további konzervált pozíciók pedig zöldek. Az S/T kináz motívummal egybeeső maradványokat egy doboz vázolja fel. Az egyes motívumok előtti szám jelzi az első maradék helyzetét a teljes szekvencián belül. A PROSITE s / T kináz motívum az igazítás alatt látható. Az alternatív maradékokat négyzet alakú zárójelben mutatjuk be; X bármely maradékot jelöl; az aktív helyű aszparaginsav kék színű.

a kohéziós hálózatba nem tartozó harmadik fehérje második motívuma az SXXSXLKKKXLXT volt; ez megtalálható az Scc1-ben, az Scc2-ben és az ORF yhr011w élesztőben, egy feltételezett szeril-tRNS-szintetázban (5a.ábra). Ez a motívum azonban nem volt része a tRNS ligáz motívum nak, – nek YHR011W, vagy bármely más ismert motívum ezen a sorozaton belül. A harmadik motívum, amelyet a kohéziós hálózaton kívüli fehérje osztott meg, az NDXNXDDXDN volt, amelyet az Scc1, az Smc1, valamint a Plasmodium yoelii P-típusú Atpáza osztott meg (5b ábra). Az Scc4 az egyik kohéziós terhelési tényező, amelyre nem találtak ismert homológot. Ez a fehérje azonban 10-szermaradék-szekvencia-motívumot (GKXVALTNAK) oszt meg az Smc3-Mal (5c ábra).

ábra 5
5. ábra

a fehérjék által a kohéziós hálózatban megosztott három motívum Szekvenciaillesztése. a) az Scc2 és a Trf4 által a hálózatban megosztott motívum és az élesztőből származó feltételezett szeril-tRNS-szintetáz (YHH1). b) az Scc1, Smc1 és a Plasmodium yoelii P-típusú ATPáz által megosztott motívum. c) az Scc4 és az SMC3 kohéziós terhelési tényezővel közös motívum. Mindegyik igazításban a teiresias segítségével azonosított motívum konzervált maradványai pirosak, a további konzervált pozíciók pedig zöldek. Az egyes motívumok előtti szám jelzi az első maradék helyzetét a teljes szekvencián belül.

a securin Pds1 egy anafázis inhibitor , amely megsemmisítő doboz motívumot (RXXXLXXXXN) tartalmaz, amely ezt a fehérjét az APC ubiquitin ligáz általi megsemmisítésre célozza. Három megsemmisítő doboz motívumot találtunk Az Smc3-ban, egyet a zsanér régióban (a 682-es pozícióban, RTRLESLKN), kettőt a második tekercselt tekercs tartományban (egyet a 744-es pozícióban (RTSLNTKKN) és egyet a 920-as pozícióban (RLLLKKLDN)). Találtunk egy KEN-box motívumot (egy további APC felismerő jelet ) az SMC2-ben a 304-es pozícióban (KENGLLN), az első tekercselt tekercs tartományban.



+