a kohéziós fehérjék homológjai
SMC fehérjék
a Saccharomyces cerevisiae-ből származó SMC1 és SMC3 szekvenciahomológjainak PSI-BLASTOS keresése számos eukariótafaj homológjait tárta fel, archaea és Eubacteria, amint arról korábban beszámoltunk (1.táblázat). Ezek a homológiai keresések szolgáltatták az alapot a filogenetikai fához és az új szekvencia homológok elemzéséhez.
az SMC3 homológok összehangolásából létrehozott SMC filogenetikai fa (2.ábra) öt családot tár fel: smc1-Smc4 eukariótákból és egy ötödik őscsaládból, amely magában foglalja az Eubacteria és archaea SMC-ket. Ez az ősi család magában foglalja a S. cerevisiae, a Schizosaccharomyces pombe, a Caenorhabditis elegans, a Drosophila melanogaster és az emberek eukarióta fehérjéit is. Ezen eukarióták mindegyike rendelkezik SMC fehérjékkel mind az öt családból. Az eukarióta fehérjék közé tartozik az S. pombe-ból származó Rad18 és az Rhc18, a S. cerevisiae-ből származó Rad18 homológ. Az S. pombe Rad18 részt vesz az UV sugárzás által károsított DNS javításában . A C. elegans, a Drosophila és az ember szekvenciái, amelyek az ősi családon belül rad18-at tartalmaznak, valószínűleg Rad18 homológok. Ezen a csoporton belül is csoportosul az Spr18, egy SMC fehérje, amelyet a rad18 homodimer partnerének javasoltak S. pombe . Ezen túlmenően az Escherichia coli-ból származó MukB szintén ebben az ősi családban fekszik. Ismert, hogy a mukb elengedhetetlen a kromoszóma particionálásához ebben a fajban . A Rad18 homológok csoportosulása az ősi SMC fehérjékkel nem figyelhető meg a cobbe és Heck által épített filogenetikai fában .
az SMC3 egyik szokatlan szekvencia homológja egérben (SMCD) már beszámoltak bamacan, kondroitin-szulfát proteoglikán formájában . Ez a fehérje ismert, hogy 100% – os szekvencia-azonossággal rendelkezik az SMCD-vel szemben . Itt azonosítunk egy másik új homológot, az Mmip1-et, amely szintén rendkívül magas szekvenciaazonosságot mutat az egér SMCD-vel. Az Mmip1-et (Mad interacting protein 1) egy élesztő két hibrid szűrőből azonosították az Mxi-t kötő fehérjék számára, amely egy alapvető hélix-hurok-hélix (bHLH) transzkripciós faktor . Az Mmip1 egy alapvető helix-loop-helix zipper (bHLH-ZIP) fehérje, amely erősen dimerizálódik Mad1, Mxi, Mad3 és Mad4 esetén, de nem max vagy c-Myc esetén . Az Mmip1 Clustal X összehangolása az SMCD-vel azt mutatja, hogy az Mmip1-ből hiányzik az első Gömbös domén és az első tekercselt tekercs domén, amely közös az SMC fehérjékkel. Az összehangolásban 40% – os szekvenciaazonosság van az Mmip1 és az SMCD között az SMCD teljes hosszában (1217 aminosav). Az Mmip1 fehérje (485 aminosav) hosszában azonban a fehérje 99% – os szekvencia-azonosságot mutat az SMCD-vel. Ezek a magas százalékos szekvencia-azonosságok tükröződnek az ezeket a fehérjéket kódoló DNS-szekvenciákban is. Az Mmip1 fehérjét kódoló cDNS 100% – ban azonos az SMCD-t kódoló cDNS-sel az Mmip1 szekvencia 2612 bázispárja felett.
korábban azt javasolták, hogy az eubaktériumok egyetlen ősi SMC fehérjét tartalmaznak . Az SMC homológok PSI-BLAST keresése a jelenlegi munkában két SMC-vel rokon fehérjét azonosított két eubaktériumfajban, B. subtilis és Aquifex Aeolicus. Mindkét fajban az egyik szekvenciát korábban SMC homológként azonosították, míg a második funkciója ismeretlen. A B. subtilis két szekvenciája 95% – os szekvenciaazonosságot mutat, míg az A. aeolicus két szekvenciája 20% – os szekvenciaazonosságot mutat. Mind a négy homológ tartalmaz egy Walker A és B motívumot, a B. subtilis két homológja pedig az SMC fehérjékre jellemző öt domént tartalmazza (1a ábra). Az A. az SMC homológként ismert AEOLICUS protein (TrEMBL csatlakozási szám O60878) tartalmazza az öt domént is, beleértve a két tekercselt tekercs domént, amelyeket 180-200 maradék csuklós régió választ el egymástól. Az A. aeolicus második homológja (TrEMBL csatlakozási szám O67124 ) azonban rendelkezik a két tekercselt tekercs doménnel (tekercsek segítségével megjósolva), de az őket elválasztó csuklórégió csak körülbelül 10-20 maradékból áll. Az SMC dimerek jelenlegi modelljében a csuklótartomány lehetővé teszi a szerkezet körülbelül szimmetrikus komplexummá történő összecsukását (1b ábra). Ehhez A. aeolicus homolog, azonban, a nagyon rövid csuklós régió korlátozná a hajtogatás tartományát. Ebben a fajban két homodimer SMC struktúra alakítható ki, az egyik az öt doménből SMC egy pedig a négy doménből SMC homológ hiányzik a csuklódomén. Két potenciális SMC homológ jelenléte a B. subtilisben azonban azt jelentheti, hogy az eukariótákra javasolt SMC kölcsönhatások heterodimer modellje (például ) néhány prokariótára is kiterjeszthető. Két SMC homológ jelenléte néhány eubaktériumban nem látható a COBBE és Heck által épített SMC filogenetikai fában .
SCC fehérjék
az SCC fehérjék csak eukariótákban vannak jelen, és nem olyan jól jellemezhetők, mint az SMC fehérjék. Az Scc1 (MCD1 néven is azonosítva) fizikailag kapcsolódik az smc1 protomer a komplexben . Az S. pombe , a Xenopus laevis , az emberek és a Drosophila homológjait Rad21 fehérjékként azonosítják (1.táblázat), amelyek részt vesznek az ionizáló sugárzás által kiváltott kettős szálú DNS-törések javításában. Az Scc3 (korábban IRR1 néven azonosítva ) nukleáris lokalizációs szekvenciát tartalmaz (lásd később), és számos homológot azonosítottak (1.táblázat). A Drosophila, az egér, az ember és az Arabidopsis Scc3 homológjai a stromalin fehérjék egy családja, amelyek 20-25% – ban osztoznak a szekvencia azonosságán (1.táblázat). A Drosophila-ban, az egérben és az emberben két stromalin fehérje található (dSA, dSA2; SA1, SA2; és STAG1, STAG2), amelyek a magban helyezkednek el, de funkciójuk ismeretlen. Ezenkívül a stag3-at emberekben azonosították, és a meiózis során javasolt a kromoszóma párosításában részt venni.
az Scc2 és az Scc4 a közelmúltban azonosított kohéziós terhelési tényezők . Az Scc2 homológjait s-ben azonosították. pombe (Mis4) és Drosophila (Nipped-B), Coprinus cinereus (Rad9 és humán (IDN3-B; TrEMBL csatlakozási szám Q9Y6Y3) (1.táblázat). Az S. pombe-ban található Mis4 az anafázisban az egyenlő kromatid elválasztáshoz szükséges, és a kohéziós funkciótól eltérő funkcióval rendelkezik . A C. cinereus Rad9 génterméke elengedhetetlen a meiózis normális befejezéséhez. A Nipped-B gén termék a transzkripciófokozók és a promoterek közötti architekturális működésre javasolt, hogy megkönnyítse az enhancer-promoter kölcsönhatásokat . Az IDN3-B gén funkciója emberben nem ismert, kivéve, hogy előnyösen hepatocelluláris karcinómákban (HCC) expresszálódik . Javasolták, hogy ezek az SCC molekulák az ‘adherinek’ családját képviselik, amelyek a szekvencia homológia nagy központi magtartományán osztoznak .
az Scc4-et az open reading frame (ORF) yer147c termékeként azonosították , és 624 aminosavból álló szekvenciát tartalmaz, amely AMP-kötő motívumot tartalmaz. Azonban az Scc2-vel való kölcsönhatáson és a testvérkromatid kohézió kialakításában való részvételen kívül keveset tudunk erről a fehérjéről. Az Scc4-nek nincs azonosítható szekvencia homológja sem a teljes szekvencia, sem az EST adatbázisokban, ezért egy árva gén terméke lehet.
kohéziós interakciós hálózat
kohéziós interakciós hálózatot hoztak létre két proteom adatbázisból és a szakirodalomból származó információk összegyűjtésével (3.ábra). A 3. ábrán a fehérjék között vonalakat húzunk az ismert vagy potenciális kölcsönhatások jelzésére. Az adatok, amelyekből az interakciók származnak, egy részletes kulcsban vannak feltüntetve, amely megkülönbözteti a két proteomikus adatbázist (és az egyes adatbázisokon belüli különböző adatforrásokat) és az irodalmat. Négy fehérje (Esp1, Trf4, Prp11 és Tid3) közvetlenül kölcsönhatásba lép az SMC vagy SCC fehérjékkel a S. cerevisiae-ben. Az Esp1 és az Scc1 kölcsönhatása jelenleg funkcionális szinten ismert, fontosságát már megvitatták. Ez a kölcsönhatás időfüggő, és nem azonosították az élesztő két hibrid képernyőn, és ez az információ jelenleg nincs rögzítve az YPD-ben.
a Trf4 egy fehérje, amely részt vesz mind a mitotikus kromoszóma kondenzációban, mind a testvér-kromatid kohézióban . X-Ben. a laevis Trf4 kölcsönhatásba lép az Smc1-gyel és az Smc2-vel , az S. cerevisiae-ben pedig a Trp4 kölcsönhatásba lép az Smc1-gyel és a Trf5-tel , a TRF család egy másik tagjával. Trf4 homológokat azonosítottak az S. pombe, a C. elegans, a Drosophila, a human és az Arabidopsis fajokban (2.táblázat). A Trf4-et nemrégiben DNS-polimerázként azonosították, és ma már DNS-polimeráznak (a nukleáris DNS-polimerázok negyedik osztályának) nevezik . Az S. cerevisiae trf4 távoli homológjai közé tartozik a koffein által kiváltott sejthalál fehérje I (Cid1) S. pombe-ban (13.4% szekvencia-Azonosság) és a polinukleotid adeniltranszferáz enzimet számos organizmusból, köztük az S. pombe-ból és az emberből (sorrendben 10,2% és 9,7% szekvencia-Azonosság). A Cid1 különösen érdekes, mivel úgy gondolta, hogy szerepet játszik A S-M ellenőrzőpont útvonal S. pombe-ban . A Trf4 homológjaként a cid1 lehet a kapcsolat a testvérkromatid kohézió és az ellenőrzőpont útvonal között.
a Prp11 egy élesztő splicing faktor, amely részt vesz a spliceosomal összeszerelési út korai szakaszában . A Prp11 egy 266 aminosav fehérje, amely tartalmaz egy cink-ujj domént, amely közös az RNS-kötő fehérjékkel . Ez a splicing faktor komplexet képez két másikkal, a Prp9-gyel és a Prp21-gyel, amelyek a Prp5-tel együtt szükségesek az U2 snRNP pre-mRNS-hez való kötődéséhez . Ennek a splicing faktornak vannak homológjai S. pombe, C. elegans, Drosophila, Arabidopsis, egér és ember (2.táblázat), és mindegyik tartalmazza az RNS-kötő motívumot. Egérben és emberben a homológ a SAP62 (spliceosome-associated protein), egy spliceosomal protein, amely kötődik a pre-mRNS-hez a prespliceosomal komplexben .
Tid3 (NCD80) egy orsó pólusú testfehérje, amelynek homológjai vannak számos eukariótában (2.táblázat). Az előrejelzések szerint a Tid3 kölcsönhatásba lép az Smc1-gyel és az Smc2-vel, és kísérletileg kimutatták, hogy kölcsönhatásba lép az Spc24-gyel, az orsóoszlop testének egy másik összetevőjével. A tid3, Hec1, valamint a humán Smc1 és Smc2 homológok humán homológja között kölcsönhatásokat is megfigyeltek . A tid3 kölcsönhatása mind a kohéziós, mind a kondenzin makromolekulák alegységeivel a Trf4 és az Scc1 mellé helyezi, mint mindkét mechanizmus szerves részét képező fehérje. Azt is javasolják, hogy a Hec1 részt vegyen a kromatin összeállításában a centromérában és a kinetochore szabályozásában . Az Spc24, a Tid3 egyik interakciós partnere szintén kölcsönhatásba lép a Prp11-gyel, az élesztő splicing faktorral, amely az scc2-vel való kölcsönhatása révén kapcsolódik a kohéziós terhelési tényezőkhöz (3.ábra).
egy közös upstream DNS elem
a kohéziós hálózatban 17 fehérjét kódoló gének upstream régióit (3.ábra) kerestük közös motívumok segítségével AlignACE. Három konszenzusos motívumot azonosítottak,amelyek közösek voltak a 17 gének. Csak egy motívumot találtak viszonylag specifikusnak, azonban az SGD-ben csak 29 gén upstream szekvenciáját illesztették össze (lásd az anyagokat és módszereket). Ez a motívum az a6acgcgth2rxaax konszenzusos szekvenciával rendelkezik, és tartalmazza az MluI cell-cycle box (MCB) elemet (consensus sequence ACGCGT) . A jelenlegi munkában talált kiterjesztett konszenzus motívum az Scc1, Scc3, Smc3, Pds1, Eco1 és Spc24 kódoló gének upstream régióiban volt jelen. Ez a motívum 123-299 bázispár (bp) között helyezkedett el a hat fehérjét kódoló gének előtt. Az SGD kutatása 23 további gént tárt fel, amelyek ezt az upstream motívumot tartalmazzák. E további gének közül nyolc ismeretlen funkciójú hipotetikus fehérjéket kódolt. Ezek a további gének azonban magukban foglalták a chaperonokat (JEM1 és PDI1n), a transzkripciós faktor komponenseket (TFA1, RFA2, RNS polimeráz II, SPT20 és PRT1) és a proteaszóma YC komponensét is. Amikor a keresést 2000 bp-re kiterjesztették az élesztő Genom 5′ nem lefordított régióitól felfelé, a trf4-et kódoló génről is kiderült, hogy tartalmazza ezt a konszenzus motívumot (1560 bp upstream).
megosztott motívumok a kohéziós interakciós hálózaton belül
Teiresias, egy minta-felfedező algoritmust használtak a közös motívumok keresésére két vagy több szekvencia között a kohéziós hálózat 17 fehérjéjében. A legtöbb közös motívummal rendelkező fehérje három volt, és ez volt a három SMC fehérje, amelyek nagy szekvenciájú azonossággal rendelkeznek, és megosztják az ismert Prosit motívumokat (3.táblázat). Érdekesebbek voltak 24 a hálózatban lévő fehérjepárok között talált mintaegyezések. Számos fehérje egynél több szekvencia motívumot oszt meg ugyanazzal a fehérjével. Az összes közös motívum vagy a kohéziós hálózat két fehérjéjére jellemző volt, vagy három motívum esetében egy másik fehérjeszekvencia osztotta meg.
az egyik motívum, amelyet a hálózat két szekvenciája és egy további szekvencia oszt meg, a Dxxpenixlxkn motívum, amelyet az Scc2, a Chk1 és a harmadik S. cerevisiae protein PKH1 (élesztő ORF YDR490C) szekvenciái osztanak meg (4.ábra). Mind a Chk1, mind a PKH1 szerin/treonin (ST) protein kinázok, és az Scc2-vel megosztott motívum magában foglalja a PROSITE ST kináz aláírási motívum egy részét (XXDKXXN(3), ahol X bármilyen maradékot jelöl, (3) azt jelzi, hogy az előző maradékot háromszor megismételjük, és D az aktív hely maradéka). Az Scc2 szekvenciája nem egyezik pontosan az ST kináz aláírási motívummal. Az ST-kináz motívum 13 maradéka közül az Scc2-nek négy eltérése van, de fontos, hogy az aktív helyű aszparaginsav konzerválódik.
a kohéziós hálózatba nem tartozó harmadik fehérje második motívuma az SXXSXLKKKXLXT volt; ez megtalálható az Scc1-ben, az Scc2-ben és az ORF yhr011w élesztőben, egy feltételezett szeril-tRNS-szintetázban (5a.ábra). Ez a motívum azonban nem volt része a tRNS ligáz motívum nak, – nek YHR011W, vagy bármely más ismert motívum ezen a sorozaton belül. A harmadik motívum, amelyet a kohéziós hálózaton kívüli fehérje osztott meg, az NDXNXDDXDN volt, amelyet az Scc1, az Smc1, valamint a Plasmodium yoelii P-típusú Atpáza osztott meg (5b ábra). Az Scc4 az egyik kohéziós terhelési tényező, amelyre nem találtak ismert homológot. Ez a fehérje azonban 10-szermaradék-szekvencia-motívumot (GKXVALTNAK) oszt meg az Smc3-Mal (5c ábra).
a securin Pds1 egy anafázis inhibitor , amely megsemmisítő doboz motívumot (RXXXLXXXXN) tartalmaz, amely ezt a fehérjét az APC ubiquitin ligáz általi megsemmisítésre célozza. Három megsemmisítő doboz motívumot találtunk Az Smc3-ban, egyet a zsanér régióban (a 682-es pozícióban, RTRLESLKN), kettőt a második tekercselt tekercs tartományban (egyet a 744-es pozícióban (RTSLNTKKN) és egyet a 920-as pozícióban (RLLLKKLDN)). Találtunk egy KEN-box motívumot (egy további APC felismerő jelet ) az SMC2-ben a 304-es pozícióban (KENGLLN), az első tekercselt tekercs tartományban.