kompleks cohesin: homologie sekwencji, sieci interakcji i wspólne motywy

homologi białek kohezynowych

białka SMC

PSI-BLAST poszukiwanie homologów sekwencji SMC1 i SMC3 z Saccharomyces cerevisiae ujawniło homologi z wielu gatunków eukariotów, archaea, oraz eubakterii, jak wcześniej opisano (tabela 1). Te badania homologiczne stanowiły podstawę dla drzewa filogenetycznego i analizy nowych sekwencji homologów.

Tabela 1 białka zaangażowane w kohezję chromatyd siostrzanych w S. cerevisiae i ich homologi sekwencyjne

drzewo filogenetyczne SMC utworzone z dopasowania homologów SMC3 (Rysunek 2) ujawnia pięć rodzin: Smc1-Smc4 od eukariotów i piątą rodzinę „przodków”, która obejmuje SMC z eubacteria i archaea. Ta rodzina przodków obejmuje również wiele białek eukariotycznych z S. cerevisiae, Schizosaccharomyces pombe, Caenorhabditis elegans, Drosophila melanogaster i ludzi. Każda z tych eukariotów ma białka SMC ze wszystkich pięciu rodzin. Eukariotyczne białka w rodzinie przodków obejmują Rad18 z S. pombe i Rhc18, homolog Rad18 z S. cerevisiae. Rad18 w S. pombe bierze udział w naprawie DNA uszkodzonego przez promieniowanie UV . Sekwencje z C. elegans, Drosophila i human, które grupują Rad18 w obrębie rodziny przodków, prawdopodobnie są homologami Rad18. Również w tej grupie jest Spr18, białko SMC zaproponowane jako homodimeryczny partner rad18 w S. pombe . Ponadto MukB z Escherichia coli również należy do tej rodziny przodków. Wiadomo, że MukB jest niezbędny do podziału chromosomów u tego gatunku . Klastrowanie homologów Rad18 z przodkowymi białkami SMC nie jest obserwowane w drzewie filogenetycznym zbudowanym przez Cobbe i Hecka .

Rysunek 2
figurka2

drzewo ewolucyjne dla białek SMC, stworzone przy użyciu PHYLIP . Każda z pięciu rodzin SMC jest podświetlona i oznaczona. Podkreślono nazwy białek eukariotycznych obecnych w rodzinie przodków. Wartości Bootstrap ze 100 próbek Bootstrap są pokazane na głównych gałęziach drzewa. WODA, Aquifex aeolicus; ARATH, Arabidopsis thaliana; ARCFU, Archaeoglobus fulgidus; ASPN, aspergillus gumtree czarny; БАКСУ, rodzaj cienkiej laski; CAEEL, Caenorhabditis elegancki; CAUCR, Caulobacter crescentus; DROS, drozofila; ЭКОЛИ, e. coli; ЯППУ, japońska ryba fugu; МЕТЬЯ, метанококк яннащии; MUZ, mysz; MYCGE, mycoplasma генитальная; MYCHR, Mycoplasma гиоринис; MYCPN, Микоплазменная zapalenie płuc; PYRAB, Pyrococcus abyssii; PYRHO, Pyrococcus horikoshii; SCHP, Schizosaccharomyces pombe; SYNSP, Synechocystis Sp.; THEMA, Thermotoga maritima; TREPA, Treponema pallidum; XENLA, XENO, Xenopus laevis; drożdże, Saccharomyces cerevisiae.

jeden niezwykły homolog sekwencji SMC3 u myszy (SMCD) został już opisany w postaci bamacanu, proteoglikanu siarczanu chondroityny . Wiadomo, że białko to ma 100% identyczności sekwencyjnej z SMCD . Tutaj identyfikujemy kolejny nowy homolog, mmip1, który również ma bardzo wysoką tożsamość sekwencji z myszą SMCD. Mmip1 (Mad interacting protein 1) zidentyfikowano na podstawie dwu-hybrydowego ekranu drożdży dla białek wiążących MXI, podstawowy czynnik transkrypcyjny helix-loop-helix (bHLH). Mmip1 jest podstawowym białkiem helix-loop-helix zipper (bHLH-ZIP), które silnie dimeryzuje z Mad1, MXI, Mad3 i Mad4, ale nie z Max lub C-Myc . Clustal x wyrównanie Mmip1 z SMCD ujawnia, że mmip1 brakuje pierwszej domeny kulistej i pierwszej domeny zwojowej wspólnej dla białek SMC. W wyrównaniu występuje 40% identyczności sekwencji między Mmip1 i SMCD na całej długości SMCD (1217 aminokwasów). W stosunku do długości białka Mmip1 (485 aminokwasów) białko to ma 99% identyczności sekwencyjnej z SMCD. Te wysokie procentowe tożsamości sekwencji są również odzwierciedlone w sekwencjach DNA kodujących te białka. CDNA kodujące białko mmip1 jest w 100% identyczne z cDNA kodującym SMCD nad 2612 parami zasad sekwencji mmip1.

wcześniej sugerowano, że eubakteria zawiera pojedyncze przodkowe białko SMC . Psi-BLAST search for SMC homologs in the current work identified two SMC-related proteins in two species of Eubacteria, B. subtilis i Aquifex aeolicus. U obu gatunków jedna sekwencja została wcześniej zidentyfikowana jako homolog SMC, natomiast funkcja drugiej nie jest znana. Dwie sekwencje z B. subtilis mają 95% identyczności sekwencji, podczas gdy dwie sekwencje z A. aeolicus mają 20% identyczności sekwencji. Wszystkie cztery homology zawierają motyw Walkera A i B, a dwa homology z B. subtilis zawierają pięć domen charakterystycznych dla białek SMC (Fig. 1a). A. białko aeolicus znane jako homolog SMC (numer O60878) zawiera również pięć domen, w tym dwie domeny zwojowo-zwojowe oddzielone regionem zawiasowym 180-200 reszt. Drugi homolog u A. aeolicus (numer O67124) ma jednak dwie domeny zwinięte-zwojowe (przewidywane za pomocą zwojów), ale dzielący je region zawiasowy składa się tylko z około 10-20 reszt. W obecnym modelu dimerów SMC region zawiasu umożliwia złożenie struktury w mniej więcej symetryczny kompleks (rys. 1b). Za to A. aeolicus homolog, jednak bardzo krótki region zawiasów ograniczyłby zasięg składania. U tego gatunku można utworzyć dwie homodimeryczne struktury SMC, jedną z pięciodomenowego SMC i jedną z czterodomenowego homologu SMC pozbawionego domeny zawiasowej. Obecność dwóch potencjalnych homologów SMC w B. subtilis może jednak oznaczać, że heterodimeryczny model interakcji SMC zaproponowany dla eukariotów (na przykład ) może być również rozszerzony na niektóre prokarioty. Obecność dwóch homologów SMC w niektórych eubakteriach nie jest wykazana w drzewie filogenetycznym SMC zbudowanym przez Cobbe i Hecka .

białka SCC

białka SCC są obecne tylko u eukariotów i nie są tak dobrze scharakteryzowane jak białka SMC. Scc1 (identyfikowany również jako MCD1) jest fizycznie związany z protomerem SMC1 w kompleksie . Homologi U S. pombe, Xenopus laevis, ludzi i Drosophila są identyfikowane jako białka Rad21 (Tabela 1), biorące udział w naprawie dwuniciowych przerw DNA wywołanych promieniowaniem jonizującym. Scc3 (wcześniej zidentyfikowany jako IRR1 ) zawiera sekwencję lokalizacji jądrowej (patrz później) i zidentyfikowano kilka homologów (Tabela 1). Homologi Scc3 u Drosophila, myszy, ludzi i Arabidopsis są rodziną białek stromaliny, które dzielą między 20-25% identyczności sekwencji (Tabela 1). U Drosophila, myszy i człowieka istnieją dwa białka stromalin (DSA, DSA2; SA1, SA2; i STAG1, STAG2, odpowiednio), które znajdują się w jądrze, ale ich funkcja jest nieznana. Ponadto STAG3 został zidentyfikowany u ludzi i proponuje się udział w parowaniu chromosomów podczas mejozy.

Scc2 i Scc4 są ostatnio zidentyfikowanymi współczynnikami obciążenia kohezyn . Homologi do Scc2 zostały zidentyfikowane w S. pombe (Mis4) i Drosophila (Nipped-B), Coprinus cinereus (Rad9 i human (IDN3-B; numer seryjny Q9y6y3) (Tabela 1). Mis4 u S. pombe ’ a jest wymagany do równomiernego rozdzielania chromatyd w anafazie i ma funkcję odrębną od kohezyny . Produkt genu Rad9 u C. cinereus jest niezbędny do prawidłowego zakończenia mejozy. Produkt genu Nipped-B ma funkcjonować architektonicznie między wzmacniaczami transkrypcji a promotorami w celu ułatwienia interakcji wzmacniacz-promotor . Funkcja genu IDN3-B u ludzi jest nieznana, poza tym jest preferencyjnie wyrażona w raku wątrobowokomórkowym (HCC). Zaproponowano, że te cząsteczki SCC reprezentują rodzinę „adheryn”, które dzielą dużą centralną domenę homologii sekwencji .

Scc4 został zidentyfikowany jako produkt otwartej ramki odczytu (ORF) YER147C i zawiera sekwencję 624 aminokwasów , która zawiera motyw wiążący AMP. Jednak oprócz interakcji z Scc2 i udziału w tworzeniu spójności chromatyd siostrzanych, niewiele wiadomo o tym białku. Scc4 nie ma identyfikowalnych homologów sekwencyjnych ani w pełnej sekwencji, ani w bazie danych EST, i dlatego może być produktem sierocego genu.

sieć interakcji spójności

sieć interakcji spójności została utworzona przez zestawienie informacji z dwóch baz danych proteomu i literatury (Rysunek 3). Na fig. 3 linie są rysowane między białkami, aby wskazać znane lub potencjalne interakcje. Dane, z których pochodzą interakcje, są wskazane w szczegółowym kluczu, który odróżnia dwie proteomiczne bazy danych (i między różnymi źródłami danych w każdej bazie danych) i literaturę. Cztery białka (Esp1, Trf4, Prp11 i Tid3) oddziałują bezpośrednio z białkami SMC lub SCC w S. cerevisiae. Interakcja Esp1 i Scc1 jest obecnie znana na poziomie funkcjonalnym, a jej znaczenie zostało już omówione. Ta interakcja jest zależna od czasu i nie została zidentyfikowana w dwu-hybrydowym ekranie drożdży, a informacje te nie są obecnie rejestrowane w YPD.

Rysunek 3
figurka3

sieć interakcji spójności. Linie łączące białka wskazują na znane lub potencjalne interakcje pochodzące z dwóch proteomicznych baz danych i literatury. Kohezyna i czynniki obciążające są na Żółto; dodatkowe białka zaangażowane w kohezynę lub oddziałujące z kohezyną lub czynniki obciążające są na niebiesko; wszystkie inne białka w sieci są białe. Białka zarysowane pudełkami są częścią kompleksów Makromolekularnych. Prp11 jest częścią kompleksu w szlaku spliceosomalnym, a Apc2 jest częścią kompleksu promującego anafazę (APC). Tid3p i Spc24 są częścią korpusu wrzeciona-bieguna. Czarne linie wskazują na białka tworzące interakcje dimeryczne. Sieć spójności 17 białek obejmuje wszystkie te oznaczone, z wyjątkiem Apc2, Tid4, Tid1 i Rad51.

Trf4 jest białkiem biorącym udział zarówno w kondensacji mitotycznej chromosomu, jak i w kohezji siostrzano-chromatydowej . W X. laevis Trf4 współdziała z Smc1 i Smc2, a u S. cerevisiae Trp4 współdziała z smc1 i Trf5 , innym członkiem rodziny TRF. Homologi Trf4 zostały zidentyfikowane u S. pombe, C. elegans, Drosophila, human i Arabidopsis (Tabela 2). Trf4 został niedawno zidentyfikowany jako polimeraza DNA o właściwościach podobnych do β-polimerazy i jest obecnie określany jako polimeraza DNA κ (czwarta klasa nuklearnych polimeraz DNA) . Zdalne homologi S. cerevisiae Trf4 obejmują białko śmierci komórek wywołane kofeiną I (Cid1) U S. pombe (13.4% identyczności sekwencji) i enzym adenylotransferazy polinukleotydowej z wielu organizmów, w tym S. pombe i ludzi (odpowiednio 10,2% i 9,7% identyczności sekwencji). Cid1 jest szczególnie interesujące, ponieważ uważa się, że odgrywa rolę w S-M Checkpoint pathway w S. pombe . Jako homolog Trf4, Cid1 może być łącznikiem między kohezją chromatyd siostrzanych a tą ścieżką punktu kontrolnego.

Tabela 2 trzy kohezyny oddziałujące z białkami S. cerevisiae i ich homologi sekwencyjne

Prp11 jest czynnikiem splicingu drożdży biorącym udział we wczesnych stadiach szlaku łączenia spliceosomalnego . Prp11 jest białkiem 266 aminokwasowym, które zawiera domenę palców cynkowych wspólną dla białek wiążących RNA . Ten czynnik splicingowy tworzy kompleks z dwoma innymi, Prp9 i Prp21, które wraz z Prp5 są wymagane do wiązania U2 snRNP z pre-mRNA. Istnieją homologi tego czynnika splicingowego U S. pombe, C. elegans, Drosophila, Arabidopsis, myszy i ludzi (Tabela 2) i wszystkie zawierają motyw wiążący RNA. U myszy i ludzi homologiem jest SAP62 (białko związane ze spliceosomem), białko spliceosomalne, które wiąże się z pre-mRNA w kompleksie prespliceosomalnym .

TID3 (NCD80) to białko ciała wrzeciona, które ma homologi u wielu eukariotów (Tabela 2). Przewiduje się, że Tid3 wchodzi w interakcje z Smc1 i Smc2, a eksperymentalnie wykazano, że wchodzi w interakcje z spc24, innym składnikiem korpusu bieguna wrzeciona. Zaobserwowano również interakcje pomiędzy ludzkim homologiem Tid3, Hec1 i ludzkimi homologami Smc1 i Smc2 . Interakcje Tid3 z podjednostkami makromolekuł kohezyny i kondenzyny, umieszczają ją obok Trf4 i Scc1, jako białko integralnie zaangażowane w oba mechanizmy. Proponuje się również, że Hec1 może uczestniczyć w montażu chromatyny w centromerze i regulacji kinetochoru . Spc24, jeden z partnerów interakcji Tid3, również oddziałuje z Prp11, czynnikiem splicingu drożdży, który jest powiązany z czynnikami obciążenia kohezyną poprzez jej interakcję z Scc2 (Fig.3).

wspólny element DNA

regiony genów kodujących 17 białek w sieci kohezynowej (Fig. 3) przeszukiwano pod kątem wspólnych motywów za pomocą AlignACE. Zidentyfikowano trzy motywy konsensusu, które były wspólne dla podzbiorów 17 genów. Tylko jeden motyw okazał się stosunkowo specyficzny, jednak pasujący do sekwencji wyjściowych tylko 29 genów w SGD (patrz materiały i metody). Ten motyw ma sekwencję konsensusu A6ACGCGTH2RXAAX i zawiera element mlui cell-cycle box (MCB) (Sekwencja konsensusu ACGCGT) . Rozszerzony motyw konsensusu znaleziony w obecnej pracy był obecny w regionach wyjściowych genów kodujących Scc1, Scc3, Smc3, Pds1, Eco1 i Spc24. Motyw ten znajdował się pomiędzy 123-299 parami zasad (bp) przed genami kodującymi te sześć białek. Poszukiwania SGD ujawniły 23 dodatkowe geny zawierające ten motyw. Osiem z tych dodatkowych genów kodowało hipotetyczne białka o nieznanej funkcji. Jednak te dodatkowe geny obejmowały również te kodujące białka opiekuńcze (JEM1 i PDI1n), składniki czynnika transkrypcyjnego (TFA1, RFA2, polimeraza RNA II, SPT20 i PRT1) oraz składnik YC proteasomu. Gdy poszukiwania zostały rozszerzone do 2000 bp w kierunku 5 ’ nieprzetłumaczonych regionów genomu drożdży, gen kodujący Trf4 również zawierał ten motyw konsensusu (1560 bp w kierunku).

wspólne motywy w ramach sieci interakcji spójności

teiresias, algorytm wykrywania wzorców , został użyty do wyszukiwania wspólnych motywów między dwiema lub więcej sekwencjami w 17 białkach sieci spójności. Największą liczbą białek dzielących wspólny motyw były trzy, a były to trzy białka SMC, które mają wysoką identyczność sekwencji i mają znane motywy Prosytowe(Tabela 3). Bardziej interesujące były 24 dopasowania wzorców znalezione pomiędzy parami białek w sieci. Wiele białek dzieli więcej niż jeden motyw sekwencji z tym samym białkiem. Wszystkie wspólne motywy były albo specyficzne dla dwóch białek w sieci spójności, albo w przypadku trzech motywów, wspólne dla jednej innej sekwencji białkowej.

Tabela 3 motywy sekwencji PROSYTOWEJ zlokalizowane za pomocą ProfileScan w białkach biorących udział w siostrzanym mechanizmie spójności chromatyd

jednym motywem współdzielonym przez dwie sekwencje w sieci i jedną dodatkową sekwencją jest motyw DXXPENIXLXKN współdzielony przez sekwencje Scc2, Chk1 i trzecie białko S. cerevisiae PKH1 (drożdże ORF YDR490C) (Fig.4). Zarówno CHK1, jak i PKH1 są kinazami białkowymi serynowo-treoninowymi (ST), a motyw, który dzielą z Scc2, obejmuje część motywu sygnatury PROSYTOWEJ kinazy ST (XXDKXXN(3), gdzie X oznacza dowolną pozostałość, (3) wskazuje, że poprzednia pozostałość jest powtarzana trzy razy, A D jest pozostałością miejsca aktywnego). Sekwencja Scc2 nie pasuje dokładnie do motywu sygnatury kinazy ST. Spośród 13 reszt w motywie kinazy ST, Scc2 ma cztery niedopasowania, ale, co ważne, kwas asparaginowy w miejscu aktywnym jest konserwowany.

Rysunek 4
figurka4

wyrównanie sekwencji zachowanego motywu w Scc2, Chk1 i Pkh1, które obejmuje motyw kinazy białkowej seryny/treoniny (s/t). W wyrównaniu zachowane pozostałości motywu zidentyfikowanego za pomocą Teiresias są w kolorze czerwonym, a dodatkowe zachowane pozycje są w kolorze zielonym. Pozostałości, które pokrywają się z motywem kinazy S / T, są zaznaczone ramką. Liczba przed każdym motywem wskazuje pozycję pierwszej pozostałości w kompletnej sekwencji. Motyw kinazy prozy S / T jest pokazany pod wyrównaniem. Alternatywne pozostałości przedstawiono w nawiasach kwadratowych; X oznacza dowolną pozostałość; kwas asparaginowy w miejscu aktywnym jest oznaczony kolorem niebieskim.

drugim motywem współdzielonym przez trzecie białko nieuwzględnione w sieci spójności był SXXSXLKKXLXT; znajduje się to w Scc1, Scc2 i drożdżach ORF YHR011W, przypuszczalnej syntetazie serylo-tRNA (Fig.5a). Jednak motyw ten nie był częścią motywu ligazy tRNA yhr011w, ani żadnego innego znanego motywu w tej sekwencji. Trzecim motywem współdzielonym przez białko spoza sieci spójności był NDXNXDDXDN, współdzielony przez Scc1, Smc1 i Atpazę typu P z Plasmodium yoelii (Fig.5b). Scc4 jest jednym z czynników obciążających kohezynę, dla których nie znaleziono znanego homologa. Stwierdzono jednak, że białko to współdziała z 10-resztowym motywem sekwencji (GKXVALTNAK) z Smc3 (Fig.5c).

Rysunek 5
figurka5

wyrównania sekwencji dla trzech motywów współdzielonych przez białka w sieci spójności. a) motyw współdzielony przez Scc2 i Trf4 w sieci oraz przypuszczalna syntetaza serylo-tRNA (YHH1) z drożdży. B) motyw wspólny dla Scc1, Smc1 i ATPazy typu P z Plasmodium yoelii. C) motyw współdzielony przez współczynnik obciążenia spójnego Scc4 i SMC3. W każdym wyrównaniu zachowane pozostałości motywu zidentyfikowanego za pomocą Teiresias są w kolorze czerwonym, a dodatkowe zachowane pozycje są w kolorze zielonym. Liczba przed każdym motywem wskazuje pozycję pierwszej pozostałości w kompletnej sekwencji.

securin Pds1 jest inhibitorem anafazy, który zawiera motyw pudełka destrukcyjnego (RXXXLXXXN), który celuje w to białko w celu zniszczenia przez ligazę ubikwityny APC. W Smc3 znaleźliśmy trzy motywy skrzynek destruction box, jeden w regionie zawiasów (w pozycji 682, RTRLESLKN) i dwa w drugiej domenie coiled-coil (jeden w pozycji 744 (RTSLNTKKN) i jeden w pozycji 920 (RLLLKKLDN)). Znaleźliśmy również motyw KEN-box (dodatkowy sygnał rozpoznawania APC) w SMC2 w pozycji 304 (KENGLLN), w pierwszej domenie coiled-coil.



+