コヒーシン複合体:配列相同性、相互作用ネットワークおよび共有モチーフ

コヒーシン蛋白質の同族体

SMC蛋白質

SACCHAROMYCES cerevisiaeからSMC1およびSMC3の配列相同性のPSI-BLAST検索は、真核生物、古細菌および多くの種からの同族体を明らかにした。以前に報告された真正細菌(表1)。 これらの相同性検索は、系統樹と新しい配列相同体の分析のための基礎を提供した。

表1s.cerevisiaeの姉妹染色分体凝集に関与するタンパク質とその配列相同体

SMC3相同体のアライメントから作成されたSMC系統樹(図2)は、真核生物からのSmc1-Smc4と真正細菌と古細菌からのSMCsを含む第五の”先祖”ファミリーを明らかにする。 この祖先の家族はまたS.cerevisiae、Schizosaccharomyces pombe、Caenorhabditis elegans、ショウジョウバエmelanogasterおよび人間からの多くの真核生物蛋白質を含んでいます。 これらの真核生物のそれぞれは、すべての5つの家族からSMCタンパク質を持っています。 祖先の家族内の真核生物の蛋白質はS.pombeからのRad18およびRhc18、S.cerevisiaeのrad18ホモログを含んでいます。 S.pombeのrad18は紫外線放射によって損なわれるDNAの修理にかかわります。 C.elegans、ショウジョウバエ、ヒトからの配列は、先祖の家族の中でRad18とクラスター Rad18相同体である可能性が高いです。 また、このグループ内にクラスター化されたSpr18は、S.pombeのrad18のホモ二量体パートナーであることが提案されたSMCタンパク質である。 さらに、大腸菌からのMukBもこの先祖の家族の中にあります。 MukBはこの種の染色体の分配のために必要であると知られています。 祖先SMCタンパク質とRad18相同体のクラスタリングは、CobbeとHeckによって構築された系統樹では観察されない。

フィギュア2
図2

PHYLIPを使用して作成されたSMCタンパク質の進化ツリー。 5つのSMCファミリのそれぞれが強調表示され、ラベル付けされています。 祖先の家族に存在する真核生物のタンパク質の名前に下線が引かれています。 100回のブートストラップ試行からのブートストラップ値は、ツリーのプライマリ枝に表示されます。 水、Aquifex aeolicus;ARATH、Arabidopsis thaliana;ARCFU、Archaeoglobus fulgidus;ASPN、aspergillus unique black;BACSU、bacillus subtle;CAEEL、Caenorhabditis elegant;CAUCR、Caulobacter crescentus;DROS、ショウジョウバエ;ECOLI、大腸菌;JAPPU、日本のフグ;METJA、Methanococcus jannaschii;MUS、マウス;MYCGE、Mycoplasma性器;MYCHR,Mycoplasma hyorhinis;Mycpn,mycoplasma PNEUMONIA;Pyrab,pyrococcus abyssii;pyho,pyrococcus HORIKOSHII;schp,SCHIZOSACCHAROMYCES Pombe; SYNSP,Synechocystis sp.;THEMA、Thermotoga maritima;TREPA、Treponema pallidum;XENLA、XENO、Xenopus laevis;酵母、Saccharomyces cerevisiae。

マウス(SMCD)におけるSMC3の一つの異常なシーケンスホモログは、すでにバマカン、コンドロイチン硫酸プロテオグリカンの形で報告されています。 このタンパク質は、SMCDに対して1 0 0%の配列同一性を有することが知られている。 ここでは、マウスSMCDと非常に高い配列同一性を共有する別の新しいホモログ、Mmip1を識別します。 Mmip1(Mad相互作用タンパク質1)は、mxi、基本的なヘリックスループヘリックス(bHLH)転写因子を結合するタンパク質の酵母ツーハイブリッドスクリーンから同定された。 Mmip1は、Mad1、Mxi、Mad3およびMad4と強く二量化するが、Maxまたはc-Mycとは強く二量化しない基本的なヘリックスループヘリックスジッパー(bHLH-ZIP)タンパク質である。 SMCDとMmip1のClustal Xアライメントは、Mmip1が最初の球状ドメインとSMCタンパク質に共通の最初のコイルドコイルドメインを欠いていることを明らかに アライメントでは、SMCDの全長にわたってMmip1とSMCDの間に40%の配列同一性がある(1,217アミノ酸)。 しかし、Mmip1タンパク質(485アミノ酸)の長さにわたって、タンパク質はSMCDと99%の配列同一性を共有しています。 これらの高い割合の配列同一性は、これらのタンパク質をコードするDNA配列にも反映される。 Mmip1タンパク質をコードするcDNAは、Mmip1配列の2,612塩基対にわたってSMCDをコードするcDNAと100%同一である。

真正細菌には単一の祖先SMCタンパク質が含まれていることが以前に示唆されています。 現在の研究におけるSMC相同体のPSI-BLAST検索は、真正細菌の二つの種、Bにおける二つのSMC関連タンパク質を同定した。 スブチリスとアキフェックスaeolicus。 両方の種において、一つの配列は以前にSMCホモログとして同定されていたが、第二の機能は不明である。 B.subtilis由来の2つの配列は9 5%の配列同一性を共有し、一方、A.aeolicus由来の2つの配列は2 0%の配列同一性を共有する。 すべての4つの同族体はウォーカー AとBモチーフを含み、b.subtilis由来の2つの同族体はSMCタンパク質に特徴的な5つのドメインを含んでいます(図1a)。 ザ-A. SMCホモログ(TrEMBLアクセッション番号O60878)であることが知られているaeolicusタンパク質はまた、180-200残基のヒンジ領域によって分離された二つのコイル状コイルドドメインを含む五つのドメインを含む。 しかし、A.aeolicus(TrEMBLアクセッション番号O67124)の第二相同体は、二つのコイルコイルドメイン(コイルを使用して予測)を有するが、それらを分離するヒンジ領域は約10-20残基で構成されている。 SMC二量体の現在のモデルでは、ヒンジ領域は、構造のほぼ対称的な複合体への折り畳みを可能にする(図1b)。 このAのために。 しかし、aeolicusホモログは、非常に短いヒンジ領域は、折り畳みの範囲を制限するだろう。 この種では,二つのホモ二量体SMC構造が形成され,一つは五ドメインSMCから,一つはヒンジドメインを欠く四ドメインSMCホモログから形成された。 しかし、枯草菌における二つの潜在的なSMC相同体の存在は、真核生物(例えば、)のために提案されたSMC相互作用のヘテロ二量体モデルもいくつかの原核生物に拡張することができることを意味する可能性がある。 いくつかの真正細菌における二つのSMC同族体の存在は,CobbeとHeckによって構築されたSMC系統樹には示されていない。

SCCタンパク質

SCCタンパク質は真核生物にのみ存在し、SMCタンパク質ほど特徴づけられていない。 Scc1(またMCD1として識別される)は複合体のSMC1プロトマーと物理的に関連付けられています。 S.pombe、アフリカツメガエルlaevis、ヒトおよびショウジョウバエの同族体は、電離放射線によって誘導されるDNA二本鎖切断の修復に関与するRad21タンパク質(表1)と同定されている。 Scc3(以前はIRRL1として同定されていた)は核局在配列(後に参照)を含み、多数の同族体が同定されている(表1)。 ショウジョウバエ、マウス、ヒトおよびシロイヌナズナにおけるscc3相同体は、20-25%の配列同一性を共有するストロマリンタンパク質のファミリーである(表1)。 ショウジョウバエ、マウス、ヒトには、核に位置する二つのストロマリンタンパク質(それぞれdSA、dsa2、SA1、SA2、STAG1、STAG2)があるが、その機能は不明である。 さらに、STAG3はヒトで同定されており、減数分裂中の染色体ペアリングに関与することが提案されている。

Scc2およびScc4は最近同定されたコヒーシン負荷因子である。 Scc2への同族体はSで同定されている。 pombe(Mis4)およびDrosophila(Nipped−B)、Coprinus cinereus(Rad9およびヒト(IDN3−B;Trembl受託番号Q9Y6Y3)(表1)。 S.pombeのmis4は後期に等しい染色分体分離のために必要とされ、コヒーシンとは異なる機能を持っています。 C.cinereusのRad9遺伝子産物は減数分裂の正常な完了のために必要である。 Nipped-B遺伝子産物は,エンハンサー-プロモーター相互作用を促進するために転写エンハンサーとプロモーターの間で構造的に機能することが提案されている。 ヒトにおけるIDN3-B遺伝子の機能は、肝細胞癌(HCC)で優先的に発現される以外は不明である。 これらのSCC分子は,配列相同性の大きな中心コアドメインを共有する”接着剤”のファミリーを表すことが提案されている。

Scc4はopen reading frame(ORF)YER147Cの産物として同定され、AMP結合モチーフを含む624アミノ酸の配列を含む。 しかし、Scc2と相互作用し、姉妹染色分体凝集の確立に関与している以外に、このタンパク質についてはほとんど知られていない。 Scc4は、完全配列またはESTデータベースのいずれかで識別可能な配列相同体を持っていないため、孤児遺伝子の産物である可能性があります。

凝集相互作用ネットワーク

二つのプロテオームデータベースと文献からの情報を照合することによって凝集相互作用ネットワークが作成されました(図3)。 図3では、既知の相互作用または潜在的な相互作用を示すために、タンパク質間に線が引かれています。 相互作用が導出されるデータは、2つのプロテオームデータベース(および各データベース内の異なるデータソース間)と文献を区別する詳細なキーで示されています。 四つのタンパク質(Esp1、Trf4、Prp11およびTid3)は、S.cerevisiaeのSMCまたはSCCタンパク質と直接相互作用する。 Esp1とScc1の相互作用は、現在、機能レベルで知られており、その重要性はすでに議論されている。 この相互作用は時間依存性であり、酵母ツーハイブリッドスクリーンでは同定されておらず、この情報は現在YPDに記録されていない。

フィギュア3
図3

結束の相互作用ネットワーク。 タンパク質を接続する線は、二つのプロテオームデータベースと文献から派生したとして、既知または潜在的な相互作用を示しています。 コヒーシンおよび負荷要因は黄色にあります;結合にかかわるか、またはコヒーシンまたは負荷要因と相互に作用する付加的な蛋白質は青にあります; ネットワーク内の他のすべてのタンパク質は白色である。 箱で概説されたタンパク質は、高分子複合体の一部である。 Prp11はスプライセオソーム経路における複合体の一部であり、Apc2は後期促進複合体(APC)の一部である。 Tid3pおよびSpc24は紡錘棒ボディの両方部分である。 黒い実線は二量体相互作用を形成するタンパク質を示している。 17タンパク質の凝集ネットワークには、Apc2、Tid4、Tid1およびRad51を除く標識されたすべてのものが含まれる。

Trf4は、有糸分裂染色体凝縮と姉妹染色分体凝集の両方に関与するタンパク質である。 Xでは… laevis Trf4はSmc1およびSmc2と相互作用し、S.cerevisiaeではTrp4はSmc1およびTrf5、TRFファミリーの別のメンバーと相互作用する。 Trf4相同体は、S.pombe、c.elegans、ショウジョウバエ、ヒトおよびシロイヌナズナにおいて同定されている(表2)。 Trf4は最近、β-ポリメラーゼ様の性質を持つDNAポリメラーゼとして同定され、現在はDNAポリメラーゼγ(核DNAポリメラーゼの第四クラス)と命名されている。 S.cerevisiae Trf4のリモート同族体には、s.pombeのカフェイン誘導細胞死タンパク質I(Cid1)が含まれています(13。4%の配列同一性)およびS.pombeおよびヒトを含む多くの生物からのポリヌクレオチドアデニルトランスフェラーゼ酵素(それぞれ10.2%および9.7%の配列同一性)。 Cid1は、s.pombeのS-Mチェックポイント経路に関与していると考えられているため、特に興味深いものである。 Trf4のホモログとして、Cid1は、姉妹染色分体の凝集とこのチェックポイント経路との間のリンクである可能性があります。

表2Sからの三つのコヒーシン相互作用タンパク質。 cerevisiaeおよびそれらの配列同族体

Prp11は、スプライセソームアセンブリ経路の初期段階に関与する酵母スプライシング因子である。 Prp11はRNA結合蛋白質に共通の亜鉛指の範囲を含んでいる266アミノ酸蛋白質です。 このスプライシング因子は、Prp5とともにU2snRNPのプレmRNAへの結合に必要とされるprp9およびPrp21の二つの他の複合体を形成する。 S.pombe、c.elegans、ショウジョウバエ、シロイヌナズナ、マウスおよびヒトにはこのスプライシング因子の同族体があり(表2)、すべてRNA結合モチーフが含まれている。 マウスとヒトでは、ホモログはSAP62(スプライセオソーム関連タンパク質)、プレスプリセオソーム複合体のプレmRNAに結合するスプライセオソームタンパク質である。

Tid3(NCD80)は、多くの真核生物に同族体を持つスピンドル極体タンパク質である(表2)。 Tid3はSmc1およびSmc2と相互作用すると予測され、スピンドル極体の別の成分であるSpc24と相互作用することが実験的に示されている。 Tid3、Hec1、およびヒトSmc1およびSmc2相同体のヒト相同体間の相互作用も観察されている。 Tid3とコヒーシンとコンデンシンの両方の高分子のサブユニットとの相互作用は、Trf4とScc1と並んで、両方のメカニズムに一体的に関与するタンパク質として配置されている。 また、Hec1は動原体と動原体の調節におけるクロマチンアセンブリに関与している可能性があることが提案されている。 Tid3の相互作用パートナーの一つであるspc24は、Scc2との相互作用を介してコヒーシン負荷因子にリンクされている酵母スプライシング因子Prp11と相互作用する(図3)。

共通の上流DNA要素

コヒーシンネットワーク内の17タンパク質をコードする遺伝子の上流領域(図3)は、AlignACEを使用して共有モチーフを検索しました。 三つのコンセンサスモチーフは、17遺伝子のサブセットに共通していた同定されました。 しかし、一つのモチーフだけが比較的特異的であることが判明したが、SGDの唯一の29遺伝子の上流配列に一致した(材料と方法を参照)。 このモチーフは、コンセンサス配列A6ACGCGTH2RXAAXを有し、Mlui細胞周期ボックス(MCB)要素(コンセンサス配列ACGCGT)を含む。 現在の研究で見つかった拡張コンセンサスモチーフは、Scc1、Scc3、Smc3、Pds1、Eco1およびSpc24をコードする遺伝子の上流領域に存在していた。 このモチーフは、これらの六つのタンパク質をコードする遺伝子の上流123-299塩基対(bp)の間に位置していた。 SGDの検索は、この上流のモチーフを含む23の追加の遺伝子を明らかにした。 これらの追加の遺伝子のうち8つは、未知の機能の仮説的なタンパク質をコードしていました。 しかし、これらの追加の遺伝子には、シャペロン(JEM1およびPdi1N)、転写因子成分(TFA1、RFA2、RNAポリメラーゼII、SPT20およびPRT1)、およびプロテアソームのYC成分 検索は、酵母ゲノムの5’非翻訳領域の上流2,000bpに拡張されたとき、Trf4をコードする遺伝子はまた、このコンセンサスモチーフ(1,560bp上流)を含むことが

凝集相互作用ネットワーク内の共有モチーフ

Teiresias、パターン発見アルゴリズムは、凝集ネットワークの17タンパク質内の二つ以上の配列間の共通のモチーフを検索するために使用されました。 共通のモチーフを共有するタンパク質の最大数は三つであり、これらは高い配列同一性を有し、既知のプロサイトモチーフを共有する三つのSMCタンパク質であった(表3)。 さらに興味深いのは、ネットワーク内のタンパク質のペア間で見つかった24パター 多くのタンパク質は、同じタンパク質と複数の配列モチーフを共有しています。 すべての共有モチーフは、凝集ネットワーク内の二つのタンパク質に特異的であったか、または三つのモチーフの場合には、他の一つのタンパク質配列に

表3姉妹染色分体凝集機構に関与するタンパク質におけるProfileScanを使用して位置するプロサイトシーケンスモチーフ

ネットワーク内の二つの配列と一つの追加配列によって共有される一つのモチーフは、Scc2、Chk1および第三のs.cerevisiaeタンパク質PKH1(酵母ORF YDR490C)の配列によって共有されるDXXPENIXLXKNモチーフである(図4)。 Chk1とPKH1は両方ともセリン/スレオニン(ST)プロテインキナーゼであり、Scc2と共有するモチーフはプロサイトSTキナーゼシグネチャモチーフの一部を含む(XXDKXXN(3)、Xは任意の残基を示し、(3)は前の残基が三回繰り返され、Dは活性部位残基であることを示す)。 Scc2の配列はSTキナーゼシグネチャモチーフと正確に一致しません。 STキナーゼモチーフの13残基のうち、Scc2は四つのミスマッチを持っていますが、重要なのは、活性部位のアスパラギン酸が保存されています。

フィギュア4
図4

プロサイトセリン/スレオニン(S/T)プロテインキナーゼモチーフを含むScc2、Chk1およびPkh1の保存されたモチーフの配列アライメント。 アライメントでは、Teiresiasを使用して同定されたモチーフの保存された残基は赤色であり、追加の保存された位置は緑色である。 S/Tキナーゼモチーフと一致する残基は、ボックスで概説されています。 各モチーフの前の数字は、完全な配列内の最初の残基の位置を示す。 PROSITE S/Tキナーゼモチーフは、アライメントの下に示されています。 代替残基は二乗括弧で示され、Xは任意の残基を示し、活性部位アスパラギン酸は青色である。

凝集ネットワークに含まれていない第三のタンパク質によって共有される第二のモチーフはSXXSXLKKKXLXTであり、これはScc1、Scc2および酵母ORF YHR011W、推定セリル-tRNAシンテターゼ(図5a)に見られる。 しかし、このモチーフは、YHR011WのtRNAリガーゼモチーフの一部ではなく、またはこの配列内の他の既知のモチーフの一部ではなかった。 凝集ネットワークの外部からのタンパク質によって共有される第三のモチーフは、SCC1、Smc1、およびPlasmodium yoeliiからのP型ATPaseによって共有されるNDXNXDDXDNであった(図5b)。 Scc4は、既知のホモログが発見されていないコヒーシン負荷因子の一つである。 しかし、このタンパク質は、Smc3と1 0残基配列モチーフ(GKXVALTNAK)を共有することが見出された(図5c)。

フィギュア5
図5

凝集ネットワーク内のタンパク質によって共有される三つのモチーフの配列アラインメント。 (a)ネットワーク内のScc2およびTrf4によって共有されるモチーフおよび酵母由来の推定されるセリル−tRNA合成酵素(YHH1)。 (b)Plasmodium yoelii由来のScc1、Smc1およびP型Atpアーゼによって共有されるモチーフ。 (c)コヒーシン負荷因子Scc4およびSMC3によって共有されるモチーフ。 各整列において、Teiresiasを用いて同定されたモチーフの保存された残基は赤色であり、追加の保存された位置は緑色である。 各モチーフの前の数字は、完全な配列内の最初の残基の位置を示す。

securin Pds1はAPCのユビキチンのリガーゼによって破壊のためのこの蛋白質を目標とする破壊箱のモチーフ(RXXXLXXXXN)を含んでいるanaphaseの抑制剤です。 我々はSmc3の三つの破壊ボックスモチーフ、ヒンジ領域(位置682、RTRLESLKN)と第二のコイルコイルドメイン(位置744(RTSLNTKKN)と位置920(RLLLKKLDN)で一つ)で一つを発見した。 我々はまた、最初のコイルコイルドメインで、位置304(KENGLLN)でSMC2でケンボックスモチーフ(追加のAPC認識信号)を発見しました。



+