非ドメインタンパク質のHeroタンパク質と人工タンパク質

東京大学・生産技術研究所・講師の坪山幸太郎です。どうぞ、よろしくお願いいたします!

東大・医学系研究科・水島昇研究室、東大・定量研・泊幸秀研究室、ノースウェスタン大学・ファインベルグ医学校・Gabriel Rocklin研究室を経て、現所属に昨年4月に着任いたしました。それぞれかなり異なる研究手法・テーマを行ってきておりますが、一貫してタンパク質に関する研究を行ってまいりました。その中で、タンパク質は、極めて優れた物質であるということを実感しています。(もちろん、DNA、RNA、脂質も、様々な観点で優れた物質ではありますが!)

例えば、CRISPR-Cas9、Argonauteをはじめとする非常に多機能なタンパク質がありますし、またガイドRNAと相補的な領域に、更にそのガイドRNAと相補的なDNAを挿入するようなリコンビネースが、当領域の計画班にいらっしゃる西増さんたちのグループが発見されています。(おそらく文章では、その凄さが伝わりにくいと思いますので、ぜひbioRxivご参照ください)

https://www.biorxiv.org/content/10.1101/2024.01.24.577089v1

手前味噌ですが、泊さんの研究室に所属していた際には、Heroタンパク質群という明確な三次構造を持たないようなタンパク質の一群を発見しました。これらのタンパク質は、ヒトを含む幅広い種に数百種類程度存在し、タンパク質の恒常性を維持することに貢献していることを示すことができました。

(フラフラしたHeroタンパク質群が、クライアントタンパク質群をストレスから保護している様子)

https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3000632

このような驚くべき性質を示すタンパク質が次々と発見されてるだけでなく、設計もされています。計算機を活用することで、多彩な機能を示すタンパク質を人工的に設計することも可能になりつつあります。サブnMオーダーで強力に新型コロナウイルスのスパイクに結合し、95度でも安定なバインダー、GFPなどの半分程度の大きさのβバレル構造を持つ蛍光タンパク質、ホタルルシフェラーゼの更に4分の1程度の大きさで極めて基質特異性の高い新奇ルシフェラーゼが設計されてきました。

このようなタンパク質科学の進歩を見ていると、タンパク質のアミノ酸配列の多様性がこのような性質を実現しているということを実感します。例えば、200アミノ酸からなる典型的な長さを持つタンパク質について、あり得る配列数は20**200(それぞれの位置について、20種類のアミノ酸があり得るため)となり、現存する生物が利用しているタンパク質の種類 (10**12個程度)はおろか、観察可能な宇宙に存在する原子数 (10**80)を遥かに上回るような多様性を示します。

このような多様性を取り扱うには、こちらもそれなりの武器が必要ですが、その武器となるのは機械学習、深層学習であると私は考えています。ご存じの方も多いかと思いますが、AlphaGoという驚異的な囲碁の強さを誇る深層学習モデルが2015年に構築されました。囲碁の一試合において、あり得る碁石の置き方は10**360と言われていますので、AlphaGoは非常に膨大なあり得る碁石の置き方 (手) の中から勝つために適切な筋を探索することに成功したということになります。これだけ強力な深層学習を活用することにより、タンパク質の構造・性質・機能などをアミノ酸配列から正確に予測することが可能になりつつあります。実際に、お使いの方も多いかと思いますが、AlphaFoldなどが実用化されています。

このような成功例に習い、本研究領域では、上記のなかでは、Heroタンパク質に注目し、大規模解析技術と機械学習・深層学習モデルを活用することで、新たな機能性Heroタンパク質を探索していきたいと考えています。

もちろん、このような解析はHeroタンパク質に限りませんので、このような大規模解析と機械学習などの組み合わせにご興味ありましたら、お声がけください。どうぞ、よろしくお願いいたします!

投稿者プロフィール

坪山幸太郎
坪山幸太郎
明確な三次構造を持たないHeroタンパク質と、頑健な三次構造を持つ人工タンパク質に関する研究を行っています。