医学版グーグルマップか タンパク質AI解析の衝撃

医学版グーグルマップか タンパク質AI解析の衝撃
教えて山本さん!BizTechの基礎講座
https://www.nikkei.com/article/DGXZQOUC053XB0V00C21A8000000/

 ※ 『従来は、タンパク質の結晶をX線で解析するといった方法で立体構造を調べていました。しかし、タンパク質が生体内で実際にどのような構造を取ってどう動くのかまではなかなかわかりませんでした。

この課題を解決するための様々な研究が進められています。その一つが「低温電子顕微鏡法(クライオ電子顕微鏡法)」です。試料を特殊な方法で凍結し、電子顕微鏡で観察する方法です。これにより結晶化が難しいタンパク質でも立体構造の解析が可能になりました。開発した3人の研究者は2017年にノーベル化学賞を受賞しました。』

 ※ と言うことで、「生命科学」関係で、困難なのは「生きたままの細胞を、研究すること」のようだ…。

 ※ 電子顕微鏡の「倍率(分解能)」は凄い(100万倍~150万倍くらいは、出るらしい…)が、その動作原理上、「真空」状態にしないといけないようで、「細胞」だったら、みんな「死んで」しまう…。

 ※ 「脳科学」も、似たところがある…。

 ※ 「生きた脳細胞」を、そのまま観察するのは、困難だ…。

『オリンピックが終わり、選手の頑張りに勇気づけられた人は多いと思います。同様に人類で取り組むべき新型コロナウイルス対策については、首都圏などの緊急事態宣言がまだ続いています。世界中が変異ウイルスの影響を受けており、感染拡大に対して科学的かつ冷静に対処する必要があります。

そのためには政府首脳だけではなく、国民全員が科学への正しい理解を持ち続ける必要があります。

ライフサイエンスやヘルスケアの分野で大きな革新が生まれつつあります。米グーグルの関連企業である英ディープマインドは7月、同社が人工知能(AI)を使って開発したタンパク質の立体構造予測プログラム「AlphaFold2」を無償公開しました。同社は欧州分子生物学研究所(EMBL)と提携してタンパク質立体構造のデータベースを構築し、1億種類以上の既知のタンパク質の構造を今後数カ月で解析してデータベースに登録するとしています。

人体は約70%が水分、約20%がタンパク質でできており、タンパク質は生命に不可欠な存在といえます。しかし、その立体構造の解析はあまり進んでいませんでした。

生体のタンパク質は20種類のアミノ酸からできています。10個のアミノ酸がつながったタンパク質であれば、理屈のうえでは20の10乗、すなわち約10兆通りの組み合わせがあります。人には約10万種類のタンパク質があるといわれています。

もっとも、アミノ酸の配列だけではタンパク質の実際の立体構造はわかりません。病気の治療や原因解明のためにはタンパク質の機能を把握することが重要で、そのためにはつながったアミノ酸がどのように折りたたまれるかを知らなければならないのです。

従来は、タンパク質の結晶をX線で解析するといった方法で立体構造を調べていました。しかし、タンパク質が生体内で実際にどのような構造を取ってどう動くのかまではなかなかわかりませんでした。

この課題を解決するための様々な研究が進められています。その一つが「低温電子顕微鏡法(クライオ電子顕微鏡法)」です。試料を特殊な方法で凍結し、電子顕微鏡で観察する方法です。これにより結晶化が難しいタンパク質でも立体構造の解析が可能になりました。開発した3人の研究者は2017年にノーベル化学賞を受賞しました。

近年は構造解析技術が飛躍的に向上していますが、構造の解析に年単位の時間がかかることもありました。そこに大きなインパクトを持って登場したのがAlphaFold2です。6年間解けなかった構造解析の問題がAlphaFold2であっさり解けた事例が出るなど、研究者の間で衝撃が広がっています。米カリフォルニア大学サンフランシスコ校のグループは、新型コロナウイルスのタンパク質がどう機能するのかをAlphaFold2を使って研究しています。
若い世代が活躍できる社会に

タンパク質を作るための設計図である遺伝情報が書き込まれているのがDNAです。DNAの2重らせん構造は当時20代から30代の若い研究者たちが1953年に提唱し、彼らは62年にノーベル生理学・医学賞を受賞しました。

それから約30年後の90年、人のすべてのDNA配列を解析する米国主導のプロジェクト「ヒトゲノム計画」が30億ドルの予算で始まりました。人のDNAは約30億塩基対で構成され、全長は約2メートルにも及びます。プロジェクトは15年の期間を想定していましたが、コンピューター技術の進歩もあり、予定よりも早い2000年に解析の完了が発表されました。
それから約20年がたち、それ以上のインパクトを持つ進化が起ころうとしています。IT分野でたとえれば、05年のグーグルマップの登場に近いでしょう。

グーグルマップは当初は大きな話題にはなりませんでしたが、全地球測位システム(GPS)と連携したスマートフォンでの位置表示、店舗の営業時間表示や予約、利用者の口コミといった機能追加により、使い勝手が飛躍的に向上しました。しかも、こうした機能を無料で利用できるのです。今や知らない土地では手放せないツールになりました。

AlphaFold2を利用したタンパク質の立体構造データベースも、研究者が自由に利用できます。創薬や医学研究の際に広く使われる、いわば「人体構造のグーグルマップ」になっていく可能性を秘めているのです。

こうした流れもあり、AI関連の投資に力を入れているソフトバンクグループがスイス製薬大手ロシュの約5500億円分の株式を取得したと報じられました。ロシュの傘下にはバイオベンチャーの草分けである米ジェネンテックがあります。

新型コロナワクチンの開発にはメッセンジャーRNA(mRNA)という新しい手法が使われました。開発したのは、独ビオンテックや米モデルナといったベンチャー企業です。最新の開発を行っているのは大手企業だけではありません。開発の最前線では、ディープラーニングなどの技術を利用して画期的な手法が生み出されています。

ヒトゲノム計画は国家プロジェクトでしたが、それよりも格段に難しいといわれるタンパク質の構造解析を新興のテクノロジー企業が実現しているのです。

こうした開発競争はオリンピックに似ているかもしれません。スポーツで国際的な競争を勝ち抜くには、幅広く競技人口を増やすと同時に、強化選手を選抜して集中的に伸ばす必要があります。今回のオリンピックでは10代が活躍した新種目があったように、新しいものは若い世代が得意なこともあります。

日本の科学技術レベルの向上も同様に考える必要があります。まず、教養課程の充実や社会人の学び直しなどで、国民が幅広く最新の科学リテラシーを身につけられる体制を整備しなくてはなりません。

加えて、才能のある若者が実力を発揮できる社会にする必要があります。先日開催された国際数学オリンピックでは、日本人選手全員がメダルを獲得しました。国際物理オリンピックや国際生物学オリンピックでも日本人選手が活躍しています。若い世代が国境を越えて切磋琢磨(せっさたくま)し、新しい分野を切り開いていくのを、社会全体で支えていかなければならないと感じています。

山本康正(やまもと・やすまさ)
京都大学大学院特任准教授
東京大学修士号取得後、米ニューヨークの金融機関に就職。ハーバード大学大学院で理学修士号を取得。卒業後グーグルに入社し、フィンテックや人工知能(AI)などで日本企業のデジタル活用を推進。著書に『次のテクノロジーで世界はどう変わるのか』(講談社現代新書)、『2025年を制覇する破壊的企業』(SB新書)がある。』