第74回 将来の実験はバーチャル細胞で?
1.はじめに
生命科学の新たな実験手法として、AIの助けを借りてコンピュータ上にバーチャル(仮想)細胞を構築し、シミュレーション実験を行うという方法が考案されている。今回は、本年6月、ネイチャー誌にオンラインで掲載された記事「AIは仮想細胞を構築できるか?」を踏まえつつ、このような研究のこれまでの経緯、今後の進展予測、課題等について、分析・考察を行うこととする。
なお著者は、AIを用いた計算科学や関連用語について不慣れなところもある。本ニューズレターの記事では、全体状況の把握を中心に紹介したため詳細において正確さに欠ける部分があるかもしれないことを、予め述べておきたい。
2.これまでのバーチャル細胞の経緯
(1)バーチャル細胞とは
バーチャル(仮想)細胞の概念を正確に説明するのは難しい。実際に、上記ネイチャー誌の記事においても、「バーチャル細胞には明確な定義があるとは思われず、その開発における課題の一つは、その概念が人によって異なる意味を持つことである。」と述べられている。
大雑把に言えば、バーチャル細胞とは、現実の細胞を模倣してコンピュータ上に作られた仮の細胞のことだと考えられる。
もし、そのようなバーチャル細胞が作製されたなら、それを用いてコンピュータ上でさまざまなシミュレーション実験(in silico実験という)が行えることになる。そうなれば、90%が実験、10%が計算という現在の細胞生物学の研究スタイルは、その比率が逆転し、実験のための装置や実験材料も整える必要がなくなり、実験効率が大幅に上昇することになると期待される。
(2)E-Cellプロジェクト
バーチャル細胞を作出しようというアイデアが、世界でいつ頃生まれたか分からない。
日本では、まだ国際協力でヒトゲノムプロジェクトが行われていた1996年に、慶応大学で「電子化細胞(E-Cell)プロジェクト」が発足した。それは細胞の代謝をモデル化し、細胞丸ごとシミュレーションすることを目的としていた。それまで知られている生物でもっとも遺伝子数が少ないマイコプラズマ菌がモデル生物に選ばれた。その約500個の遺伝子の中から自分を維持するのに不可欠な遺伝子127個を選んで、その機能の1つ1つがコンピュータ上でモデル化された。そしてコンピュータの中のバーチャル細胞は、ブドウ糖を取り込み、タンパク質を合成して自己を維持した。
その後、同プロジェクトはヒトの赤血球細胞のシミュレーションモデルを構築した。それを使うと、酵素機能を抑える等の各種シミュレーション実験が可能となり、たとえば遺伝性貧血症患者の赤血球に似た状態がどんな時に現れるかを調べることができた。当時としては先駆的で画期的なプロジェクトだったと思われる。
(3)その後の経緯
その後、1990年代末頃から、欧米においても細胞シミュレーションの重要性が急速に認知されてきた。そして、研究者による、コンピュータを用いた細胞の挙動モデルの作製研究が進められた。
2012年には、米国スタンフォード大学の研究者らにより、525個の遺伝子を持つマイコプラズマ・ジェニタリウムの内部構造を踏まえた、初の細胞全体の計算モデルが作製された。これにより、先述のE-Cellプロジェクトにより構築されたもよりも、いっそう複雑な内容をシミュレーションすることができた。そして、その試みは酵母等、より複雑な細胞を対象とするようになっていった。
こうした初期の取組みは、細胞の「完全な」メカニズムを有するモデルを構築しようとするものが主流だった。しかし、そのような完全なモデルを作るには、各生体物質すなわち遺伝子、RNA、タンパク質の役割や機能を明らかにするだけでなく、複数の生体物質すなわち遺伝子どうしの関係とか、タンパク質どうしの関係等が正確に分かっていなければならず、要素の数が増えれば増えるほど、その組合せは等比級数的に増大した。このため、ヒトのように遺伝子の数が膨大になると、その関係づけは極めて困難になると考えられていた。
3.現在のバーチャル細胞の状況
(1)AIを導入したバーチャル細胞の構築
現在進められている仮想細胞の開発は、AIを活用している。AIは、膨大な量のデータを取り込むことで、それらのデータを説明できるようなシステムを構築することができる。つまり、個々の要素間の正確な関係や生化学反応が分かっていなくても、表面上、用いたデータセットが当てはまるようなモデルが作れるという考え方である。
最初に取り組まれたのは、特定のオミックスデータ、たとえば個々の細胞内の全てのメッセンジャーRNA分子の配列を決定する実験から得られるデータを基にして、ある段階・時点での細胞中の遺伝子活動の状況を表した、いわゆるスナップショットを収集・整備することだった。
こうして、各種生物種や細胞、時期について収集された、さまざまな生体物質のデータセットについて、AIを用いて比較・分析することにより、各遺伝子間や生体物質間の組織内や細胞内での関係等が説明できるような、バーチャル細胞の構築が期待された。AIは、それら収集したデータが成立できるようなモデルを試作し、すばやく試すことに大いに向いていた。
このため研究者らは、仮想細胞の構築を支援するための、シングルセル(単一細胞)でのデータセットを大量に作製し、それらを公開して相互に利用するようになってきている。
(2)各種バーチャル細胞の例
以下、これまで調べた範囲で、バーチャル細胞の構築計画や、その構築のための訓練に用いるデータセットや要素技術の整備例を挙げる。
・米国のアーク研究所は、世界最大級の単一細胞データセットである「バーチャル・セル・アトラス」(VCA)を有しており、公開に供することにより、各所で細胞レベルの基盤モデル訓練に用いられている。特に、同研究所は本年2月には数百種類の薬剤で処理された1億個のがん細胞のシーケンシングデータを公開した。それらを踏まえ、本年6月「ステート」と呼ばれるシングルセルAIモデルを構築・公開した。
・オープンデータセットとツールを開発する米国の非営利団体チャン・ザッカ―バーグ・イニシアチブ(CZI)は、10億個の細胞のシーケンシングデータを公開する予定であり、これにより1億個以上のデータベースが拡張される。CZIはスタンフォード大学やジェネンティック社と共同で、AIとオミックス技術を用いた「人工知能バーチャルセル」(AIVC)を構築することを提唱しており、今後10年間でその作製に数億ドルを投じることを計画している。
・本年初め、英国のグーグル・ディープマインド社は、仮想細胞プロジェクトを進めており、その中で、「アルファゲノム(AlphaGenome)」というAIモデルを開発していることを発表した。これはDNAのわずかな変化が、ある遺伝子の活性が促進されるか抑制されるかといった分子プロセスにどのような影響を与えるかを予測するものである。最終的には遺伝子の突然変異がヒトの健康にどのような影響を与えるかを瞬時に予測することで生命科学・医学研究の円滑化を目指す。
・スウェーデンのサイエンス・フォー・ライフ研究所は、2026年に同研究所独自の仮想モデル「アルファセル」を立ち上げる予定である。

4.今後のバーチャル細胞の進展について
(1)技術的な観点
バーチャル細胞を用いた実験により、実験装置や、実験用の各種試料が不要になると、研究費は大幅に削減できる。また。各種条件を変えて最適条件を設定するような場合、そのような条件設定・最適条件の取得までにかかる時間が大幅に短縮になる。医薬品開発への利用等が期待され、早期のモデル開発が待たれるところである。
ただし、構築に際し、技術面からはまだまだ解決しなければならない問題がある。
実際の細胞は、様々な要素が組み合わさった実に複雑なメカニズムを有している。AIを用いて作製されるモデルは、そのために使用したデータの範囲内では、ある程度合理的に成立するようなシミュレーションモデルにはなるだろう。
しかし、それらを超えて適用できる結論を導き出せるほど強力でもなく、予測力は十分でもないと指摘する研究者も多い。このためには、より多くのデータで訓練するとともに、新たなデータセットでそれらのモデルの有効性を検証する必要がある。
また、多くの科学者は、バーチャル細胞には、オミックスデータだけでなく、光学顕微鏡や電子顕微鏡画像など、異なる細胞構成要素がどのように相互作用し、細胞が時間とともにどのように変化するかを示す、他の形式のデータも組み込む必要があるとしている。
(2)規制・倫理的な観点
著者の考えでは、このようなバーチャル細胞を利用した実験だと、生身の細胞を使用することに比べ、倫理的問題は少ないように思える。特に、正確なシミュレーションができるなら、動物実験を回避することや削減することが可能になるし、ヒト細胞に適用されるなら、患者を使用した実験の削減や、ES細胞のような生命の萌芽の犠牲の回避につながる。さらに、そのようなバーチャル細胞を標準化できれば、個人情報の保護の観点からも問題は少なくなると思われる。よいことずくめである。
ただ、まだ信頼性が十分でない段階で、バーチャル細胞を用いた研究が通常研究の代替として認められた場合、その後通常研究の結果との齟齬が出てきた際には研究の停滞を招くかもしれない。
このため、開発自体は大いに奨励されるものの、その評価は決して拙速にならないよう着実に進めていくべきだと考える。
5.おわりに
もう10年以上前になるが、著者は当時国立遺伝学研究所の所長だった堀田凱樹先生の講演を聞いたことがあった。それによると、生命科学の研究は、50年毎に大きな変革を経験しているとのことだった。
まず1900年頃に、メンデルの法則の再発見があった。次に1950年頃には、ワトソン・クリックによるDNA二重らせん構造の発見があった。さらに2000年頃には、ヒトゲノム計画の完了があった。これらはいずれも、生命をブラックボックスにたとえ、それが「情報」の活用により、生命に対する認識が大きく変化し、研究方法も大きく変化したということだった。同先生は、2050年には、さらに「情報」という要素が関係することにより生命科学の研究が変化を遂げるだろうと述べられていた。
最近のAIの急速な進展を見ると、将来の生命科学の潮流としては、まさにコンピュータの中でだけのシミュレーション実験になるような予感がする。しかもそれも、2050年よりもっと早く訪れるかもしれない。著者にとっては難解な分野ではあるが、将来の生命科学研究の主流になるとしたら、決して見逃すことはできず、フォローを続けていきたい。
参考文献
・E. Callaway, “Can AI build a virtual cell? Scientists race to model life’s smallest unit”, (2025/6/27) Nature HP
(https://www.nature.com/articles/d41586-025-02011-0)(なお後にNature誌に掲載:Vol.643, 13-14)
・富田勝「E-CELL Project:細胞のコンピューターシミュレーション」
(https://www.jstage.jst.go.jp/article/ciqs2001/tokusi/0/tokusi_0_K19/_pdf/-char/ja)
・福岡浩二「AIで加速する合成生物学―バーチャル細胞から新酵素まで」(2025/6/30)no+e HP
https://note.com/kojifukuoka/n/n4c96ae5adb19)
・「科学者がAI技術を用いて世界初のバーチャルヒト細胞を開発」(2024/12/31)AIbase基地HP(https://www.aibase.com/ja/news/14366)
・A. Regalado「グーグルが「アルファゲノム」、遺伝子変異の影響を包括的に予測」(2025/6/26)MIT Technology Review HP
(https://www.technologyreview.jp/s/364407/googles-new-ai-will-help-researchers-understand-how-our-genes-work/)
ライフサイエンス振興財団理事兼嘱託研究員 佐藤真輔