読み物:AIの未来はウェットラボにかかっている

Colby Souders(Twistのバイオファーマ部門の最高科学責任者)が、バイオファーマにおけるAIとNucleate Summitについて振り返ります。

AI革命の背景には何があるのでしょうか?科学分野における大規模言語モデル(LLM)の導入は、驚くべき速さで進んでおり、それには十分な理由があります。LLMは、新しいウイルスゲノムの設計、診断のための医療画像の解析、創薬の迅速化など、幅広い用途に向けて開発されており、多くの可能性が広がっています。しかし、多くの人が気づき始めているように、AIの可能性はまさに「可能性」に過ぎません。AIという概念を現実の具体的な利益に変えるためには、研究者は計算の領域を超えて、慣れ親しんだウェットラボの領域へと進む必要があります。

今年の初め、私はマサチューセッツ州ボストンで開催されたNucleate Summitに参加しました。そこでは、バイオテクノロジー分野のリーダーや学生たちが集まり、業界の新たなトレンドについて議論しましたが、その中には自動化とAIの可能性に焦点を当てたパネルも含まれていました。そのパネルの参加者として、私は、ウェットラボによるフィードバックループが存在しなければAIの可能性の多くは衰えてしまう、という自分の見解を擁護する準備ができていました。

しかし、弁護は必要ありませんでした。代わりに、Oracle、Deep Origin、NewCo、Pillar VCの同僚たちと私は、インシリコ環境とインビトロ環境を橋渡しする必要性と、それを実現するためにどのような取り組みが行われているのかについて、活発な議論を行いました。

ウェットラボの重要性

そのすべての強みにもかかわらず、結局のところ、AIは単なる計算ツールの一つに過ぎません—もっとも、強力なツールではあります。AIは新しい治療用抗体を設計することはできますが、それを合成することはできません。AIは遺伝子編集が望ましい効果を発揮する可能性が高い場所を示すことはできますが、必要なCRISPR構造を組み立てることはできません。言い換えれば、AIはウェットラボを置き換えるものではなく、それを補完するツールです。AIは生物学的なノイズの中を進む手助けをし、より直接的に答えへと導いてくれます。しかし、その導きに対して同じレベルの正確さで行動することは、大きな課題です。

治療用抗体の最適化におけるAIの潜在的な利用について考えてみてください。

抗体の特性(標的特異性、結合親和性、安定性など)は、複雑な分子内相互作用によって決まります。これらの特性を最適化するプロセスは、これまで歴史的に、数百万に及ぶ関連する抗体バリアントを含む大規模なスクリーニングライブラリの作製を伴ってきました。最大規模のスクリーニングライブラリでさえ、試験可能なバリアントの潜在的な数のごく一部を表しているに過ぎません。単なる運任せ以上の結果を得るためには、研究者はどのバリアントを試験し、どれを除外するかについての合理的な根拠を構築しなければなりません。

AIはこのプロセスを大きく改善することができ、研究者が高い可能性を持つバリアントに富んだスクリーニングライブラリを合理的に設計するのを助けますが、それらはしばしばより小さく、評価コストも低く抑えられます。しかし、実際にAIが設計した抗体を合成することは容易ではありません。従来のDNA合成技術は150〜300塩基対の断片を作ることに限られており、これは抗体ドメインのバリアントに必要な長さを大きく下回っています。そのため、研究者は各ユニークな抗体を構築するために、DNA断片をつなぎ合わせるというエラーが起こりやすい工程を経なければなりません。この作業では、特定の配列が過剰に、あるいは不足して表現される可能性があります(合成エラーについては言うまでもありません)。最良の場合でも、これらの不完全さは意図しないバリアントの試験につながり、時間や資源の無駄を意味します。最悪の場合には、研究者を誤った方向へ導く可能性があります。

これらすべてが意味しているのは、AIの精密な設計を実験室で再現することは簡単なプロセスではないということです;それが抗体開発であれ、CRISPRスクリーニングであれ、あるいはその他の用途であれ、研究全体にわたる技術的進歩が必要とされます。

Twist Bioscienceは、この課題において研究者を支援するために多くの取り組みを行っています。例えば、当社のMultiplex Gene Fragmentsの登場により、最大500塩基対のカスタムDNA断片をスケールして生産することが可能になります。これにより、抗体の相補性決定領域(CDR)全体を高い精度で直接合成することが可能になります。このような精度は、AIによって設計された抗体バリアントをより少ないエラーで合成できることを意味し、より効率的な最適化プロセスを可能にします。

フィードバックループ

Twistのバイオファーマ部門の最高科学責任者であるColby Soudersが、Nucleateのパネリストたちとともにステージに登壇

私たちのパネルディスカッションで浮かび上がった重要なテーマの一つは、ウェットラボ技術の進歩が必要であるだけでなく、インシリコとインビトロの環境の間におけるフィードバックループもまた必要である、ということでした。

これは、AIや機械学習(ML)の技術が、不完全なトレーニングデータから複雑な外挿を行うことをしばしば求められるために必要です。ここでも、抗体最適化は良い例です。研究者が直面する一般的な課題は、相反する特性の間で最適なバランスを見つけることです。ある特性を改善する抗体配列の変更は、別の特性を損なう可能性があります。これまで歴史的に、最適化プロセスは個々の特性を段階的に改善することに焦点を当ててきました。

AIやMLは、抗体の特性のバランスを取る可能性が最も高い変化の組み合わせを予測することで、研究者がより包括的なアプローチを取るのを助け、同時最適化を可能にします。これは時間の節約になるだけでなく、全体としてより優れたバリアントを生み出す可能性があります。しかし、これらのアルゴリズムは、それぞれが個々の特性に焦点を当てた限られたデータセットで訓練されています。その結果、多くのAI設計のスクリーニングライブラリは単一の特性に過度に偏り、研究者は依然として追加の、しかもコストのかかる最適化のラウンドを経ることを余儀なくされます。

言い換えれば、AIの可能性は限られたトレーニングデータセットによって損なわれています。これを克服する一つの方法はフィードバックループを構築することであり、そこではAIの予測をウェットラボで検証し、その結果得られたデータをAIの学習の改善に用います。これはある大手バイオテクノロジー企業の研究者たちによって、最近実施されました。実験からのフィードバックをMLのトレーニングデータに加えることで、そのチームは抗体設計プロセスを、静的な予測タスクから、各ラウンドの試験結果が次のラウンドに情報を与えるアクティブラーニングの問題へと変換しました。その結果、抗体最適化への道筋ははるかに効率的なものとなりました。

いくつかの研究室は計算能力により重点を置いており、ウェットラボでの検証のための設備が十分ではありません。幸いにも、業界はこれらの研究室を支援する方向へと進化しています。例えば、Twistは現在、DNA合成以上のサービスを提供しています。抗体の特性評価に必要な時間や設備を持たない研究者は、Twistの支援を利用することができます。私たちは、(自動化とスケールのために構築された)専門知識とインフラを活用して、大規模な抗体候補のパネルを作製し、結合性、親和性、免疫原性、開発適性といった特性についての評価試験でそれらを検証することが可能です。配列からデータへとシームレスに移行できる能力は、インシリコとインビトロの間のギャップを埋めようとする研究室が増える中で、不可欠となり得ます。

SoudersとNucleate Summitにおける共同パネリストたち

推奨リソース

アプリケーションノート
大量のオリゴプールと AI を組み合わせてプライム編集スクリーニングにおけるガイド RNA の効率を予測

ポッドキャスト
より多様な配列で AI モデルを訓練し、ヒット率を改善する | Twist Bioscience

アプリケーションノート
ベイカー研究室は、マルチプレックス化した遺伝子断片とAIガイド設計をどのように活用し、新規抗体バインダーを発見したのか