読み物:Twist Bioscience の 部位飽和変異ライブラリは、次世代のタンパク質工学を加速する新しいツール
変異体遺伝子ライブラリーは、特定のアミノ酸1か所の置換によって、タンパク質機能がどのように変化するかを見つけ出すために活用されます。

前回の読み物「有用な特性を持つデザイナー酵素は Twist Bioscience の遺伝子から生まれる」と「固相 DNA 合成技術 ― 次世代タンパク質工学への道」では、タンパク質工学が現代の生命科学やバイオテクノロジー研究において、欠かせない取り組みであることを紹介しました。タンパク質を“設計”するというアプローチは、生命の分子レベルの理解を深めるだけでなく、産業利用に適したより優れたバイオ触媒や、新しいバイオ医薬の開発へとつながります。つまり、最適なタンパク質工学ツールへアクセスできるかどうかが、研究成果を左右するといっても過言ではありません。
そのなかの一つが、Site-Saturation Variant(SSV)変異体遺伝子ライブラリです。SSV ライブラリーは、アミノ酸1か所(1変異)を置換することでタンパク質機能が変化する変異を探索するために使われます。特定のアミノ酸位置に対して、19種類の全アミノ酸変異を含む完全なバリアントセットを用意でき、さらに必要な箇所を複数設計することも可能です。
従来、このような SSV 変異体遺伝子ライブラリは PCRベースの手法(代表例:epPCR)で作られてきました。しかし PCR ベースの方法では、研究者がライブラリの構成を正確に制御できず、配列バイアスが生じた不完全なライブラリになりがちです。この場合、有用な変異を取りこぼさないためには膨大なスクリーニングが必要で、それでも“すべてのバリアントを本当に見れているのか”を確認することは困難です。
一方、Twist Bioscience が開発した高スループットDNA合成技術により、次世代の SSV 変異体遺伝子ライブラリが実現可能になりました。Twistでは、設計したそれぞれの配列バリアントを独自のシリコンDNA合成プラットフォーム上で個別に合成します。そのため単一変異が過剰/不足なく、最大限のバリアント多様性を担保した状態で提供できます。さらに出荷前には NGS による品質確認も行われ、研究者は安心して次の検証ステップへと進むことができます。

部位飽和変異体遺伝子ライブラリ設計で一般的に用いられるスキーム
Development Biotech Unit の David Öling 氏ら、Imperial College London、そして Twist Bioscience の共同研究グループが、Twist Bioscience の SSV ライブラリーをタンパク質工学のツールとして評価しています。本論文では、酵母が環境中のグルコースを感知するために用いる G タンパク質共役受容体(GPCR)の工学的改変に焦点が当てられました。
研究チームは、CRISPR-Cas9によるDNA編集技術を活用し、PARP阻害剤への耐性を獲得した変異を生成・分離する「tag-mutate-enrich」という新しいプロセスを用いました。この方法では、PARP遺伝子全体にわたり密に配置された多数のガイドRNAライブラリを使って、耐性変異を効率よくスクリーニングすることができます。この研究に使用された489種類のガイドRNAをコードするDNAは Twist Bioscience が合成したものであり、TwistはCRISPR実験向けの合成DNAやオリゴプールの提供において業界をリードしています。
AstraZeneca の Innovative Medicines and Early Development Biotech Unit の David Öling 氏と共同研究者(Imperial College London および Twist Bioscience)によるACS Synthetic Biology に掲載された2018年の論文では、Twist Bioscience の SSV ライブラリーをタンパク質工学のツールとしてベンチマーク評価しています。本論文は、酵母がその環境中のグルコースを感知できるようにする、酵母由来の G タンパク質共役受容体のエンジニアリングに焦点を当てています。
G タンパク質共役受容体(GPCR)は、真核細胞の細胞膜上に存在するタンパク質で、細胞が外界とやりとりする上で重要な役割を担っています。私たちの身体では、視覚・嗅覚・味覚といった感覚が GPCR の働きによって制御されています。また、免疫やホルモン調節にも深く関わっており、GPCR は創薬の観点から非常に重要な標的です。例えば、進行性の失明を引き起こす網膜色素変性症は GPCR タンパク質であるロドプシンの変異が原因です。分子レベルでの作用機構の理解が深まることで、これらの疾患に対する新たな治療薬の開発が期待できます。そのため GPCR は、SSV ライブラリを用いた工学改変研究に適した対象といえます。
Öling らの論文は概念実証研究であり、機能変化を容易にアッセイできる酵母 GPCR に着目しました。著者らは、このタンパク質中の161か所がグルコースとの相互作用に関わる可能性があると予測し(下図参照)、これら全ての位置に対して部位飽和変異導入を行いました。その結果、3,059バリアントからなるライブラリーが Twist Bioscience によって合成されました。また比較のため、同等規模のライブラリーを epPCR を用いて作製しています。両ライブラリーはその後、ハイスループットDNAシーケンスにより、カバレッジ、バリアントの偏り(representation)、およびストップコドンの発生という3つの指標に基づいて品質評価が行われました。

酵母グルコース受容体中のアミノ酸を簡略化して示した図です。黒い円は、Öling ら(2018)がサイトサチュレーション変異導入の対象とした161残基を示しています。
設計された変異体に対するライブラリーのカバレッジについて、論文では次のように記載されています:「[Twist Bioscience] ライブラリーのシーケンス解析により、設計された3,059バリアントのうち3,055が存在していることが確認された(99.9%の表現率)[…]. これに対し、epPCR ライブラリーは、アミノ酸バリアントの理論的最大値の 35% を含んでいた。」
Twist ライブラリーが優れたカバレッジを持っていることにより、研究者は最大限のバリアントをスクリーニングできているという安心感を得ることができ、有用な新規表現型を生み出す変異の発見可能性を高めることができます。
ライブラリーの representation(表現度)は、ライブラリー内の特定位置における各アミノ酸の割合を意味します。理想的には、変異体は均等に分布していることが望ましく、これによりスクリーニングが特定の変異に偏らないようにすることができます。均一な representation が確保されていると、全変異をカバーするために必要なスクリーニング労力を最小限に抑えることができ、時間とコストの節約にもつながります。論文では、Twist ライブラリー内のアミノ酸比率は「非常に均一(highly homogeneous)」であると説明されているのに対し、epPCR ライブラリーは「不均一(heterogeneous)」とされています。この違いは、以下のヒートマップから明確に確認できます。Twist ライブラリーは全体としてほぼ均一なバリアント representation を示していますが、epPCR ライブラリーでは、特定の残基が他より大幅に過剰表現されている(濃い青の四角)一方で、その位置における他の残基は逆に過小表現されていることが分かります。

Öling ら(2018)によって評価された2つのライブラリーの品質を示すヒートマップです。このヒートマップでは、X軸は変異導入の対象となった GPCR タンパク質中の各アミノ酸残基を、Y軸はその各残基に対する20種類の可能な変異を示しています。白い四角は欠失している残基を示しており(各ポジションには1つの白い四角=野生型があるはずです)、カラースケールは、特定のサイトにおける各変異の存在割合を示しています。
また、ストップコドンは、役に立たない短縮タンパク質を生じさせ、スクリーニングのリソースを無駄にします。Twist ライブラリーにはストップコドンは検出されていませんが、epPCR ライブラリーについてはストップコドンに関する記載はありませんでした。
研究者らは次に、蛍光を用いたシンプルなアッセイによって活性が上昇した変異体をスクリーニングしました。epPCR ライブラリーでは、有益な変異は1つしか検出されませんでしたが、Twist ライブラリーではその同じ変異に加えてさらに5つの有益な変異が見つかりました。Twist ライブラリーで見つかった6つの変異のうち、3番目の細胞外ループに位置する1つの残基は、GPCR 活性の最も大きな上昇を示しました。この観察結果は、その残基がグルコース応答を制御する上で極めて重要で、これまで知られていなかったアミノ酸である可能性を示唆しています。
この結果を裏付けるため、研究者らは Twist ライブラリーを再解析し、この特定の残基のみのバリアントに絞って詳細に検証することができました。Twist ライブラリーは飽和度を保証できるため、興味のある変異体を取り出す作業は「アーカイブから取り出すだけ」というレベルで可能ですが、カバレッジが低い epPCR では同様のアプローチは不可能です。この検証の結果、この位置の9つの変異は GPCR 機能を完全に失わせ、5つの変異は機能を増強することが確認されました。
この研究は、Twist Bioscience の SSV ライブラリーが、タンパク質中の複数残基に対して高度に最適化された変異導入ツールであるという、明確な概念実証を示しています。優れた合成プロセスと NGS による品質確認により、コスト効率に優れたライブラリーが研究者に提供可能となっています。完全性が高く、バイアスのないカバレッジによりスクリーニングも容易になり、下流のコスト削減にもつながります。一方、epPCR ライブラリーは、representation とカバレッジの面で大きく制限があり、スクリーニング工程でも多くの問題を引き起こします。
これらのデータから、Twist Bioscience のシリコンプラットフォームで直接合成されたバリアントライブラリーは、今後のタンパク質工学をさらに発展させ、研究者がタンパク質の配列空間に存在する全変異を最大限に活用できるようにしていくことが期待されます。これらのライブラリーを用いて、バイオ産業用により優れたバイオ触媒を生み出したり、新しいバイオ医薬を開発することで、遺伝性疾患や後天性疾患の分子機構の理解がさらに前進する未来が期待されます。
