2021.4 トピックス:最高のエクソームを得るために

次世代シーケンス(NGS)に特化し、遺伝子検査および研究目的の様々なシーケンスサービスを提供しているCeGaT社からテクニカルノート「THE BEST POSSIBLE EXOME(最高のエクソームを得るために)」が公開されました。

このテクニカルノートは、Twist Bioscienceが提供するカタログエクソーム(Human Comprehensive Exomeパネル)のカスタマイズによって、臨床において実用的な全ゲノムシーケンス(WGS)に相当する高品質のデータを得ることについての示唆を含むものとなります。Twistは、プローブのNGS品質管理によって得られる一貫した性能を維持しながら、既存のパネルのコンテンツを拡張する場合でも高品質なシーケンスデータを得ることができる、カスタムブレンドパネルを提供しています。

全ゲノムシークエンス(WGS)は、研究用としては優れたツールですが、診断用としては検出された全てのバリアントの解釈に困難が伴います。このテクニカルノートは、適切に設計されたカスタマイズされたエクソームを用いることで、医学的に重要なゲノム領域に絞って効率よくシーケンスのカバレッジが得られることが示されました。WGSでゲノム全体のリード数を厚めに読んでも(平均カバー率133x)、医学的に重要な領域をカバーするという点では、適切にカスタマイズされたエクソームを大きく上回ることはありません。

以下、テクニカルノートのハイライトをご紹介します。

全エクソームシーケンス(WES)は、ヒトゲノム中のすべての既知のタンパク質コード化配列を解析するもので、遺伝的多様性の研究のために使われ始めてから10年以上が経過しました。WGSがゲノムのほぼ全てをカバーするのに対し、市販の多くのカタログWESパネルで読まれる領域は、コーディング領域と、イントロン境界やUTRなどの近縁領域に限られます。一方、ゲノムの全てをシーケンスするWGSは、シーケンスコストが低下する一方、データ処理およびストレージのコストが大幅にかかることが課題となっています(平均カバー率30xのWGSデータセットは、120xの典型的なWESデータセットの6倍以上のシーケンスデータに相当します)。

今回、WGSのデータセット(平均カバー率133x)と2種類のWES(カタログおよびカスタムパネル)のデータセットの比較が行われました。カスタムWESパネルでは、診断に関連する領域をカバーするべく、Human Genome Mutation Database(HGMD)のすべての既知の疾患原因となるノンコーディング領域が既存のWESパネルにターゲットとして追加されました。

カスタムWESパネルのベースになった既存のWESパネルは、TwistのCore ExomeパネルをベースにCCDSだけでなくRefSeqデータベースのコーディング領域もターゲットとしてキャプチャされるよう、スパイクインとして加えたものです(現在、TwistからComprehensive Exomeパネルとして販売されています)。今回カスタマイズされたターゲットは、(1) 数百の遺伝性疾患をカバーするCeGaT社の20以上の診断パネルのコーディングおよびノンコーディング領域、(2)HGMDに登録されている全ての病原性および病原性の可能性が高いノンコーディングバリアント、(3) ClinVarデータベースに登録されている全ての病原性および病原性の可能性が高いノンコーディングバリアント、(4) ミトコンドリアゲノム、(5) Ensemblなどの別の遺伝子データベースに含まれる残りのコーディング領域、そして、(6) 薬理遺伝学的に関連するバリアント領域です。

WGSを含めたデータセットの比較のために、平均カバレッジ、カバレッジの均一性(fold 80)、カバレッジの完全性(%covered ≥30x)の3つの評価指標が用いられました。カバレッジが均一であるほど、より少ないシーケンス量でより多くの領域がカバーされます(優れたエンリッチメントシステムでは Fold80が1.3程度に近づきます)。カバレッジの完全性は、臨床診断において最も重要な指標で、不完全なカバレッジ領域があると、検査の感度低下につながります。

WGSのデータセットでも、全てのコーディング領域が完全にカバーされることはなく、シーケンサーおよび使用する参照ゲノム配列によって、マッピングできないリードが生じます。カスタムWESパネルでのコーディング領域のカバー率(99.5%)は、WGSと非常に近く、既知の疾患原因となるノンコーディングバリアントも高いカバー率を示しました。

現在の臨床知識では、既知の疾患原因となる変異のほとんどはコーディング領域内(89%)または隣接するスプライス領域内にあり、遺伝子間またはディープイントロニックな位置にある新規変異は臨床的に評価されることはあまりありません。従って、カタログWESパネルを用いることで、病気の原因となるバリアントの大部分を分析することが出来ます。しかしながら、カタログWESパネルや疾患別パネルデザインをカスタマイズして、deep-intronic、UTR、遺伝子間領域を含めることで、既知の疾患原因となる変異に対する感度を高めることができ、費用対効果の優れたアッセイとして機能します。

このテクニカルノートでは、データの品質を高めるフィルタリング(シーケンス長がインサートサイズよりも大きい場合に発生するオーバーラップのペアリードエンドを除去する点など)についても述べられています。

参照英文資料:
https://www.cegat.de/en/diagnostics/exome-diagnostics/the-best-possible-exome/