読み物:DNAはデジタル革命を加速させるか?
世界の大半のデータは、数十年も持たない記録媒体に保存されています…

もし今日、文明が途絶えたとしたら、私たちの「情報化時代」は何の痕跡も残さないでしょう。後世の人々は、21世紀がかつてデジタルデータを前例のない規模で生み出し、消費した時代だったことをほとんど認識できないはずです。産業革命がその遺構によって明確に時代を物語るのに対し、デジタル革命は形がなく、基盤は急速に劣化しているため、歴史には「見えない存在」となってしまうのです。
世界のデータの大部分は、たとえ冷凍保存や完全な暗所といった理想的な条件下でも、数十年以上は持たない媒体に保存されています[1]。ある調査では、ハードディスクを4年間稼働させると22%ものデータ損失率があることが示されました。しかも世界のデジタルデータ量は2年ごとに倍増しており、保存能力は全く追いついていません。EMCによる最近の調査によれば、2013年には全デジタルデータの33%を保存できていたのに対し、2020年にはわずか15%しか保存できなくなると予測されています。
膨大なデータを compulsive(強迫的)に生み出して保存する社会でありながら、現在の短命な記録技術はアーカイブとして不十分であり、規模や寿命の面で役割を果たせていません。このギャップを埋めるには、新しいが同時に最も古い情報技術──DNA──が鍵となります。
Twist BioscienceはMicrosoft研究チームと合意し、1,000万本の長鎖オリゴヌクレオチドを提供し、デジタルデータをDNAにエンコードすることを発表しました。これは単なる企業的観点を超え、世界的視点からも非常に重要な取り組みです。なぜなら、世界中で指数関数的に増え続けるデジタルデータを、長期的かつ安全に保存する新しい方法が求められているからです。
地球上には約500億トンのDNAが存在し、生命を繁栄させてきた「情報技術」として機能してきました。DNAは細胞の多様な働きを指示する分子であり、現代のデジタルコンピュータのように、離散的な記号の並びで情報を扱います。コンピュータが「0」と「1」で表現するのに対し、DNAはアデニン(A)、シトシン(C)、グアニン(G)、チミン(T)の4つの塩基で情報を符号化します。DNAの長い鎖はこれらの塩基が連なったもので、その配列が生命活動すべてのプログラムを担っているのです。近年のシーケンス技術や合成生物学の進歩によって、DNAが「情報技術」であるという概念は比喩を超え、現実のものとなりました。
10年前までは、DNAを使ってデジタルデータを読み書きすることは不可能でした。2003年に国際ヒトゲノムシーケンスコンソーシアムが30億塩基対からなるヒトゲノムを初めて解読しましたが、そのコストは10億ドル以上。しかし今では、全ゲノム(約30億文字)を1,000ドル余りで解読でき、コストはさらに下がり続けています。DNAシーケンスが安価になり、合成技術も進歩したことで、Twist BioscienceとMicrosoftはDNAデータストレージの理論を実践へと移しつつあります。目標は、実用的かつスケーラブルな方法を確立することです。DNAは従来の媒体が抱える寿命の短さ、フォーマット依存、データ密度の低さといった制約を受けません。
従来の最良の媒体でも100年程度が限界なのに対し、合成DNAは数百年から数千年、場合によっては数百万年単位で情報を保持できます。実際、シベリアの永久凍土から回収されたマンモスのDNAは2万8千年を経ても解読可能でした。理論上は100万年の保存も可能だとされています[2]。しかもDNAアーカイブは電源や冷却装置などの維持管理が不要で、保管スペースも極めてコンパクトです。わずか1グラムのDNAに1ゼタバイト(1兆GB)のデジタルデータを保存できるのです[3]。20グラム以下で世界中のデジタルデータをすべて保存できる計算になります。
DNAが優れている点は、未来永劫にわたって読み取り技術が保証されることです。地球上にDNAで構成された生命が存在し続ける限り、DNAを解読する技術は維持されるからです。科学や医療研究の分野でもDNA関連技術は重要性を増しており、読み書き技術の改善は今後も加速するでしょう。
データ保存には「短期」と「長期」があります。短期(計算・電子系)は一時的で、長期(物理的)保存は現在テープが主流ですが、約10年ごとにコピーが必要です。将来的には、家庭用コンピュータにDNAシーケンサーや合成機が搭載され、短期保存にもDNAが使われる可能性があります。現段階では、Twist BioscienceとMicrosoftは歴史的文書や画像などアクセス頻度の低いデータの長期保存にDNAを活用しようとしています。それだけでもアーカイブ技術における大きな進歩であり、文化的にも大きな影響を与えるでしょう。
現代文明は過去のどの時代よりも膨大な自己記録を残していますが、そのほとんどは未来に残らない可能性があります。数万年後、私たちの遺産がマンモスのDNAのように回収され、未来の人々に解析される日が来るかもしれません。MITのティモシー・ルー教授もPNAS誌の論文でこう語っています。「米国議会図書館の全蔵書をDNAに記録することも、ハリウッド映画を保存することも可能だ。私たちはすでに複数の回路を構築したが、これは応用の第一波にすぎないのだ」と。
参考文献
- Hedstrom M (1997) Digital Preservation: A Time Bomb for Digital Libraries. Computers and the Humanities 31(3):189-202.
- Poinar HN, Schwarz C, Qi J et al. (2006) Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA. Science 311:392-394.
- Church GM, Gao Y, Kosuri S (2012) Next-Generation Digital Information Storage in DNA. Science 337(6102):1628.

