2016年4月30日

ガモフらによる初期の遺伝暗号解読研究 Kay, Who Wrote the Book of Life?, 第4章前半

Lily E. Kay, Who Wrote the Book of Life?: A History of the Genetic Code (Stanford: Stanford Univeristy Press, 2000), pp. 128–150.


第4章 聖書学的テクノロジー:1950年代における遺伝暗号

● ブラックチェンバー(黒い部屋):重複コードの台頭と衰退

【128-1】1950年代の遺伝暗号理論研究についての科学者たちの一般的な評価は、よくて「素朴で楽観的」、悪いと「不正確で無益」だったというものである。だが本章では、暗号研究者の広いネットワークや冷戦時代の文化的・軍事的文脈のなかに位置づけることで、この時期の研究の重要性を詳説する。特にフランシス・クリックの研究をこうした文脈に位置づけることで、遺伝暗号研究の歴史について従来とは異なる記述をしていく。これまでのクリック中心の物語では、他の人々の業績、特にロシア系移民の物理学者ジョージ・ガモフの業績が軽視されてきた。

【128-2】ガモフは、軍事に関係した戦後の物理学文化を遺伝と生命の表象に持ち込んだ。ガモフ自身による分子生物学研究は一時的なものであったが、遺伝暗号という想像上の対象を構成する強力な比喩的表現と言説的ソフトフェアを提供した。ガモフは、ウィーナー、シャノン、フォン・ノイマン、Henry Quastlerといった人々の研究を受け継ぎ、遺伝を暗号文による情報転送のプロセスとして想像した。

【129-1】すぐに、武器設計やオペレーションズ・リサーチ、暗号学に携わってきたような著名な物理学者、生物物理学者、物理化学者、数学者、通信エンジニア、コンピュータ分析者などが暗号解読研究に参加してきた。5年間のあいだに、ガモフらは情報理論、言語学、暗号学といった通信科学の比喩を持ち込んだのである。遺伝暗号解読者の一人であるカール・ウーズ(三ドメイン説で知られる)は、1961~67年におけるこの分野の劇的な進歩は、それ以前に築かれていた概念的枠組みのおかげだったと回想している。

【129-2】さらにこの頃、分子生物学に自らを情報科学として再設定させ、対象を電子的通信システムの観点から表現させる、知と権力の結合体が形成された。物理学的な課題、言語、態度、そして物理学者の名前を借用したことで、生物学はその性質や目標を再構成することになった。本章では、情報理論、暗号解析、言語学という三つの言説のあいだで平衡を保つ  聖書学的テクノロジーによって、古い遺伝的特異性の問題が再構成された過程を示す。

ダイヤモンド・コード


【131-1】元来ガモフは物理学者であるが、1940年代には生物学の分野で活発な活動を見せた。1946年の理論生物学ワシントン会議「生体の物理学」(p. 106)を組織したのもガモフである。DNAの二重らせん構造が発表された1953年の春までに、ガモフの科学啓蒙書『生命の国のトムキンス』は広く知られていた。

【131-2】ガモフはワトソンとクリックの論文を読んだあと、すぐに二人に手紙を書いた。その手紙には、4つの塩基にそれぞれ1、2、3、4の番号を割り振るとすれば、生物の各個体を長大な数値1つで表現することができ、組合せの数学と整数論で研究できるのではないかというアイデアが記されていた。また、海軍で暗号解読に当たっていた人々に、タンパク質を構成するアミノ酸の順序を送って相談してみたとも記している。

【132-1】ガモフが遺伝暗号解読に参入した1953年は、冷戦の緊張が高まって米国の科学に大きな影響を与えていた時期であった。科学は国家の安全保障における要とみなされ、特に物理学、数学、コンピュータ科学、暗号学などの分野では軍から莫大な予算が降りるようになっていた。

【133-1】暗号という手法の歴史は文明の歴史と同じくらいに古く、スパルタやローマ帝国でも用いられていた。暗号学はルネッサンス期にいくつもの手法的革新を経て、17世紀にはアントワーヌ・ロシニュルがルイ14世の王室暗号学者となったことで制度化された。18世紀には国家の暗号解読活動が「黒い部屋(Cabinet Noir)」と呼ばれる場所で行われるようになり、この言葉は後に政治的な暗号学を指すのに使われることになる。

【133-2】19世紀に電信線が敷設され腕木通信に置き換わると、商業の領域で暗号が盛んに用いられるようになった。しかし、人力による暗号化は作業量が膨大となり、しかも単なる頻度分析によって破られてしまうことから、第一次世界大戦を境に商業的暗号は衰退した。一方で政治的な領域では暗号が盛んになり、1920~30年代に暗号学は組織的にも機械的にも理論的にも大きな転換を迎える。

【133-3】英国では外務省の暗号解読機関が拡充され、1939年にブレッチリー・パークに設置された。チューリングなど優秀な数学者や物理学者が雇用されたこの機関は、1940年代において世界をリードする暗号解読の拠点であった。米国では、米国の黒い部屋として知られる組織がニューヨークに設置され、1920年代には暗号機や数学的手法が導入された。そして第二次世界大戦によって、暗号書記は機械化され、暗号解読は数学化され、暗号学は国家の最重要な知の源となった。1945年、黒い部屋は国家安全保障局(NSA)に従属する陸軍秘密保全庁(ASA)という組織となった。

【134-1】1940年代末から1950年代初頭にかけてシャノンが定式化した冗長性の概念が適用されたことで、暗号解読は新たな技術的レベルに到達した。冗長性は、1から相対エントロピーを引いた値として定義される。

【134-2】シャノンはこのアイデアを言語学と暗号解読に適用し、その両方に影響を与えた。冗長性は、メッセージでは実際に必要な情報以上のシンボルが伝達されているということを意味する。たいていの場合、冗長性が生じるのは言語学的な規則や制約が過剰なためである。冗長性が暗号解読に基礎を提供していることを指摘することで、シャノンの情報理論は暗号解読を難しくする方法や必要になる暗号文の量を示していた。

【135-1】こうした新しいアプローチは電子コンピュータの使用と結びつき、暗号解読は電子通信科学のなかで再構成された。1950年代になるとガモフらの遺伝暗号解読チームは、米海軍兵器局やロスアラモス科学研究所といった最先端の電子的暗号解読技術をもつ組織に助力を求めた。

【135-2】ガモフは1950年代において米国の科学的想像力を惹きつけており、名声は極めて高かった。ガモフは兵器局やロスアラモスを含む様々な機関においてコンサルタントを請け負っており、軍産学複合体を体現する人物であった。

【135-3】ガモフは米国のいくつもの大学や日本、インド、オーストラリアで特別研究員の地位をもっていた。トンプキンシリーズを含む20冊以上の科学啓蒙書を出版したほか、テレビなどのメディアにも頻繁に出演して全米を駆け回っていた。

【136-1】1953年、ガモフはNature誌に、遺伝暗号の問題に関する予備的な定式化の考察を送っている。生物の遺伝的特性は4種類の数字で書かれた長大な数値として表現でき、これが約20種類のアミノ酸によって形成される長いペプチド鎖を完全に決定する。ガモフはペプチド鎖を「20文字のアルファベットに基づく長い『言葉』」として表現しており、そのような「言葉」がどのようにして4種類の数字から翻訳されるのかを問題にしていた。

【136-2】ガモフが提案した解決案(いわゆる「ダイヤモンド・コード」)は、重複するトリプレットの暗号であった。重複するというのは、AGCTGAACTのような配列があったときに、AGC、GCT、CTG、TGA、……がそれぞれアミノ酸に対応することを意味する。このモデル(図11)では、DNAの二重らせん構造において外側にできるダイヤ形のくぼみが「鍵穴」となり、そこに入り込む「鍵」であるアミノ酸の種類を規定する。ダイヤ形のくぼみは周囲にある4つの塩基によって決まるが、塩基の相補性によって一つの軸には制限がかかるので、ダイヤ形はちょうど20種類存在することになる。これが20種類のアミノ酸に対応するとガモフは考えたのである。

【138-1】この考察をNature誌に送った日、ガモフは同じ図をポーリングにも送ったが、ポーリングはそれを高く評価しなかった。またクリックは1953年から54年にかけての冬に、当時用いることができたデータ(サンガーが発表したインスリンのアミノ酸配列)を使ってガモフのモデルを反証しようとしていた。この頃から、DNA鎖とペプチド鎖の共直線性や、生物界における暗号の普遍性は暗黙のうちに仮定されるようになった。

【138-2】米国科学アカデミーの会員に選出されたガモフは、自身のアイデアを拡張した論文「デオキシリボ核酸とタンパク質のあいだにあり得る数学的関係」をアカデミーの紀要(PNAS)に投稿したが、これは大不評であった。ガモフはこれを撤回して別の紀要に出し直したが、いずれにしてもこの論文は広く出回った。

【138-3】この論文において、ガモフはDNAとタンパク質の特異性の問題を、情報伝達や暗号解読や言語学などの観点から表現した。エミール・フィッシャーの「鍵と鍵穴」の説明を用いつつ、ガモフはテクストとしての生物という考え方を語った。アミノ酸の配列に固有なものとしての特異性という概念を、情報量とか、秘密の言語的通信としての遺伝といった新しい概念に結びつけたのである。

【138-4】重複は暗号解読にとって鍵となる性質であった。ガモフは、DNAとタンパク質のあいだに重複による数学的対応関係があるため、インスリンのアミノ酸配列データなどを用いることでダイヤモンド・コードの一部を解読できるはずだと考えていた。解読はうまくいかず、クリックによる批判も存在していたが、ガモフは楽観的であり自分は大まかには正しいはずだと考えていた。

【139-1】生命科学者がみなガモフのアイデアに反対していたわけではないようだ。生化学者シャルガフは、後には理論的解読や情報的比喩に反対することになるが、はじめはガモフの寄与を歓迎していた。ただし、DNAからタンパク質が直接合成されるという考え方よりも、DNAからRNAが、RNAからタンパク質が作られるという考え方を支持していた。

【139-2】ロシア生まれの生物学者マルティナス・イチャス(Martynas Yčas)は、ガモフのアイデアに魅了された。イチャスは1951年から56年にかけて米国陸軍に雇われて研究を行っており、ガモフと協力して遺伝暗号の解読を目指していた。56年からはニューヨーク州立大学で微生物学の教授となった。

【139-3】イチャスは、この問題に取り組む上では物理学者よりも不利であったが、生物学者としての能力によってそれを補っていた。ガモフとイチャスはお互いを補い合う関係にあった。

【140-1】イチャスは、ガモフがNature誌に考察を発表した後すぐから文通を始めていた。イチャスは、ダイヤモンド・コードではインスリンのアミノ酸配列を決定できないということを伝えた。ガモフは、ダイヤモンド・コードが単純すぎるということを認めるようになった。

【140-2】ガモフはイチャスによる批判を歓迎した。二人は共にロシア出身であり、軍事的パトロンに関する価値観も一致していた。

【140-3】世間のダイヤモンド・コードに対する反応は懐疑的であったが、ガモフはその形式的な図式がDNAではなくRNAに適用できる可能性も想定していた。ガモフは、この問題に取り組む上では電子コンピュータが必要だと考え、ロスアラモスのMANIACに目をつけた。ガモフは、週に一日を生物学に割くようになっていた。

【141-1】ダイヤモンドのモデルはうまくいかなかったにしても、ガモフとその図式は同僚たちを熱狂させ、多くの著名な物理学者が遺伝暗号の数学的性質の問題に取り組んだ。そこでガモフは、研究者たちのネットワークである「RNAタイクラブ」を設立した。

【141-2】ガモフや同僚たちは、遺伝暗号を敵の暗号に見立てていた。冷戦の軍事的想像力による指示の体制は、生命の表象を変えていたのである。そして遺伝的解読の言説は、電子的テクノロジーの領域で定式化されていた。

【141-3】RNAタイクラブには、ガモフとイチャスはもちろんのこと、ファインマン、シャルガフ、ワトソン、デルブリュック、クリックなどのメンバーが参加していた。20人のメンバーのうち、13人が物理科学者(化学者、物理学者、数学者など)であった。メンバーは20種類のアミノ酸に対応づけられており、それぞれがアルファベット3文字のコードネームをもっていた。

【142-1】ガモフとイチャスは年2回の会合の資金を陸軍から得ようとしていたが、結局は失敗に終わった。RNAタイクラブのメンバーは地理的にかなり分散していたが、それゆえに、遺伝暗号の問題とその言説的・運用的資源を拡散させ、遺伝と生命の表象を作り変える役割を果たした。

軍事的暗号? 論理学、統計学、言語学

【144-1】1954年5月までに、ガモフはダイヤモンド・コードが有り得ないということを受け入れ、新しい暗号を検討し始めた。二本鎖のDNAではなく一本鎖のRNAがタンパク質を合成しているということを踏まえて、ガモフやアレクサンダー・リッチ、ファインマン、レスリー・オーゲル(すべてRNAタイクラブのメンバー)は様々な暗号体系を模索した。そのすべてが、重複したトリプレットに基づく暗号であった。

【144-2】一つの案は「三角コード」と呼ばれるものであり、「コンパクト」と「ルーズ」という二つの種類があった。この暗号では、塩基の配列によって螺旋のなかに生まれる20種類の三角形が20種類のアミノ酸に対応する。
[三角形の各頂点が同じ塩基であるαタイプが4種類(×1)、2つの頂点だけが同じ塩基であるβタイプが12種類(×3)、3つの頂点がすべて異なる塩基であるγタイプが4種類(×6)、で計20種類となる。]
「コンパクト」ではすべてのアミノ酸がつながれてタンパク質になるが、「ルーズ」ではアミノ酸が一つ飛ばしでつながれて2つのタンパク質が合成される。「ルーズ」は「コンパクト」よりも制約が少ないため、暗号の解読は困難になると予想された。

【144-3】ファインマンとオーゲルは「メジャー・マイナー・コード」という重複トリプレットコードを考えていた。この暗号では、トリプレットの中心にある塩基が「メジャー」、その隣にある2つの塩基が「マイナー」として区別される。

【144-4】だがペプチド鎖のアミノ酸配列が明らかになるにつれ、メジャー・マイナー・コードも成り立たないことがわかってきた。そこで核物理学者のエドワード・テラーは、アミノ酸が2つの塩基と直前のアミノ酸によって決定されるというアイデアを発表した(ガモフはこれを「ロシア風呂コード」と呼んだ)。もしこのアイデアが正しいとすると、他よりも出現率の高いアミノ酸の並びがあるということになる。

【146-1】1954年の夏、ガモフはロスアラモスの理論物理学者ニコラス・メトロポリス(RNAタイクラブのメンバー)と協力して、MANIACで様々な重複コードを試験した。頻度分析を行うと共に、人工的な配列と実際の配列の違いが調査された。暗号の制約が強ければ強いほど、特定のアミノ酸の隣に来るアミノ酸の種類は少なくなるはずである。しかし結果としては、期待したような違いは見出だせなかった。

【147-1】結果から示唆されたのは、実際のタンパク質におけるアミノ酸配列は純粋なランダム配列であるということであった。しかしガモフとメトロポリスは、コードが重複しているという前提(もっといえば、これは言語の系統的操作すなわち暗号の問題であるという前提)を疑わず、手法の精度が不足しているせいだろうと考えた。

【147-2】RNAタイクラブの一員である、南アフリカ出身の生物学者シドニー・ブレナーは、1954年に初めて訪米してクラブのメンバーらと議論した。ブレナーはガモフの三角コードを否定し、コードは重複していないと論じた。

【148-1】この年の9月に、ガモフとイチャス、リッチは遺伝暗号の問題について包括的なレビュー論文を書くプロジェクトに取り掛かり、膨大な量の文献を調査した。だがこの論文が発表された1956年までに、そこで紹介された暗号はすべて反証されてしまった。

【148-2】レビュー論文に取り組む傍ら、ガモフはロバート・レドリーを巻き込むことで記号論理学の方面から遺伝暗号の問題に挑んでいた。レドリーは論理学的手法の応用範囲を広げる好機と捉え、重複コードを前提として問題に取り組もうとしたが、計算機を使っても到底終わらない量の計算が必要になってしまうことがわかった。

【149-1】他にも二つの解読方法が試みられた。一つ目は、核酸の構成とタンパク質の構成に相関関係を見出そうとする統計学的分析であった。二種類のウイルスで塩基の構成が異なればタンパク質の構成も異なるはずだという推測に基づいていたが、矛盾する結果が出てしまった。

【149-2】二つ目は、ブレナーがまとめたジペプチドのデータに基づく、やはり統計学的な方法であった。

【149-3】ガモフ、リッチ、イチャスのチームは、20種類のアミノ酸が隣り合う400種類の並び方それぞれについて、実験的に得られた割合(ブレナーのデータ)と、様々な想定される暗号から予測される割合を比較した。だが、前者はほとんどポアソン分布に従っていたのに対し、後者はポアソン分布から大きく外れていた。

【150-1】レビュー論文の原稿が完成した頃、イチャスはコードがおそらく重複していないということ、そして自分たちの試みが失敗であったということを認めるようになった。だが彼らの研究は「暗号化問題」を定義し、非重複コードの分析への道を開き、アミノ酸置換など解読のための有益なアプローチを示唆した。さらに、遺伝を通信システムとして表現する言説、記号論、比喩をつくりあげた。暗号は、情報の伝達を支配する聖書学的テクノロジーへの鍵であった。


0 件のコメント:

コメントを投稿