ゲノムプロジェクトとは、DNAシークエンシングによって生物ゲノムの全塩基配列を解読し、タンパク質コード領域やその他のゲノム領域のアノテーションをつけることを目的としたプロジェクト。当初はヒトをはじめ、マウス線虫などのモデル生物が主な対象であったが、多くの生物種に対象は拡大している。各国の公的研究機関がチームを組んでプロジェクトを進行させるケースが多いが、イネ小麦などの主要農産物については企業による解読もなされた。

塩基配列情報は重要なものではあるが、それだけでは生物の理解には不十分であり、遺伝子領域や制御領域の認識、それらの役割の解明などを進めていくことが望まれる。これらの研究をポストゲノムと総称する。

ゲノムアッセンブリング 編集

ゲノムアッセンブリングとは、大量の短いDNA断片の配列を決定し、元となった染色体のDNA配列を構築しようとする過程である。配列アセンブリングなどとも呼ばれる。ショットガン・シークエンシング法によるプロジェクトでは、サンプルから得られたDNAは断片化されている。これら一つ一つの断片はリードと呼ばれ、シーケンサーにより配列決定される。得られたリードは、バイオインフォマティクス的なアルゴリズムによりオーバーラップする部分を探索しつなぎ合わせていく。

ゲノムアッセンブリングは非常に困難な技術的問題を抱えている。それはマイクロサテライトや、SINEsLINEsといった繰り返し配列がゲノムには大量に含まれるためである。とりわけ、ゲノムサイズの大きい動植物ではこれらのリピートは数千塩基におよんだり、大量に散在している。

結果として得られるドラフト配列は、コンティグごとにまとめられ、領域ごとの情報とリンクさせるための足場となる。

ゲノムアノテーション 編集

ゲノムアノテーションとは、配列に生物的な情報を注釈する過程である。

ゲノムプロジェクトとモデル生物の一覧 編集

後生動物 Metazoa 編集

植物 Plantae 編集

菌類 Fungi 編集

原生生物 編集

細菌 編集

2008年10月現在、細菌では780の菌株のゲノム解読が終了している。

古細菌 編集

2008年10月現在、古細菌では53の菌株のゲノム解読が終了している。3ドメインの中では最も解読数が少ないが、発見種も少ないため解読された割合自体は最も高い。ほぼ全ての目に渡って解読種が存在する。

細胞内小器官 編集

葉緑体ミトコンドリアもそれぞれ独自にゲノムを持っており、これらについてのゲノムプロジェクトも進行している。

ウイルス 編集

ウイルスは宿主の遺伝子に依存しているためゲノムサイズが小さい。2008年10月現在、ウイルスでは2700種のゲノム解読が終了している。

メタゲノム 編集

メタゲノム解析は単一菌種の分離・培養過程を経ずに、微生物の集団から直接そのゲノムDNAを調製し、そのヘテロなゲノムDNAをそのままシークエンシングする。そのため、メタゲノム解析により従来の方法では困難であった難培養菌のゲノム情報が入手可能となった。

脚注 編集

関連項目 編集

外部リンク 編集