残り物には福がある?

前回のブログに続く内容がちょうど「私のちょっとした実験ハック」に関連してそうですので、今回はそれについて紹介させていただきます。前回のブログで述べましたが、私たちは世界で初めて、モデル生物であるアカパンカビに感染する菌類ウイルスを発見しました(Honda et al., Naure Comm, 2020)。しかし、アカパンカビはショウジョウバエの次に確立された歴史あるモデル生物ですが、これまでこの生物に感染する菌類ウイルスが発見されていないという不思議な状況でした。今回は、この発見の舞台裏について詳しくご紹介します。

NGS解析はバイオ系研究のトレンドの一つです。その中でもRNA-seqが注目され、特にトランスクリプトーム解析はその筆頭に挙げられます。簡単に説明しますと、トランスクリプトーム解析は特定の細胞や組織内のRNA配列情報を包括的に読み取り、その情報をコンピューターで処理・解析することで、全遺伝子の発現量を調べる手法です。そして、このコンピューター処理の鍵となるのが「マッピング(mapping)」です。詳細を知りたい方は、本領域代表者の中川さんが以前書かれたブログ記事「サルでも分かるマッピング(サルマップ)」をご覧いただくことをおすすめします。

ここでは、簡単に説明します。「マッピング」は、生物学の基本原理であるセントラルドグマの転写とは逆の操作をコンピューターで行うもので、「RNA→ゲノムDNA」といった操作を行います。具体的には、対象のゲノムDNA配列情報(リファレンス)にシーケンスされたRNA配列情報(リード)を合わせる作業です(図左)。そのため、「マッピング」を行うには、最初に対象となるゲノムDNA配列情報(リファレンス)を選択する必要があります。

一般の方やウェット研究者にとっては、専門的で難しいように感じるかもしれませんが、対象を決定するプロセスは非常に単純です。研究者は解析したい生物種(例: ヒト、マウス、ショウジョウバエ、アカパンカビなど)を選び、その生物種のゲノム情報を公共のデータベースからダウンロードして使用します。これらのデータベースは研究者コミュニティによって構築され、高い信頼性があります。さらに、共通のゲノム情報を使用することで、データの比較や再現性の確保、計算時間の短縮などが可能になります。このプロセスはほぼ標準化され、確立された手法です。

ただし、この標準化は特定の生物種に焦点を当てており、異物の混入やウイルス、細菌感染については考慮されていません。

前回のブログでも紹介しましたが、菌類ウイルスの多くは無病徴感染を引き起こします。感染していても健康そのものです。通常、病気の原因としてウイルス感染を疑いますが、健康な場合は疑いません。この考え方はとても自然で、私も20年以上にわたりアカパンカビをモデル生物として研究していますが、菌類ウイルスの研究分野に参入する6年前まで、そのように考えていましたし、他のアカパンカビ研究者も同じように考えていたことでしょう。

ただ、幸運なことに、ある研究会を通じて植物ウイルスも大半が無病徴感染しており、トランスクリプトーム解析に用いられた生データを再利用して、未知のウイルスの検出ができることを知りました。そこで、共同研究を開始し、公共データベースにデポジットされているアカパンカビの生データを用いて調査することにしました。詳細な方法は論文に記載されていますので、ここでは概要を説明します。

ターゲットはアカパンカビに感染している未知のウイルスです。したがって、アカパンカビのゲノムDNA配列情報(リファレンス)に存在しない、つまりマッピングされないシーケンスされたRNA配列情報(リード)を回収します(図右)。そして、この回収した配列のみを用いて、アセンブル(組み立て)という操作を行います。その後、RNAウイルスに必要不可欠な自身のRNAゲノムを複製するRNA複製酵素に特有のアミノ酸配列が存在するかどうかをドメイン検索で調査します。もし特有のアミノ酸配列が見つかれば、菌をストックセンターから入手し、ウェット実験で菌類ウイルス感染を確認します。その結果、134種類の野生株から13種で新規の菌類ウイルスが感染していることが明らかになりました。

甲斐さんのブログでも触れられていますが、最近では論文が受理されると、元の生データを提出する必要が増えています。この作業は非常に手間がかかり、以前は「誰もこの生データを見ないだろう」と思いながら、ある種の義務感から行っていました(本当に申し訳ありませんでした)。しかし、今回の解析によって、以前は無価値だと考えていた膨大な生データの中から、宝物である菌類ウイルスを発見できたことが明らかになりました。さらに、お金のかかるウェット実験やフィールドワーク(外で菌の採集)をしなくても、ほぼ無料で快適な部屋で作業し、宝探しをすることができたので、その衝撃は私にとって驚くべきものでした。

しかしながら、この解析にはお宝だけでなく、恥ずかしい情報も見つかることがあります。それはコンタミネーション(混入)です。アカパンカビを純粋に培養して得られたサンプルから、ヒトの配列や環境中の微生物の配列など、さまざまな配列を検出しました。おそらく、サンプルを調整する過程で混入したものでしょう。言い換えれば、実験操作の品質まで確認できるのです。私も、知らず知らずにお宝だけでなく、恥ずかしい情報も提供している可能性があることを認識したときは、かなり不安になりました。

一方で、NGS解析の生データを改竄したり隠蔽したりすることは不可能なため、それがもっとも信頼できる解析方法だと強く感じ、私の中ではやはりNGS解析がファーストチョイスです。 

投稿者プロフィール

本田信治福井大学 学術研究院医学科
アカパンカビ研究者です。