DIA (Data-Independent Acquisition) について (ChatGPTを活用して)

今回のブログのお題は「私のちょっとした実験ハック」でしたが、特に記載できる内容も持ち合わせておらずどうしたものかと考えていたところ、自由に書いてもOKとのご連絡をいただきました。そこで、自分の専門とするプロテオミクス分野において近年飛躍的に注目度が上がっている DIA(Data-Independent Acquisition)について、ChatGPT と対話しその考察を投稿することにしました。ChatGPTを使用するには、まず自身のアカウントを作成する必要があります。

今更感は平にご容赦いただきたく、まずは ChatGPT の登録から…。

公式サイトから登録しました。2023年8月現在、登録には Email address, First name, Last name, 生年月日 及び電話番号が必要です。登録した電話に認証コードとして6桁の数字が届きますのでその数字を「Enter code」に入力して完了です。とても簡単でした。

早速「Send a message」に「DDA と DIA」と入力してみました。(因みに、質量分析計を用いたプロテオミクスにおいて、DDA は従来からのデータ依存的なペプチド情報の取得法であるのに対し、DIA はデータ非依存的なペプチド情報の取得法です。)

すると、回答は DDA(Direct Device Assignment)、DIA (Direct Interface Architecture) のように、全く関連のない仮想マシンやコンピュータリソースの管理に関連する用語が返されました…。

そこで、「DIA  プロテオミクス」と入力しました。

以下に ChatGPT(GPT-3.5)の回答を記します。

 

「DIA プロテオミクス」は、質量分析を用いてタンパク質の量とアイソフォームの変動を網羅的に解析する手法です。DIA(Data-Independent Acquisition)は、タンパク質やペプチドの質量スペクトルを広範な質量範囲で同時に取得するための質量分析手法です。この手法は、従来のターゲット指向の質量分析手法である SRM(Selected Reaction Monitoring)や PRM(Parallel Reaction Monitoring)とは異なり、より幅広いタンパク質の同定と定量を可能にします。

プロテオミクスは、生物学的なシステム内の全てのタンパク質の量と機能を研究するための技術です。DIA プロテオミクスは、この目的を達成するためのツールとして使用され、特に複雑な生物学的サンプルにおけるタンパク質の解析において有用です。DIA プロテオミクスは、タンパク質のアンモニア酸配列の同定と量的解析を同時に行うことができるため、生物学的な研究や医学研究において幅広い応用があります。

この手法は、タンパク質の量と変動の解析において非常に有力なツールとされており、タンパク質研究やシステム生物学の分野で広く活用されています。

 

以上です…。

上述したように、DIA の対義語としては DDA がふさわしいのですが、 ChatGPT「GPT3.5」の回答において、その対象が SRM や PRM となっている点に少し違和感を覚えました。特に後半部分の「タンパク質のアンモニア酸配列」とは???

ところで、ChatGPT「GPT-3.5」の後継モデルとして有料の「GPT4」があります。当研究室の宮村さんがアカウントを持っていたので、比較のために「DIA  プロテオミクス」と入力してもらい、以下の回答を得ました。

 

DIA(Data Independent Acquisition)は、質量分析を使用してプロテオミクスサンプル中のタンパク質を検出および定量するためのアプローチの一つです。プロテオミクスは、特定の条件や時点で細胞、組織、または生物全体で発現しているすべてのタンパク質を研究する学問です。

DIAの基本的な考え方は、質量分析において、あらかじめ選択されたm/z(質量/電荷)の範囲全体での断片化を行うことです。これは、選択された特定のペプチドイオンに焦点を当てる代わりに、可能な限り多くのペプチドイオンを断片化することを意味します

DIAとは異なる、より従来の方法は DDA(Data Dependent Acquisition)です。DDA は、質量分析の最初の段階で最も集中的なイオンを選択し、それを断片化します。このため、DDA は高集中のペプチドのみを検出し、低集中のペプチドは見逃される可能性があります。一方、DIA では、あらかじめ決められた m/z の範囲に基づいてペプチドを断片化するため、低集中のペプチドも検出できる可能性があります。

DIAの利点:

再現性: 同じm/zの範囲が毎回断片化されるため、異なる実験やサンプル間での比較が容易になります。
完全性: 質量窓内のすべてのペプチドが断片化されるため、DDAと比較して低集中のペプチドの検出が改善される可能性があります。

DIAの欠点:

データの複雑さ: あらゆる m/z の範囲での断片化が行われるため、得られるデータは非常に複雑です。これを解析するには、専用のソフトウェアと高度な計算能力が必要です。
ライブラリの依存: DIAの解析は、ペプチド断片化のライブラリに大きく依存しています。このライブラリは、ターゲットとなる生物や細胞タイプに特有のものでなければならず、更新や維持が必要です。

それにもかかわらず、DIAはプロテオミクスの分野で非常に有望な技術として注目を浴びており、多くの研究者がこれを採用しています。

 

以上です。

「GPT4」において、DIAは「選択されたm/z の範囲内ですべてのペプチドの断片化を行う」というようにより具体的に解説されています。DDAの記述の中で「最も集中的なイオンを選択し」というのはシグナル強度の高いペプチドイオンから順番に選択することを意味しています。

DIA の利点および欠点についてはかなり的確に表現されており、この内容を整理すると以下のようになるでしょうか?

同定の精度:DDA>DIA

同定、定量の網羅性:DDA<DIA

翻訳後修飾部位の同定への適用:DDA>DIA

ChatGPT は専門性の高い内容に関しても、こなれた日本語で返してくることを実感しました。これからも ChatGPT と上手に対話していきたいと思っています。

 

 

 

 

投稿者プロフィール

秦 裕子
秦 裕子東京大学医科学研究所 上席技術専門員