[スポンサーリンク]

一般的な話題

話題のAlphaFold2を使ってみた

[スポンサーリンク]

 

ここ数日、構造生物学界隈で「AlphaFold2」と呼ばれているタンパク質の構造計算ツールが話題です。
2021年7月16日にGitHubで無償公開されたこの人工知能プログラムは、有志によってGoogle Colab上で動かせる簡易版も作られており、構造生物学者や生物物理学者だけでなく、生物学、薬学、化学、計算科学などに関わる幅広い領域の研究者から注目を集めています。

タンパク質はその構造と機能に密接な関係があり、通常、特定の構造をとることではじめて機能を持つことが出来ます。そのため、タンパク質の機能のメカニズムを調べたり、人工的な機能の改変や制御をしたり、あるいはアミノ酸配列のみがわかっているタンパク質の機能を推定したりするためには、タンパク質の構造情報は欠かせないものです。しかし、実験的にタンパク質の構造を確かめる手法である結晶構造解析・NMR構造解析・クライオ電子顕微鏡を用いた解析などは、年単位での時間や多額の経費がかかったり、実験に必要なタンパク質量が多かったり、高い精製度が必要であったりすることから、誰でもが気軽に行えるものではありません。

「ゲノムシーケンスデータから塩基配列だけがわかっているタンパク質について、アミノ酸の一次配列からタンパク質の構造と機能を推定したい」
「タンパク質の結晶構造を決めるために結晶を作って回折像を得たものの、位相が決定できずに途中で解析がお蔵入りしてしまっている。計算した予測構造を活用して構造解析をやり遂げたい」
「タンパク質同士がどんな複合体を形成するかのシミュレーションをやりたい」
こういった要望を持つ研究者が、今、続々とAlphaFold2を試しています。

Alphafold2の論文: https://www.nature.com/articles/s41586-021-03819-2

Alphafold2の論文(その2):  https://www.nature.com/articles/s41586-021-03828-1

 

 

Twitterでの熱狂

AlphaFold2の公開直後から、構造生物学に関係する研究者の有志によって、実際にAlphaFold2(簡易版を含む)を用いて解析した構造がTwitterに投稿され出しました。複数の研究者が様々な報告をアップしその精度の高さが示されていくにつれ、情報は拡散され、興味を持つ人が爆増。Twitter上では音声チャット機能である「スペース」を用いた座談会(という名の、もはや事実上の研究会)がこれらの有志研究者によって開催され、最終的に700人以上が参加・聴講するという(おそらくは)歴史に残る状況となりました。

座談会のTogetter: https://togetter.com/li/1748214

 

 

AlphaFold2を使ってみた

こんなにホットなのならば、是非AlphaFold2を体験してみたい。

計算科学どころかそもそもパソコンが苦手な筆者ですが、簡易版のほうならばブラウザにアミノ酸配列を入力するだけで使えるとのことで、早速やってみることにしました!

 

1. タンパク質のアミノ酸配列をゲットする
とりあえずまずアミノ酸配列を準備する必要があります。
初めての練習Runということで、Protein Data Bank(以下PDB)のWebサイトからGreen Fluorescent Protein(以下GFP)のアミノ酸配列をとってきて使うことにしました。
今回使用したのはPDB ID: 1EMAの情報です。

 

(1) PDBのWebサイト(https://www.rcsb.org/)に行き、右上にPDB IDを入力する。 (PDB IDが不明の場合はタンパク質の名称を英語で入力し、表示された一覧の中から1つを選択する)

(2) タンパク質データの個別ページにて、Display Filesをクリックし、さらにFASTA Sequenceをクリックする

(3) 表示されたアミノ酸配列データをコピー

 

 

2. AlphaFold2簡易版で構造計算してみる

いよいよgoogle colab上で動かせるAlphaFold2簡易版にタンパク質配列を入力し、構造計算を試してみます。

 

(1) AlphaFold2簡易版のページを開く

(2) query_sequenceの欄にタンパク質のアミノ酸配列をペーストする。その下のjobname欄も入力する

(3) 上のほうにある「ランタイム」タブをクリックする

(4) 「ランタイムのタイプを変更」をクリックし、GPUを選んで保存

(5) 「すべてのセルを実行」をクリック

これで計算が走ります!

 

ちなみに筆者が使っているメモリ4GBのレトロなノートパソコンでは、GFP1分子を計算するのに約15分ほどかかりました。

メモリ8GBやメモリ16GBのノートパソコンならば、このくらいの大きさのタンパク質を10分未満〜数分で計算できそうです。

AlphaFold2簡易版での計算はGoogleの計算環境で行われるため、個人が使用するPCのスペックは計算速度とは関係ないそうです。

 

計算終了して吐き出された構造はこちら。

 

おおお、GFPっぽいのが出てきた!

 

計算構造はブラウザに表示されるだけでなくpdbファイルとしても自動で出力されるので、得られた結果をPyMOLなどの表示プログラムでも扱うことができます。

結晶構造(水色)とAlphaFold2計算構造(桃色)をPyMOLで重ね合わせ表示したらこんな感じでした。

AIということでデータベース上に既にある立体構造に引っ張られるのはあると思われますが、とても似た構造!

 

 

ただし、AlphaFold2計算構造では、天然では自発的化学反応によって形成される発色団の構造はできておらず、通常のアミノ酸の形のままでした。

この事象はTwitterで報告している方がいらっしゃり、複数のGFP様タンパク質で見られるそうです。

いつか、立体構造をとる過程やとった後の化学反応まで含めて構造予測可能なAIが出てきたりするのだろうか。

 

 

複合体の構造予測もできちゃう

先述したAlphaFold2座談会の開催者でもあるYoshitaka Moriwaki氏は、7月19日にTwitterで「2つのタンパク質のアミノ酸配列を(ポリGなどの)長いリンカーでつないでAlphaFold2にかけると、複合体の構造予測ができる」との旨を提案。反響が大きかったためか、単分子計算する「Alphafold2簡易版」に加え、2つのアミノ酸配列を入力できる「Alphafold2 複合体版」ともいうべきページがどうやら7月21日(?)にアップされました。複合体版の使い方は簡易版と同様です。

 

試しに先程のGFPの配列を途中で切断し、2つに分けて複合体版のAlphaFold2に入れ、計算をかけてみました。

 

吐き出された構造はこちら。

 

2本のアミノ酸として表示されているし、それらしい形が出てきました。

これは、色々なタンパク質の配列データを使って、色んな組み合わせで、どんな複合体ができるか…研究の汎用ツールになっていくのではないでしょうか。

 

なお、Moriwaki氏はAlphafold2簡易版の使い方および通常版のインストールも含めた使用方法をWebにアップされておりますので、より詳しく知りたい方はこちらのページを参照されると良いと思います。

通常版AlphaFold2は3TB程度の大容量PCが必要とのことですのでご注意ください。

 

データベース誕生!?

Alphafold2で計算したヒトやモデル生物のタンパク質構造のデータベースが登場したようです。生物学の革命と言って過言ではないでしょう。

関連記事

2024年ノーベル化学賞は、「タンパク質の計算による設計・構造予測」へ
AlphaFold3の登場!!再びブレイクスルーとなりうるのか~実際にβ版を使用してみた~

関連書籍

 

=====================================================

※AlphaFold2簡易版での計算速度に関する記載に誤りがあり、2021年7月24日に加筆修正を実施しました。また同時に記事中の一部表記について微修正を行いました。

 

Avatar photo

Shirataki

投稿者の記事一覧

目には見えない生き物の仕組みに惹かれ、生体分子の魅力を探っていこうとしています。ポスドクや科学館スタッフ、大学発ベンチャー研究員などを経て放浪中。

関連記事

  1. メトキシ基で転位をコントロール!Niduterpenoid Bの…
  2. 金属内包フラーレンを使った分子レーダーの創製
  3. 過酸がC–H結合を切ってメチル基を提供する
  4. 【7月開催】第十回 マツモトファインケミカル技術セミナー   オ…
  5. 植物毒素の全合成と細胞死におけるオルガネラの現象発見
  6. 日本化学会 第104春季年会 付設展示会ケムステキャンペーン P…
  7. “研究者”人生ゲーム
  8. 10種類のスパチュラを試してみた

注目情報

ピックアップ記事

  1. 分子モーター Molecular Motor
  2. 女優・吉岡里帆さんが、化学大好きキャラ「DIC岡里帆(ディーアイシーおか・りほ)」に変身!
  3. 化学企業のグローバル・トップ50が発表【2022年版】
  4. Carl Boschの人生 その1
  5. マテリアルズ・インフォマティクスのためのデータサイエンティスト入門
  6. サントリー生命科学研究者支援プログラム SunRiSE
  7. 多環式骨格を華麗に構築!(–)-Zygadenineの不斉全合成
  8. V字型分子が実現した固体状態の優れた光物性
  9. 11/16(土)Zoom開催 【10:30~博士課程×女性のキャリア】 【14:00~富士フイルム・レゾナック 女子学生のためのセミナー】
  10. シューミン・リー Shu-Ming Li

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年7月
 1234
567891011
12131415161718
19202122232425
262728293031  

注目情報

最新記事

アンモニウム構造によりラジカル種の発生位置を完全に制御!

第710回のスポットライトリサーチは、関西学院大学理工学研究科 村上研究室の榊原 陽太(さかきばら …

化学つれづれ草【ある研究者の回想】

概要物理化学者で量子機能材料を専門とする著者によるエッセイ集.化学者としての研究,教育,人生…

第60回有機反応若手の会

開催概要有機反応若手の会は、有機化学分野で研究を行う全国の大学院生を中心とした若手研究者が集い、…

ノーベル賞受賞者と語り合う5日間!「第18回HOPEミーティング」参加者募集!

申し込みはこちら概要主催:独立行政法人 日本学術振興会(JSPS)開催地:神奈川…

光触媒による高効率なCO2還元の実現―まさかの光を弱く当てることが重要だった―

第709回のスポットライトリサーチは、東京科学大学 理学院(前田研究室)博士後期課程2年の仲田竜一 …

「π-πスタッキング」という言葉が生む誤解【芳香環の相互作用を見直す: 前編】

芳香環が平行に並んで近接しているとき、その構造を「π–π スタッキング」と表されることがよくあります…

一重項酸素によるC(sp2)−P結合切断を用いた長波長光によるリン化合物のアンケージング

第 708 回のスポットライトリサーチは、同志社女子大学 薬学部 医療薬学科 5…

マテリアルズ・インフォマティクスにおける画像解析の活用ガイド

開催概要材料開発において、電子顕微鏡やX線トモグラフィーを用いて材料の微細構造を観察するために画…

世界初のPROTAC医薬、ついに承認 ―「タンパク質を阻害する」から「分解する」時代へ

2026年5月、創薬化学の歴史に残る大きな出来事が起きました。米国 FDA は、…

有機蛍光とは異なる新しい有機りん光の分子設計指針の発見

第707回のスポットライトリサーチは、電気通信大学 情報理工学研究科(牧昌次郎研究室)の林希久也 助…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP