[スポンサーリンク]

一般的な話題

話題のAlphaFold2を使ってみた

[スポンサーリンク]

 

ここ数日、構造生物学界隈で「AlphaFold2」と呼ばれているタンパク質の構造計算ツールが話題です。
2021年7月16日にGitHubで無償公開されたこの人工知能プログラムは、有志によってGoogle Colab上で動かせる簡易版も作られており、構造生物学者や生物物理学者だけでなく、生物学、薬学、化学、計算科学などに関わる幅広い領域の研究者から注目を集めています。

タンパク質はその構造と機能に密接な関係があり、通常、特定の構造をとることではじめて機能を持つことが出来ます。そのため、タンパク質の機能のメカニズムを調べたり、人工的な機能の改変や制御をしたり、あるいはアミノ酸配列のみがわかっているタンパク質の機能を推定したりするためには、タンパク質の構造情報は欠かせないものです。しかし、実験的にタンパク質の構造を確かめる手法である結晶構造解析・NMR構造解析・クライオ電子顕微鏡を用いた解析などは、年単位での時間や多額の経費がかかったり、実験に必要なタンパク質量が多かったり、高い精製度が必要であったりすることから、誰でもが気軽に行えるものではありません。

「ゲノムシーケンスデータから塩基配列だけがわかっているタンパク質について、アミノ酸の一次配列からタンパク質の構造と機能を推定したい」
「タンパク質の結晶構造を決めるために結晶を作って回折像を得たものの、位相が決定できずに途中で解析がお蔵入りしてしまっている。計算した予測構造を活用して構造解析をやり遂げたい」
「タンパク質同士がどんな複合体を形成するかのシミュレーションをやりたい」
こういった要望を持つ研究者が、今、続々とAlphaFold2を試しています。

Alphafold2の論文: https://www.nature.com/articles/s41586-021-03819-2

Alphafold2の論文(その2):  https://www.nature.com/articles/s41586-021-03828-1

 

 

Twitterでの熱狂

AlphaFold2の公開直後から、構造生物学に関係する研究者の有志によって、実際にAlphaFold2(簡易版を含む)を用いて解析した構造がTwitterに投稿され出しました。複数の研究者が様々な報告をアップしその精度の高さが示されていくにつれ、情報は拡散され、興味を持つ人が爆増。Twitter上では音声チャット機能である「スペース」を用いた座談会(という名の、もはや事実上の研究会)がこれらの有志研究者によって開催され、最終的に700人以上が参加・聴講するという(おそらくは)歴史に残る状況となりました。

座談会のTogetter: https://togetter.com/li/1748214

 

 

AlphaFold2を使ってみた

こんなにホットなのならば、是非AlphaFold2を体験してみたい。

計算科学どころかそもそもパソコンが苦手な筆者ですが、簡易版のほうならばブラウザにアミノ酸配列を入力するだけで使えるとのことで、早速やってみることにしました!

 

1. タンパク質のアミノ酸配列をゲットする
とりあえずまずアミノ酸配列を準備する必要があります。
初めての練習Runということで、Protein Data Bank(以下PDB)のWebサイトからGreen Fluorescent Protein(以下GFP)のアミノ酸配列をとってきて使うことにしました。
今回使用したのはPDB ID: 1EMAの情報です。

 

(1) PDBのWebサイト(https://www.rcsb.org/)に行き、右上にPDB IDを入力する。 (PDB IDが不明の場合はタンパク質の名称を英語で入力し、表示された一覧の中から1つを選択する)

(2) タンパク質データの個別ページにて、Display Filesをクリックし、さらにFASTA Sequenceをクリックする

(3) 表示されたアミノ酸配列データをコピー

 

 

2. AlphaFold2簡易版で構造計算してみる

いよいよgoogle colab上で動かせるAlphaFold2簡易版にタンパク質配列を入力し、構造計算を試してみます。

 

(1) AlphaFold2簡易版のページを開く

(2) query_sequenceの欄にタンパク質のアミノ酸配列をペーストする。その下のjobname欄も入力する

(3) 上のほうにある「ランタイム」タブをクリックする

(4) 「ランタイムのタイプを変更」をクリックし、GPUを選んで保存

(5) 「すべてのセルを実行」をクリック

これで計算が走ります!

 

ちなみに筆者が使っているメモリ4GBのレトロなノートパソコンでは、GFP1分子を計算するのに約15分ほどかかりました。

メモリ8GBやメモリ16GBのノートパソコンならば、このくらいの大きさのタンパク質を10分未満〜数分で計算できそうです。

AlphaFold2簡易版での計算はGoogleの計算環境で行われるため、個人が使用するPCのスペックは計算速度とは関係ないそうです。

 

計算終了して吐き出された構造はこちら。

 

おおお、GFPっぽいのが出てきた!

 

計算構造はブラウザに表示されるだけでなくpdbファイルとしても自動で出力されるので、得られた結果をPyMOLなどの表示プログラムでも扱うことができます。

結晶構造(水色)とAlphaFold2計算構造(桃色)をPyMOLで重ね合わせ表示したらこんな感じでした。

AIということでデータベース上に既にある立体構造に引っ張られるのはあると思われますが、とても似た構造!

 

 

ただし、AlphaFold2計算構造では、天然では自発的化学反応によって形成される発色団の構造はできておらず、通常のアミノ酸の形のままでした。

この事象はTwitterで報告している方がいらっしゃり、複数のGFP様タンパク質で見られるそうです。

いつか、立体構造をとる過程やとった後の化学反応まで含めて構造予測可能なAIが出てきたりするのだろうか。

 

 

複合体の構造予測もできちゃう

先述したAlphaFold2座談会の開催者でもあるYoshitaka Moriwaki氏は、7月19日にTwitterで「2つのタンパク質のアミノ酸配列を(ポリGなどの)長いリンカーでつないでAlphaFold2にかけると、複合体の構造予測ができる」との旨を提案。反響が大きかったためか、単分子計算する「Alphafold2簡易版」に加え、2つのアミノ酸配列を入力できる「Alphafold2 複合体版」ともいうべきページがどうやら7月21日(?)にアップされました。複合体版の使い方は簡易版と同様です。

 

試しに先程のGFPの配列を途中で切断し、2つに分けて複合体版のAlphaFold2に入れ、計算をかけてみました。

 

吐き出された構造はこちら。

 

2本のアミノ酸として表示されているし、それらしい形が出てきました。

これは、色々なタンパク質の配列データを使って、色んな組み合わせで、どんな複合体ができるか…研究の汎用ツールになっていくのではないでしょうか。

 

なお、Moriwaki氏はAlphafold2簡易版の使い方および通常版のインストールも含めた使用方法をWebにアップされておりますので、より詳しく知りたい方はこちらのページを参照されると良いと思います。

通常版AlphaFold2は3TB程度の大容量PCが必要とのことですのでご注意ください。

 

データベース誕生!?

Alphafold2で計算したヒトやモデル生物のタンパク質構造のデータベースが登場したようです。生物学の革命と言って過言ではないでしょう。

関連記事

2024年ノーベル化学賞は、「タンパク質の計算による設計・構造予測」へ
AlphaFold3の登場!!再びブレイクスルーとなりうるのか~実際にβ版を使用してみた~

関連書籍

 

=====================================================

※AlphaFold2簡易版での計算速度に関する記載に誤りがあり、2021年7月24日に加筆修正を実施しました。また同時に記事中の一部表記について微修正を行いました。

 

Avatar photo

Shirataki

投稿者の記事一覧

目には見えない生き物の仕組みに惹かれ、生体分子の魅力を探っていこうとしています。ポスドクや科学館スタッフ、大学発ベンチャー研究員などを経て放浪中。

関連記事

  1. 金と炭素がつくりだす新たな動的共有結合性を利用した新たな炭素ナノ…
  2. 日本化学会 第104春季年会 付設展示会ケムステキャンペーン P…
  3. リンダウ会議に行ってきた①
  4. 2-プロパノールに潜む過酸化物生成の危険
  5. メチレン炭素での触媒的不斉C(sp3)-H活性化反応
  6. 分子は基板表面で「寝返り」をうつ!「一時停止」蒸着法で自発分極の…
  7. 第6回ICReDD国際シンポジウム開催のお知らせ
  8. 第十二回ケムステVシンポ「水・有機材料・無機材料の最先端相転移現…

注目情報

ピックアップ記事

  1. 炭素をつなげる王道反応:アルドール反応 (5/最終回)
  2. リアルタイムで分子の自己組織化を観察・操作することに成功
  3. どっちをつかう?:cooperateとcollaborate
  4. 天然にある中間体から多様な医薬候補を創り出す
  5. ヒト胚研究、ついに未知領域へ
  6. 材料・製品開発組織における科学的考察の風土のつくりかた ー マテリアルズ・インフォマティクスを活用し最大限の成果を得るための筋の良いテーマとは ー
  7. パーキン反応 Perkin Reaction
  8. コーラから発がん物質?
  9. 蛍光異方性 Fluorescence Anisotropy
  10. 電子実験ノートSignals Notebookを紹介します ①

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年7月
 1234
567891011
12131415161718
19202122232425
262728293031  

注目情報

最新記事

わざと失敗する実験【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか3.反応操作をしな…

CIPイノベーション共創プログラム「有機電解合成の今:最新技術動向と化学品製造への応用の可能性」

日本化学会第106春季年会(2026)で開催されるシンポジウムの一つに、CIPセッション「有機電解合…

CIPイノベーション共創プログラム「世界を変えるバイオベンチャーの新たな戦略」

日本化学会第106春季年会(2026)で開催されるシンポジウムの一つに、CIPセッション「世界を変え…

年会特別企画「XAFSと化学:錯体, 触媒からリュウグウまで –放射光ことはじめ」

放射光施設を利用したX線吸収分光法(XAFS)は、物質の電子状態や局所構造を元素選択的に明らかにでき…

超公聴会 2026 で発表します!!【YouTube 配信】

超公聴会は、今年度博士号を取得する大学院生が公聴会の内容を持ち寄ってオンライン上で発表する会です。主…

日本化学会 第104春季年会 付設展示会ケムステキャンペーン Part II (3/16 追記)

さて、Part Iに引き続きPart II!年会をさらに盛り上げる企画として、2011年より…

凍結乾燥の常識を覆す!マイクロ波導入による乾燥時間短縮と効率化

「凍結乾燥は時間がかかるもの」と諦めていませんか?医薬品や食品、新素材開発において、品質を維…

日本化学会 第104春季年会 付設展示会ケムステキャンペーン Part I (3/16追記)

まだ寒い日が続いておりますが、あっという間に3月になりました。今年も日本化学会春季年会の季節です。…

アムホテリシンBのはなし 70年前に開発された奇跡の抗真菌薬

Tshozoです。以前から自身の体調不良を記事にしているのですが、昨今流行りのAIには産み出せな…

反応操作をしなくても、化合物は変化する【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか温度を測ること…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP