[スポンサーリンク]

一般的な話題

AI分子生成の導入と基本手法の紹介

[スポンサーリンク]

本記事では、AIや情報技術を用いた分子生成技術の有機分子設計における有用性や代表的手法について解説します。BRICSやGBGAといったケモインフォマティクス分野で発展してきたルールベースのアプローチ、そして近年急速に進化を遂げている機械学習ベースのアプローチについて取り上げます。ルールベースの手法では、既存の知識や規則を活用して簡易かつ効果的に分子候補を生成します。一方、RNNやGPT、VAEといった深層学習・生成モデルを用いた学習ベースの手法では、大量のデータと機械学習モデルの力を活用することでより高度な分子設計を可能にします。それぞれの特徴を理解し、利用目的に応じた手法選定が重要です。

はじめに

有機EL材料や有機半導体材料の開発など、新規の有機分子設計が製品差別化の肝となる開発テーマは多数存在します。一般に有機分子の設計は、先行研究や理論、経験則に基づき、構造の決定、合成経路設計から実験評価に至るまで研究者の試行錯誤によって実施されます。この一連のプロセスには、多大な時間と労力が必要となります。

コンピュータ上で分子を仮想的に発生させる技術である分子生成は、このような試行錯誤の効率化や成果の最大化のために非常に重要なツールです。創薬分野を始めとして、分子生成技術の活用は徐々に広がりつつあり、分子生成によって有望な分子を発見できた事例は多く報告されています。

本記事では、このような分子生成を活用する利点と技術の概要についてご紹介します。また、別の記事にて実用上重要となる観点をご共有します。

AIによる分子生成の利点

情報技術を用いた分子生成手法を利用しない場合、実験や既存の知見に基づいて分子構造を設計するのが一般的です。このプロセスには時間やコストがかかることが多く、また有機分子の候補が多様であるために重要な構造群を見落とすリスクもあります。

もちろん、実験や既存の知見が重要であることには代わりありませんが、AI分子生成の利用によってより効率的で成果の高い分子設計を行うことが可能になります。具体的には以下の2つの利点が挙げられます。

  1. 網羅性・多様性 : より広く多様な構造を検討することが可能に
  2. 効率性 : より短い時間で多くの構造を検討することが可能に

有機分子の候補は膨大であり、人手による検討では漏れが発生する可能性があります。コンピュータにより機械的に分子を生成することでこのような漏れを減らし、より広範囲の構造を効率的に検討することができます。また、候補の膨大さから可能性のある構造をすべて検討することは不可能です。機械学習による自動的な選定により検討の効率が上がり、これまで扱うことができなかった膨大な化学空間を扱うことが可能となります。

分子生成技術の概要と分子設計への活用

本節では分子生成技術の概要とそれらを活用した分子設計の方法についてご説明します。改めて、分子生成とはコンピュータ上で分子を仮想的に発生させる技術の総称です。分子生成は、生成方法や分子の表現方法等によって図1のように分類することができます。

図1. 分子生成手法の分類

 

ルールベースの分子生成手法では、分子を生成するためのルールをこれまでの知見に基づいて設計し、そのルールに則り分子を生成します。一方、学習ベースの手法ではニューラルネットワーク等の機械学習モデルを用いて分子の生成方法をデータから学習し、学習されたモデルを活用して分子を生成します。学習ベースの手法には有機分子を文字列 (SMILESなど) で表現し言語モデルを用いてSMILESを生成させる文字列ベースの手法と、分子をグラフとして表現し、原子や分子フラグメント同士の接続を直接生成するグラフベースの手法に大別されます。

また、分子生成を用いて有望な分子を設計していくためには、目的物性 (最適化したい物性) や制約条件(構造やコスト、特許など)を用いて分子の探索範囲を絞り込む必要があります。この際、目的物性を実験などで測定することにはコストがかかるため、少数の実験済みデータから目的物性を予測する機械学習モデルを構築し、そのモデルの予測値を目的物性の値として代用することが一般的です。またベイズ最適化のように、単なるモデルの予測値ではなく「活用」と「探索」のバランスを考慮した獲得関数の値を用いて分子を選定する場合もあります。

ルールベースの分子生成手法

ルールベースの分子生成手法は古くから利用されており、中でもBRICS (Breaking of Retrosynthetically Interesting Chemical Substructures) は非常に有名です。

BRICSでは、分子群に対して分割規則と再結合規則を定義し、それらの規則に基づき分子を生成します。そして、生成された分子に対して物性値を評価 (あるいは機械学習モデルで予測) することで有望な分子を抽出します。この一連の流れを図2に示します。

図2. BRICSによる分子設計の流れ

 

BRICSは候補分子を大量に高速生成できる一方、見込みの低い構造も大量に生成されることや、組み合わせが膨大なためすべての候補を考慮できないなど欠点もあります。しかし、なにより仕組みがシンプルで使いやすいという利点があります。

次にもう少し発展的な手法としてGBGA (Graph-Based Genetic Algorithm) という手法を紹介します。GBGAはグラフとしての分子表現と遺伝的アルゴリズムを分子生成へ応用した手法です。2つの分子をランダムに組み替える「交叉」とそれにより得られた分子の一部をランダムに変更する「変異」という2つの操作を定義し、それらにより次の世代の分子を生成します。交叉の候補は物性値 (あるいはその予測値、より厳密には適応度) に基づいて選ばれるため、優秀な分子の構造が次の世代に残りやすく、世代を重ねるごとにより物性値の優れた分子が多く生成されるようになるという特徴があります。

 続きはこちら

本記事はMI-6株式会社から提供された記事を引用し作成しています。

Avatar photo

ケムステPR

投稿者の記事一覧

ケムステのPRアカウントです。募集記事や記事体広告関連の記事を投稿します。

関連記事

  1. ImageJがWebブラウザ上で利用可能に
  2. ダニエル レオノリ Daniele Leonori
  3. 特許の効力と侵害
  4. 第4回「YUGOKAFe」に参加しました!
  5. 18万匹のトコジラミ大行進 ~誘因フェロモンを求めて②~
  6. THE PHD MOVIE
  7. 光エネルギーによって二酸化炭素を変換する光触媒の開発
  8. 「ドイツ大学論」 ~近代大学の根本思想とは~

注目情報

ピックアップ記事

  1. 第10回日本化学連合シンポジウム 化学コミュニケーション賞2016 表彰式
  2. 【追悼企画】化学と生物で活躍できる化学者ーCarlos Barbas教授
  3. アカデミックの世界は理不尽か?
  4. 丸岡 啓二 Keiji Maruoka
  5. カチオン性三核Pd触媒でC–I結合選択的にカップリングする
  6. 触媒的不斉交差ピナコールカップリングの開発
  7. ヘリウム不足再び?
  8. 一流化学者たちの最初の一歩
  9. タミフル(オセルタミビル) tamiflu (oseltamivir)
  10. おまえら英語よりもタイピングやろうぜ ~初級編~

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年2月
 12
3456789
10111213141516
17181920212223
2425262728  

注目情報

最新記事

酸素は系内に入り込み続ける【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか3. 反応操作をし…

アンモニウム構造によりラジカル種の発生位置を完全に制御!

第710回のスポットライトリサーチは、関西学院大学理工学研究科 村上研究室の榊原 陽太(さかきばら …

化学つれづれ草【ある研究者の回想】

概要物理化学者で量子機能材料を専門とする著者によるエッセイ集.化学者としての研究,教育,人生…

第60回有機反応若手の会

開催概要有機反応若手の会は、有機化学分野で研究を行う全国の大学院生を中心とした若手研究者が集い、…

ノーベル賞受賞者と語り合う5日間!「第18回HOPEミーティング」参加者募集!

申し込みはこちら概要主催:独立行政法人 日本学術振興会(JSPS)開催地:神奈川…

光触媒による高効率なCO2還元の実現―まさかの光を弱く当てることが重要だった―

第709回のスポットライトリサーチは、東京科学大学 理学院(前田研究室)博士後期課程2年の仲田竜一 …

「π-πスタッキング」という言葉が生む誤解【芳香環の相互作用を見直す: 前編】

芳香環が平行に並んで近接しているとき、その構造を「π–π スタッキング」と表されることがよくあります…

一重項酸素によるC(sp2)−P結合切断を用いた長波長光によるリン化合物のアンケージング

第 708 回のスポットライトリサーチは、同志社女子大学 薬学部 医療薬学科 5…

マテリアルズ・インフォマティクスにおける画像解析の活用ガイド

開催概要材料開発において、電子顕微鏡やX線トモグラフィーを用いて材料の微細構造を観察するために画…

世界初のPROTAC医薬、ついに承認 ―「タンパク質を阻害する」から「分解する」時代へ

2026年5月、創薬化学の歴史に残る大きな出来事が起きました。米国 FDA は、…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP