[スポンサーリンク]

スポットライトリサーチ

機械学習と計算化学を融合したデータ駆動的な反応選択性の解明

[スポンサーリンク]

第612回のスポットライトリサーチは、横浜国立大学 大学院理工学府(五東研究室)博士課程後期1年の坂口大門 さんにお願いしました。

今回ご紹介するのは、反応の立体選択性を予測する機械学習モデル開発に関する成果です。本手法を用いて323反応の解析を行ったところ高い精度の定量的な予測を達成し、また構築されたモデルの定量性から反応条件による選択性の違いを解明されています。

本成果はJ. Chem. Inf. Model.誌 原著論文プレスリリースに公開されています。

Using Three-Dimensional Information to Predict and Interpret the Facial Selectivities of Nucleophilic Additions to Cyclic Ketones
Sakaguchi, D.; Gotoh, H. J. Chem. Inf. Model. 2024, 64, 3213–3221. DOI: 10.1021/acs.jcim.4c00101

研究室を主宰されている五東弘昭 准教授から、坂口さんについて以下のコメントを頂いています。それでは今回もインタビューをお楽しみください!

坂口くんが2021年4月に卒業研究生として配属されてから博士課程前期課程までに行った研究が、成果としてまとまったものです。機械学習などにより色々な化学的なことが予想されるようになっておりますが、この研究では、あまり報告例が無い身近なジアステレオ選択的な求核付加反応をテーマにしたものです。

このテーマは、最初は坂口くんの希望もあって研究目的だけを与え、具体的な研究計画や手法は坂口君の考案に委ねていましたが研究の初期段階では苦労が絶えませんでした。ケトンのNaBH4やPhLiなどによるジアステレオ選択的な還元や付加は、多くの有機化学系の研究室で行われる一般的なことだと思いますが、機械学習で予測するには非常に難しいものでした。それでも、辛抱強く検討を重ねて初期の予測を凌駕する驚くような研究成果に繋げてくれました。

また、坂口くんは、最近ではQSSR(定量的構造選択性相関研究)チームのリーダーとして後輩の指導を適切な距離感で親身に行なってくれており、グループにおいて欠かすことのできない人物になっています。今回の研究は、坂口君のファーストオーサーのデビュー作ですが、QSSRに関する研究を他にも色々と検討しております。博士後期課程に進学しても持ち前の能力を発揮して、飛躍した研究を引き続き行ってくれることを期待しております。

Q1. 今回プレスリリースとなったのはどんな研究ですか?簡単にご説明ください。

機械学習を用いた反応選択性の定量解明」を行いました。反応選択性の制御は原料化合物を無駄なく反応させる上で重要であり、精密な制御が求められています。一方でフラスコの内で起きている反応はまだまだブラックボックスな部分が多く、理論計算 (ex. 遷移状態計算) による選択性の定量解明 (活性化エネルギー差ΔΔG ≈ 数kcal/mol) はあまり進んでいません。そこで着目したのが、機械学習を用いたデータ駆動的な手法を用いた選択性の解明です。私は、反応の本質情報である立体電子状態と、反応選択性ΔΔGの定量的な関係を機械学習により経験的に解明することで、香料や医薬品の合成等に用いられる環状ケトンの求核反応の面選択性の予測に成功しました。本研究により、環状ケトンの求核反応の面選択性は求核剤の大きさとハード性によって決まるということが分かりました (図1)。

図1 予測した反応選択性の例。(A),(B): 2-methylcyclopentanoneに対する求核反応は、小さな求核剤であるMeMgIを用いるとややsyn選択的だが、大きな求核剤であるPhMgIを用いると2位のmethyl基との立体障害を避けるようにanti選択的になる。(C),(D): 4-tert-butylcyclohexanoneに対する求核反応は、ソフトな求核剤であるNaBH4を用いると軌道因子的に有利なaxial選択的だが、ハードな求核剤であるMeLiを用いると立体因子有利なequatorial選択的になる。

Q2. 本研究テーマについて、自分なりに工夫したところ、思い入れがあるところを教えてください。

まず、図の作成にはかなりこだわりました。本研究では3次元の電子状態を解析しているので、2次元の紙面上に分かりやすく表示するのはかなり難しかったです。透かしや網目を駆使することで伝わりやすくなったと思います(論文のFigure 4, Figure. 7は是非見ていただきたいです)。

あとは、反応選択性の予測だけで完結とならないよう、実験化学者の方にも理解してもらえるような見せ方を工夫しました。具体的には、本手法を基にしたウェブアプリケーションを作成・公開しており、学会等では好評を得ています (図2)。まだまだ勉強中ですが、実験化学で求められていることを理解し、私の解析モデルを通じて世界中の実験化学者の方と繋がりたいと思っています。

図 2 公開中のウェブアプリケーション。改良中ですが、Gaussianなどで得られる計算ファイル(Gaussian cube file)をアップロードすると実際に計算ができます。

Q3. 研究テーマの難しかったところはどこですか?またそれをどのように乗り越えましたか?

「機械学習はデータ収集が8割」といわれる通り、データ収集です。当初、化学データベース (Scifinder) からデータ収集の自動化を試みましたが、表記ゆれや情報の欠落が多く実用が難しかったため、構造情報や選択性といったデータは手入力で集めることにしました。いくつかの総説はデータ収集に役立ちましたが、誤植や重要情報の欠落も見られ、オリジナルの論文を自分の目で確かめることの重要性を強く感じました。結果的には論文を読み込んだおかげで、数値では現れない定性的な文書情報が問題解決の糸口に繋がった所もあった点は良かったかと思います。

Q4. 将来は化学とどう関わっていきたいですか?

データサイエンスと計算化学を用いて、化学の本質を解明していく化学者を目指しています。学術分野・産業分野ともに、化学のデジタル化が進んできていると感じます。これから20年、30年後の化学では、機械学習やAI技術がさらに発展していることでしょう。今後、必要になるであろう実験化学と計算化学を両方分かっている化学者になりたいと考えています。

Q5. 最後に、読者の皆さんにメッセージをお願いします。

私の所属する五東研究室の研究テーマは計算 (自然言語処理や分子生成モデル) から実験 (抗酸化能測定やフェノールのカップリング) まで多岐にわたり、それぞれの専門分野を持った学生から刺激を受けています。私の学部時代の印象に残っている講義で、研究は特定のテーマを究めること以上に、視野を広くすることも重要だと学びました。自分の専門分野を究める以上に、視野を広げていくことが重要だと思います。まだまだ研究者としては未熟ですが、研究室選びで悩んでいる学生の方に研究の捉え方の一意見としてとらえてもらえれば幸いです。

最後に、研究の遂行から論文執筆までをあらゆる面からご指導いただいた五東先生、研究紹介を行う機会を設けていただいた Chem-Station スタッフの皆様に深く感謝いたします。

研究者の略歴

名前:坂口 大門さかぐち だいもん
所属:横浜国立大学理工学府 博士課程後期 1年
略歴:
2024年 3月 横浜国立大学 理工学府 化学・生命系理工学専攻 博士課程前期卒業
2024年 4月 横浜国立大学 理工学府 化学・生命系理工学専攻 博士課程後期入学
2024年 4月 横浜国立大学 理工学府  非常勤講師 (データサイエンス実践基礎)

関連リンク

  1. Sakaguchi, D.; Gotoh, H. Using Three-Dimensional Information to Predict and Interpret the Facial Selectivities of Nucleophilic Additions to Cyclic Ketones. J. Chem. Inf. Model. 2024, 64, 3213–3221. DOI: 10.1021/acs.jcim.4c00101
  2. Matsumoto, Y.; Gotoh, H. Compound Classification and Consideration of Correlation with Chemical Descriptors from Articles on Antioxidant Capacity Using Natural Language Processing. J. Chem. Inf. Model. 2024, 64, 119–127. DOI: 10.1021/acs.jcim.3c01826
  3. 研究室ホームページ

hoda

投稿者の記事一覧

大学院生です。ケモインフォマティクス→触媒

関連記事

  1. 研究室でDIY!~エバポ用真空制御装置をつくろう~ ④
  2. 【ケムステSlackに訊いてみた⑤】再現性が取れなくなった!どう…
  3. MEDCHEM NEWSと提携しました
  4. テクノシグマのミニオイルバス MOB-200 を試してみた
  5. 世界初のジアゾフリーキラル銀カルベン発生法の開発と活性化されてい…
  6. 研究者のためのマテリアルズインフォティクス入門コンテンツ3選【無…
  7. 化学研究ライフハック:Twitter活用のためのテクニック
  8. ポンコツ博士の海外奮闘録XVIII ~博士,WBCを観る~

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. ヨウ化サマリウム(II) Samarium(II) Iodide SmI2
  2. NMRの基礎知識【原理編】
  3. BO triple bond
  4. η6配位アルキルベンゼンで全炭素(3+2)環化付加
  5. Arena/エーザイ 抗肥満薬ロルカセリンがFDA承認取得
  6. トムソン・ロイターのIP & Science事業売却へ
  7. なぜあなたは論文が書けないのか
  8. ChemDrawからSciFinderを直接検索!?
  9. 光触媒による水素生成効率が3%に
  10. 世界最高速度でCO₂からマルチカーボン化合物を合成~電気エネルギーを用いたCO₂の還元資源化~

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2024年5月
 12345
6789101112
13141516171819
20212223242526
2728293031  

注目情報

最新記事

【酵素模倣】酸素ガスを用いた MOF 内での高スピン鉄(IV)オキソの発生

Long らは酸素分子を酸化剤に用いて酵素を模倣した反応活性種を金属-有機構造体中に発生させ、C-H…

【書評】奇跡の薬 16 の物語 ペニシリンからリアップ、バイアグラ、新型コロナワクチンまで

ペニシリンはたまたま混入したアオカビから発見された──だけではない.薬の…

MEDCHEM NEWS 33-2 号「2022年度医薬化学部会賞」

日本薬学会 医薬化学部会の部会誌 MEDCHEM NEWS より、新たにオープン…

マテリアルズ・インフォマティクスにおける分子生成の基礎と応用

開催日:2024/05/22 申込みはこちら■開催概要「分子生成」という技術は様々な問題…

AlphaFold3の登場!!再びブレイクスルーとなりうるのか~実際にβ版を使用してみた~

2021年にタンパク質の立体構造予測ツールであるAlphaFold2 (AF2) が登場し、様々な分…

【5月開催】 【第二期 マツモトファインケミカル技術セミナー開催】 有機金属化合物 オルガチックスによる「密着性向上効果の発現(プライマー)」

■セミナー概要当社ではチタン、ジルコニウム、アルミニウム、ケイ素等の有機金属化合物を“オルガチッ…

マテリアルズ・インフォマティクスにおける回帰手法の基礎

開催日:2024/05/15 申込みはこちら■開催概要マテリアルズ・インフォマティクスを…

分子は基板表面で「寝返り」をうつ!「一時停止」蒸着法で自発分極の制御自在

第613回のスポットライトリサーチは、千葉大学 石井久夫研究室の大原 正裕(おおはら まさひろ)さん…

GoodNotesに化学構造が書きやすいノートが新登場!その使用感はいかに?

みなさんは現在どのようなもので授業ノートを取っていますでしょうか。私が学生だったときには電子…

化学者のためのWordマクロ -Supporting Informationの作成作業効率化-

「化合物データの帰属チェックリスト、見やすいんですが、もっと使いやすくならないですか」ある日、ラ…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP