[スポンサーリンク]

スポットライトリサーチ

機械学習用のデータがない?計算機上で集めませんか。データ駆動型インシリコ不斉触媒設計で有機合成DX

[スポンサーリンク]

第365回のスポットライトリサーチは、理化学研究所 環境資源科学研究センター (先進機能触媒研究グループ)客員研究員の山口滋 先生にお願いしました。

機械学習のモデルを構築するにはデータが必要ですが、解析用の実験データ自体の収集が難しい反応系も考えられます。モデル構築に必要な実験データの代わりに、計算で得られたデータに注目したのが今回ご紹介する成果で、遷移状態計算により計算機上で集めたわずか30個のサンプルからエナンチオ選択性が向上する不斉触媒設計に成功したという報告をされました。Bulletin of the Chemical Society of Japan誌 原著論文・プレスリリースに公開されています。

Molecular Field Analysis Using Computational-Screening Data in Asymmetric N-Heterocyclic Carbene-Copper Catalysis toward Data-Driven in Silico Catalyst Optimization
Mukai, M.; Nagao, K.; Yamaguchi, S.; Ohmiya, H., Bulletin of the Chemical Society of Japan, 2022, 95, 271–277. doi:10.1246/bcsj.20210349

それでは今回もインタビューをお楽しみください!

Q1. 今回プレスリリースとなったのはどんな研究ですか?簡単にご説明ください。

データ駆動型のインシリコ不斉触媒設計法の構築に成功しました。鍵となるのは分子場解析と呼ばれる手法です。不斉触媒反応における分子場解析とは、生成物のエナンチオ選択性と分子の3次元構造から計算した分子場との間の回帰分析です。分子場とは今回の場合、分子の3次元画像データ(ボクセルデータ)です。作成した回帰モデルの回帰係数から分子のどこに置換基を導入すればエナンチオ選択性が上がるあるいは下がるのかを可視化できます。しかし可視化した構造情報から選択性が向上する分子設計に成功した例はありませんでした。一方、触媒と基質からなるエナンチオ選択性決定段階の中間体を用いて分子場解析を行い、可視化した構造情報(下図水色の点)に重なるように置換基を導入することで、選択性が向上する分子設計が可能であることを2019年に見出しています[1](下図A)。

今回は、上記の中間体を用いた分子場解析の発展型として、30サンプルほどの遷移状態計算により算出したエナンチオ選択性の値と、対応する遷移状態構造とを用いて分子場解析を行いました(上図B)。抽出・可視化した情報をもとにエナンチオ選択性が向上する不斉配位子のインシリコでの設計に成功しました(実験値で最大73% eeを示す訓練データの解析をもとに96% eeを示す不斉配位子を設計)。金沢大学大宮研究室との共同研究で、解析対象はNHCカルベン銅錯体触媒によるシリルボロン酸エステルのアルデヒドへの不斉付加反応です[2]。形式上、データ解析に実験データを必要としない、データ駆動型インシリコ不斉触媒設計法となります。

Q2. 本研究テーマについて、自分なりに工夫したところ、思い入れがあるところを教えてください。

実は今回は、工夫はほとんどしていません。設計した触媒を合成してくれた向くんが一番大変だったのではないでしょうか。工夫が必要だったのは前回の中間体を使った分子場解析でした。私は有機合成・構造有機化学が専門ですが、2013年にバイオインフォマティクスの研究室で2回目の博士課程学生になり、有機合成と機械学習の融合研究をはじめました。この分野に入りたての人が陥りがちな以下2点の「思い込み」から脱却するのが大変でした。

  • 機械学習を用いた有機合成・分子触媒解析はまっさらな新しい分野である。
  • 機械学習により魔法のように簡単に活性があがる触媒が発見できる。

前者に関しては、論文を投稿しReviewerにボコボコにされていくうちに、今回ハイライトしていただいたような有機反応の回帰分析は結局Hammett則の拡張であり、しっかりとした歴史のある分野であるということ[3]と、なんとか向き合えるようになりました。

後者に関しては、そもそも回帰分析による活性(今回の場合はエナンチオ選択性)があがる触媒の予測は外挿にあたることが多く、本質的に難しい問題です。この分野に入って最初に不斉触媒反応の回帰分析にLASSOという機械学習手法を導入する研究[4]を行いましたが、その際にエナンチオ選択性があがる触媒の予測はいくらやってもできそうになく、その時点でようやく「機械学習では外挿は難しい」という当たり前の事実に向き合えるようになりました。

前後して2015年に理研にポスドクとして移り、自分で実験してデータを集めながら、データ解析・分子設計を行うようになりました。その際に、外挿が無理なら、合成が比較的簡単な基質側中心にスクリーニングを行いとにかく選択性をあげ、触媒と基質からなる中間体を用いた分子場解析を行うことを考えました。そうすれば触媒まわりに基質由来の選択性支配因子に関する情報を抽出・可視化でき、その情報をもとに高いエナンチオ選択性を示す触媒を設計できるのではないかというアイデアです。内挿の範囲内で分子設計につながる研究テーマです。

このアイデアに沿って研究を進めているうちに、触媒と基質からなるエナンチオ選択性決定段階の中間体を使って分子場解析を行えば、選択性支配因子に関する情報を解釈性の高い形で抽出・可視化でき、研究者の直感と組み合わせることで、外挿、つまり選択性が向上する分子設計が可能となることを見出しました[1](図A)(それまでの分子場解析のほとんどは触媒のみの構造を解析に使っていた)。データ解析には「予測」と「解釈」の2通りの目的があると考えています[3,5]が、本分子場解析の枠組みは反応の「解釈」のためのデータ解析に分類されます。上記成果を投稿中に、分子場解析を用いた高性能触媒の「予測」に関する論文がDenmarkらにより報告されました[6]。「予測」と「解釈」という点でアプローチが違ったためなんとかなりましたが生きた心地がしませんでした。その後もAngewangteでDOIつきのminor revisionになったもののそこから奇跡的にRejectされ最終的にBCSJに採択いただいた話など長くなるのではしょりますが思い入れだらけです。

今回の研究は、形式上インシリコで触媒設計ができるためいろいろな展開が考えられ重要であるものの、Q1で述べたように上記研究の発展型(選択性の実験値+中間体の解析を、計算値+遷移状態構造の解析に置き換えたもの)なので、やればできるだろうとは思っていました。ACSのJournalの査読で、この手法が将来的に不斉触媒設計のスタンダードになる、との高い評価を受けつつも他のReviewerに酷評されRejectされるなど苦労もありましたが、粘り強くご一緒いただいた向くん、長尾助教、大宮教授にはこの場を借りて厚く御礼申し上げます。

今回の成果ではなく選択性の実験値+中間体を用いた分子場解析ですが、有機合成の難題である複雑な触媒反応(立体分岐型不斉合成)を制御できることを東京大学金井先生との共同研究で見出していますのでこちらも宣伝させていただきます[7]。触媒設計の概要を動画としてSIにアップしてありますので、ぜひご覧ください[7c]。金井研究室、陳さん、三ツ沼助教の怒涛の基質スコープも圧巻です。Chemにもハイライトいただいています[8]

Q3. 研究テーマの難しかったところはどこですか?またそれをどのように乗り越えましたか?

合成可能な触媒を提案するところでしょうか。選択性があがりそうな触媒はある程度提案できるものの、めぼしいものは大宮研究室ですでに検討済みであり、現実的なタイムスケールで合成できる新規触媒を提案するのは簡単ではありませんでした(なんとか解析対象の反応系での新しい不斉配位子を設計でき選択性が上がりましたが)。有機合成化学者の経験知に基づく触媒反応開発はやはりそんなに簡単に置き換わるものではないのではという感想を抱くような結果でした。一方で本手法も使いようで、プレスリリースに書いたように、たとえば触媒が高価であったり合成が難しかったりで、従来型のスクリーニングや機械学習用の実験データの収集が難しい系には有用なのではないかと考えています。本手法をうまく使えば人と機械学習の協働を促し、これまで難しかった反応系が開発可能になるなど、有機化学という分野の探索可能範囲が大幅にひろがる、つまり研究のワクワクが大幅に増えるのではと期待しています。

Q4. 将来は化学とどう関わっていきたいですか?

化学を媒体に自分もまわりの人も幸せになるような仕事をしたいと考えています。この分子場解析の研究も、2012年時点で、これからプログラミング等インフォマティクスも勉強しながら有機合成研究を進めたい学生さんが増えていくだろうから、その受け皿となる研究をつくりたい、そういう学生さんとともにガッツリ研究がしたい、という思いではじめました。おかげさまで大宮先生との本共同研究含め、とても楽しい共同研究をさせていただける機会が多く大変ありがたく思っています。一方で、データサイエンスが流行っているためか共同研究のつもりが、いつのまにか技術供与になってしまうことが絶えませんでした。逆に言えば、それだけ皆が真似したいと思える、インフォマティクスをしたい有機合成化学者の受け皿となる研究を作り出せた、つまり目標を達成できたのであろうと前向きに考え、現在、手法の背景知識やノウハウをweb上に公開しはじめています[9]。昨年末までの理研の任期制非PI職では、自身の飯のタネである手法を公開してしまうと研究者としてご飯が食べられなくなる可能性が低くないので、職をさがした結果、ありがたいことに三井化学に採用していただき、これまでの経験をもとに研究を展開しています。さらに副業としてアカデミアで研究を行うこともOKいただいており、これまでも大変お世話になっている理研CSRS侯先生のグループ所属の客員研究員として恵まれた環境で新たなチャレンジができています。まだまだやりたいこと、やるべきと思うことは多々あります。環境や周りの方々が許す限り、化学のワクワクを増やせるような仕事にチャレンジしていきたいと思っています。

Q5. 最後に、読者の皆さんにメッセージをお願いします。

DXの時代です。がんがんチャレンジできるような環境・雰囲気を作っていきたいですね。

関連リンク

  1. (a) S. Yamaguchi, M. Sodeoka, Molecular Field Analysis Using Intermediates in Enantio-Determining Steps Can Extract Information for Data-Driven Molecular Design in Asymmetric Catalysis. Bull. Chem. Soc. Jpn. 2019, 92, 1701. DOI: 10.1246/bcsj.20190132 (b) 理化学研究所プレスリリース「触媒反応におけるデータ駆動型分子設計に成功」https://www.riken.jp/press/2019/20190913_4/index.html
  2. (a) K. Yabushita, A. Yuasa, K. Nagao, H. Ohmiya, Asymmetric Catalysis Using Aromatic Aldehydes as Chiral α-Alkoxyalkyl Anions. J. Am. Chem. Soc. 2019, 141, 113. DOI: 10.1021/jacs.8b11495 (b) 金沢大学プレスリリース「キラルな医薬品の合成に向けた新しい戦略」https://www.kanazawa-u.ac.jp/rd/63183
  3. 有機反応の回帰分析 https://mfa-catalysis.com/regression-organic-reaction/
  4. S. Yamaguchi, T. Nishimura, Y. Hibe, M. Nagai, H. Sato, I. Johnston, Regularized Regression Analysis of Digitized Molecular Structures in Organic Reactions for Quantification of Steric Effects. J. Comp. Chem. 2017, 38, 1825. DOI: 10.1002/jcc.24791
  5. T. Fujita, D. A. Winkler, Understanding the Roles of the “Two QSARs”. J. Chem. Inf. Model. 2016, 56, 269. DOI: 10.1021/acs.jcim.5b00229
  6. (a) A. F. Zahrt, J. J. Henle, B. T. Rose, Y. Wang, W. T. Darrow, S. E. Denmark, Prediction of Higher-selectivity Catalysts by Computer-driven Workflow and Machine Learning. Science 2019, 363, eaau5631. DOI: 1126/science.aau5631 (b) 高選択的な不斉触媒系を機械学習で予測するhttps://www.chem-station.com/blog/2019/09/machinelearning.html
  7. (a) H. Chen, S. Yamaguchi, Y. Morita, H. Nakao, X. Zhai, Y. Shimizu, H. Mitsunuma, M. Kanai, Data-driven catalyst optimization for stereodivergent asymmetric synthesis by iridium/boron hybrid catalysis. Cell Reports Physical Science 2021, 2, 100679. DOI: 10.1016/j.xcrp.2021.100679 (b) 東京大学プレスリリース「有機合成の難題である複雑な反応の機械学習・データ駆動型触媒設計による制御」https://www.u-tokyo.ac.jp/focus/ja/press/z0111_00045.html (c) https://www.sciencedirect.com/science/article/pii/S2666386421004045?via%3Dihub#mmc7
  8. T. Rodrigues, Deriving intuition in catalyst design with machine learning. Chem 2022, 8, 15. DOI: 10.1016/j.chempr.2021.12.006
  9. 分子場解析入門 https://mfa-catalysis.com

研究者の略歴

名前:山口滋やまぐちしげる
所属:三井化学株式会社 生産技術研究所(理化学研究所環境資源科学研究センター兼務)
研究テーマ:分子場解析に基づくデータ駆動型触媒設計法の構築と応用
略歴:https://researchmap.jp/s-yamaguchi

hoda

投稿者の記事一覧

大学院生です。ケモインフォマティクス→触媒

関連記事

  1. 「世界最小の元素周期表」が登場!?
  2. 動画:知られざる元素の驚きの性質
  3. 糸状菌から新たなフラボノイド生合成システムを発見
  4. 第43回ケムステVシンポ「光化学最前線2024」を開催します!
  5. 【7/21 23:59〆切】研究費総額100万円!「AI × ◯…
  6. SNSコンテスト企画『集まれ、みんなのラボのDIY!』
  7. ケムステも出ます!サイエンスアゴラ2013
  8. 計算化学:汎関数って何?

注目情報

ピックアップ記事

  1. 有機化合物のスペクトルによる同定法―MS,IR,NMRの併用 (第7版)
  2. Dead Endを回避せよ!「全合成・極限からの一手」③(解答編)
  3. 硫黄配位子に安定化されたカルボンの合成
  4. ダニエル・ノセラ Daniel G. Nocera
  5. 結合をアリーヴェデルチ! Agarozizanol Bの全合成
  6. TED.comで世界最高の英語プレゼンを学ぶ
  7. クラプコ脱炭酸 Krapcho Decarboxylation
  8. 100兆分の1秒を観察 夢の光・XFEL施設公開
  9. 化学企業のグローバル・トップ50が発表【2023年版】
  10. NIMSフォーラム 「未来のエネルギーをつむぐ新材料・新物質、ここに集結!」

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2022年2月
 123456
78910111213
14151617181920
21222324252627
28  

注目情報

最新記事

ラングミュアの吸着等温式 Langmuir equation

ラングミュアの吸着等温式 (Langmuir equation) は、等価な吸着サイトが独立に振舞い…

【化学・食品業界向け】 蒸留による分離・濃縮をシンプルで省エネに ~無機分離膜が起こすイノベーション~

■概要ものづくりにおいて重要な分離操作。有機溶剤の混合物の分離リサイクル。水の分離(脱水…

濃硫酸の1000倍強い超酸の中でも蛍光を保ち続ける”超酸耐性BODIPY”

第705回のスポットライトリサーチは、北海道大学大学院総合化学院(反応有機化学研究室)博士後期課程2…

安田修祥・裕美子 若手化学者留学支援事業

大学院生時代の経験として、海外留学は本当に素晴らしいものです。かくいう私も、1か…

有機合成化学協会誌2026年5月号:特集号 有機合成化学の力で切り拓く次世代モダリティの地平

有機合成化学協会が発行する有機合成化学協会誌、2026年5月号がオンラインで公開されています。…

チームディレクター募集(理化学研究所研究室主宰者、無期雇用職)

募集研究室理化学研究所 環境資源科学研究センター募集の概要国立研究開発法人理化学研究所で…

<製品サンプル進呈>細胞増殖/毒性測定 はじめてを応援キャンペーン【同仁化学研究所】

Cell Counting Kit-8(CCK-8)は同仁化学研究所で開発され、世界中で細胞増殖や細…

ポンコツ博士の国内奮闘録 ~博士、教員として過ごしてはや2年~

本稿は,少子化の影響が著しい地方私立大で学位を取得したとあるしがない博士(薬学)が、厳しい世の中を生…

2026年、過去最大規模の「有機溶媒危機」が始まった?

2026 年 2 月 28 日、アメリカとイスラエルがイランに対し軍事攻撃作戦を…

蒸留操作で水はどう動くのか【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか3. 反応操作をし…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP