[スポンサーリンク]

スポットライトリサーチ

マシンラーニングを用いて光スイッチング分子をデザイン!

[スポンサーリンク]

 

第657 回のスポットライトリサーチは、北海道大学 化学反応創成研究拠点 (ICReDD) の Said Byadi 博士にお願いしました!

Byadi さんの所属される Sidorov 研究室では、化学データの管理・解析手法や、分子・反応の特性を予測する QSPR モデルの開発に取り組んでいます。大量の計算・実験データに対応するため、特に自動化を視野に入れたツールの利用が重要であり、マシンラーニングを活用した触媒の反応性・選択性の予測やデータ解析のオートメーションに注力されています。

今回 Byadi さんらは、アゾベンゼン類に代表される光スイッチング分子に関し、その設計に重要な異性化の波長 (λmax) と異性体の安定性 (熱半減期 t1/2) のデータを機械学習モデルを用いて予測することに成功しました。本手法により、従来の量子化学計算を用いた予測から飛躍的に計算コストが減少し多くのデータを取り扱うことが可能になりました。

本研究成果は、ケモインフォマティクス系の有名誌 Journal of Cheminformatics にオープンアクセスで掲載されました。

Predictive modeling of visible-light azo-photoswitches’ properties using structural features

Said Byadi, P. K. Hashim & Pavel Sidorov 

それでは、インタビューをお楽しみください!
今回は英語と日本語の双方でお届けします!

Q1. 今回プレスリリースとなったのはどんな研究ですか?簡単にご説明ください。

Photoswitches are a class of compounds that reversibly change their conformation when irradiated by light. A widely known class of photoswitches are azo-dyes that can switch between cis and trans isomers when exposed to the visible light of a certain wavelength. Their practical application, for example, in materials or as light-activated drugs, requires the design of compounds where the isomerization can be controlled. To do so, we need to know the wavelength λmax of the light that induces the change and the stability of the isomerized form, usually quantified and thermal half-life t1/2. In most studies, this is achieved by quantum chemical calculations; however, as the number of available data and the size of the screening sets grow, these approaches become too costly.

In our research, we decided instead to build machine learning models using simple 2D representations of molecules – molecular graphs – to predict both properties. Machine learning approaches allow to learn how properties are related to the chemical structures of compounds, and graph representation provides a fast way to calculate molecular features that machine learning models would learn from.

光スイッチ分子は、光に照射されると可逆的に異性化する化合物の一種です。アゾ染料は可視光に照射されるとシス型とトランス型の異性体を切り替えることができる光スイッチとして広く知られています。この化合物を材料や光活性薬剤として利用するためには、異性化を制御できる分子の設計が必要です。そのためには、異性化を引き起こす光の波長 (λmax) と、異性体の安定性(熱半減期 t1/2)を予測する必要があります。従来研究では、量子化学計算がよく利用されていました。しかし、スクリーニングセットのサイズが大きくなっていき、利用可能なデータ数が増加していくので、量子化学計算はコストが上昇しています。

本研究では、分子グラフという 2 次元表現を用いて機械学習モデルを構築し、両方の特性を予測することにしました。機械学習は化合物の構造と特性がどのように関連しているかを学習することができます。グラフ表現は、機械学習に必要な分子の記述子を高速に計算することができるので、非常に便利です。

Q2. 本研究テーマについて、自分なりに工夫したところ、思い入れがあるところを教えてください。

There are two main novelties in this research: the data and the approach. First, we have collected the largest data set – over 800 azo-compounds – related to both λmax and t1/2 from the literature. Second, while most previous studies focus on quantum calculations, we employ simple 2D representation to extract structural features from the data and train the machine learning models. While it may be counter-intuitive to use 2D structures to model cis-trans isomerization, we demonstrate that 2D features are sufficient to reliably predict λmax. On the other hand, prediction of thermal half-life has proven to be a challenge. However, application of consensus modeling – using several different models at the same time – allows to improve the predictions in that case.

Another highlight of structural features we use here is the possibility for the model interpretation. Here, we use the ColorAtom methodology that assigns importance to every atom in a molecule, essentially “coloring” it to demonstrate whether it enhances or diminishes the predicted property. This can assist in the design of photoswitchable molecules by chemists. Such interpretation tools are especially exciting because they make the model’s “thinking” transparent and may even reveal some unexpected structure-property relationships.

本研究にはイノベーションが二つあります。第一に、我々はλmaxt1/2 の実験測定値が有するアゾ­光スイッチの最大のデータセット (800 点以上) を収集しました。第二に、従来研究が量子計算を利用することに対し、本研究には2次元表現から抽出した記述子を用いた機械学習モデルを構築しました。シス-トランス異性化を予測するのに2次元構造を用いるのは直感に反するかもしれませんが、λmaxの予測が高精度を達成したことを実証しました。一方、熱半減期の予測は困難でした。しかし、コンセンサス・モデリング (複数のモデルを同時に使用すること) を適用することで、この予測も改善することができました。

今回利用した構造記述子のもう一つのハイライトは、モデル解釈の可能性です。我々が用いる ColorAtom 手法では、分子内のすべての原子に重要性を割り当てて、予測された物性が向上するか低下するかによって色付けを行います。これは新たな光スイッチ分子の設計に役立ちます。このような解釈ツールは、モデルの「考え方」を明らかにし、さらには構造と物性の予想外な関係の発見につながり得るという点でも、特に面白いと思います。

Q3. 研究テーマの難しかったところはどこですか?またそれをどのように乗り越えましたか?

The prediction of the thermal half-life t1/2 of photoswitches has proven to be one of the toughest challenges in this study. The difficulties are mainly due to the lack of experimental data as we only have slightly over 100 annotated molecules compared to almost 800 for λmax. Moreover, the isomerization process is multifaceted and relies more on the 3D structures, which may be difficult to capture using solely 2D geometrical features. To tackle these issues, we implemented consensus modeling where we leverage the power of several models simultaneously to reduce prediction errors. We have managed to minimize the error in most outliers, but some unique structures were still challenging. This is why we are calling on the community to help create a systematic dataset that includes diverse molecular structures and key parameters such as solvents, which we believe will greatly benefit future modeling studies.

本研究の最も困難なところは光スイッチの熱半減期 t1/2 の予測でした。原因は主に実験データの不足だと言えます。λmaxのデータ数は 800 点に近いことに対し、t1/2 のデータ数は 150 に満たなかったのです。さらに、異性化は 3 次元構造に依存しているため、2 次元グラフの記述子しか利用していないモデルが十分ではない可能性があります。この問題を解決するために、複数のモデルを組み合わせているコンセンサス・モデルを実施しました。大部分の予測誤差を減らすことができましたが、いくつかのユニークな分子に関してはまだ困難でした。そのため、多様な分子構造や溶媒などの重要なパラメータを含む系統的なデータセットの作成に関して、協力を呼びかけたいです。

Q4. 将来は化学とどう関わっていきたいですか?

I am very interested in the research related to the design of new molecules through machine learning and AI. I would like to contribute to projects that connect computational tools and experimental chemistry, especially for drug discovery, smart materials, or photoresponsive systems like photoswitches. I also hope to help in making machine learning accessible and understandable for everyone.

機械学習や AI を利用した新たな分子の設計に関する研究に非常に興味があります。特に、創薬や、スマート材料や、光スイッチのような光応答性システムなど、計算と実験化学を結びつける研究に貢献したいと思っています。また、機械学習を誰にとっても身近で理解しやすいものにしたいと思っています。

Q5. 最後に、読者の皆さんにメッセージをお願いします!

We want to demonstrate to readers that machine learning models have the potential to be an extremely useful tool to predict important properties of molecules, such as absorption wavelength and half-life of photoswitches here, without costly quantum chemical calculations. We hope that this will encourage other researchers to explore these methods and to apply them in their own research.

However, we also want to emphasize the importance of data quality for machine learning. As we’ve shown in this work, lack of systematic and diverse data sets can lead to low prediction accuracy, and we encourage the collaboration between data scientists and chemistry communities in creation of such data. We also invite others to build upon this work by using the open data and the methodologies that we provide here.

我々は、コストのかかる量子化学計算しなくても、機械学習モデルを用いて光スイッチの吸収波長や半減期といった物性を予測することができることを示したいと考えています。研究者のみなさんがこの手法を探求し、自身の研究に応用することを期待しています。

しかし、機械学習におけるデータの質の重要性も強調したいです。本研究で示したように、体系的で多様なデータセットの欠如は予測の低精度を引き起こす可能性があり、質が良いデータの作成において情報科学者と実験化学者の協力を奨励しています。また、本研究におけるデータと手法を利用して、みなさんが自身の研究を発展できれば良いと思っています。

【研究者の略歴/Short CV】

Said BYADI

Hokkaido University, Institute for Chemical Reaction Design and Discovery (ICReDD), Sidorov group

Scientific interests: Machine learning and AI in drug design and discovery and reactivity modeling.

 

Byadi さん、インタビューにご協力いただき誠にありがとうございました!

それでは、次回のスポットライトリサーチもお楽しみに!

関連記事

機械学習による不⻫有機触媒の予測⼿法の開発 (スポットライトリサーチ)

関連書籍

化学のための Pythonによるデータ解析・機械学習入門 (改訂2版)

化学のための Pythonによるデータ解析・機械学習入門 (改訂2版)

金子弘昌
¥3,366(as of 05/22 22:30)
Release date: 2023/08/30
Amazon product information
機械学習による分子最適化: 数理と実装

機械学習による分子最適化: 数理と実装

梶野 洸
¥3,520(as of 05/22 01:54)
Amazon product information
Avatar photo

DAICHAN

投稿者の記事一覧

創薬化学者と薬局薬剤師の二足の草鞋を履きこなす、四年制薬学科の生き残り。
薬を「創る」と「使う」の双方からサイエンスに向き合っています。
しかし趣味は魏志倭人伝の解釈と北方民族の古代史という、あからさまな文系人間。
どこへ向かうかはfurther research is needed.

関連記事

  1. 有機合成化学協会誌2021年4月号:共有結合・ゲル化剤・Hove…
  2. アゾベンゼンは光る!~新たな発光材料として期待~
  3. 2011年イグノーベル賞決定!「わさび警報装置」
  4. スタニルリチウム調製の新手法
  5. アメリカ企業研究員の生活①:1日の仕事の流れ
  6. 作った分子もペコペコだけど作ったヤツもペコペコした話 –お椀型分…
  7. 【第11回Vシンポ特別企画】講師紹介③:大内 誠 先生
  8. 電子ノートか紙のノートか

注目情報

ピックアップ記事

  1. MEDCHEM NEWS 31-1号「低分子創薬」
  2. シュプリンガー・ジャパン:生化学会書籍展示ケムステ特典!
  3. 個性あるTOCその③
  4. アンモニアを室温以下で分解できる触媒について
  5. 「弱い相互作用」でC–H結合活性化を加速
  6. カプロラクタム (caprolactam)
  7. Elsevierのニッチな化学論文誌たち
  8. マシンラーニングを用いて光スイッチング分子をデザイン!
  9. 世界初の有機蓄光
  10. リングサイズで性質が変わる蛍光性芳香族ナノベルトの合成に成功

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年5月
 1234
567891011
12131415161718
19202122232425
262728293031  

注目情報

最新記事

第42回メディシナルケミストリーシンポジウム

テーマAI×創薬 無限能可能性!? ノーベル賞研究が拓く創薬の未来を探る…

山口 潤一郎 Junichiro Yamaguchi

山口潤一郎(やまぐちじゅんいちろう、1979年1月4日–)は日本の有機化学者である。早稲田大学教授 …

ナノグラフェンの高速水素化に成功!メカノケミカル法を用いた芳香環の水素化

第660回のスポットライトリサーチは、名古屋大学大学院理学研究科(有機化学研究室)博士後期課程3年の…

第32回光学活性化合物シンポジウム

第32回光学活性化合物シンポジウムのご案内光学活性化合物の合成および機能創出に関する研究で顕著な…

位置・立体選択的に糖を重水素化するフロー合成法を確立 ― Ru/C触媒カートリッジで150時間以上の連続運転を実証 ―

第 659回のスポットライトリサーチは、岐阜薬科大学大学院 アドバンストケミストリー…

【JAICI Science Dictionary Pro (JSD Pro)】CAS SciFinder®と一緒に活用したいサイエンス辞書サービス

ケムステ読者の皆様には、CAS が提供する科学情報検索ツール CAS SciFind…

有機合成化学協会誌2025年5月号:特集号 有機合成化学の力量を活かした構造有機化学のフロンティア

有機合成化学協会が発行する有機合成化学協会誌、2025年5月号がオンラインで公開されています!…

ジョセップ・コルネラ Josep Cornella

ジョセップ・コルネラ(Josep Cornella、1985年2月2日–)はスペイン出身の有機・無機…

電気化学と数理モデルを活用して、複雑な酵素反応の解析に成功

第658回のスポットライトリサーチは、京都大学大学院 農学研究科(生体機能化学研究室)修士2年の市川…

ティム ニューハウス Timothy R. Newhouse

ティモシー・ニューハウス(Timothy R. Newhouse、19xx年xx月x日–)はアメリカ…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP