[スポンサーリンク]

ケムステニュース

最少の実験回数で高い予測精度を与える汎用的AI技術を開発 ~材料開発のDX:NIMS、旭化成、三菱ケミカル、三井化学、住友化学の水平連携で実現~

[スポンサーリンク]

国立研究開発法人物質・材料研究機構(NIMS)、旭化成株式会社、三菱ケミカル株式会社、三井化学株式会社、住友化学株式会社は、化学マテリアルズオープンプラットフォーム(化学MOP)からなる水平連携において、強度や脆さといった材料物性を機械学習で予測する際に、材料の構造から得られる情報を有効に活用し、少ない実験回数で、予測値と実値の誤差を小さくできる(予測精度の高い)AI技術を開発しました。高分子材料をはじめとした材料開発の強力なツールになると期待されます。 (引用:10月25日住友化学プレスリリース)

今回紹介するのは、NIMSと化学メーカー4社が共同で発表した機械学習に関する論文です。

まず研究の背景ですが、マテリアルサイエンスにおいて機械学習を活用して様々な成果が報告されており、物性予測において機械学習の回帰モデルは強力なツールとなっています。機械学習の予測を使ってうまく調査するには、高い正確性を持つ回帰モデルを構築することが重要で、それには一般的に回帰モデルを構築する際の学習データの量に依存します。しかしながら、学習データの量は時間とコストに比例するため、できるだけ少ない学習データで高い正確性を持つモデルを構築することが課題となっています。

モデルの正確性を調べるには、予測精度を向上させる特徴量を探す特徴選択がありますが、本研究ではデータポイントを学習データに加えて予測精度を向上させる能動学習、特に実測データがない候補から選択する不確実性サンプリングに着目しました。不確実性サンプリングは能動学習において有用で、最も不確実なデータポイントが選択されることで予測精度を向上させることができます。しかしながら、マテリアルサイエンスにおいては不確実性サンプリングは常に可能ではなく、実験前に予測可能な特徴量(分子量や分子構造の情報)が限られていると、予測不可能な特徴量(XRDパターンやDSC)が不確実性サンプリングにおいて選択されてしまいます。予測不可能な特徴量は実際に実験してみてわかるものであり、予測のための情報も予測したい情報も実験が必要となるのでは予測モデルとしては成り立ちません。しかし、予測不可能な特徴量の種類は種々の測定で増え、調べたい物性値とより関連性が高くなることが多くの事例において見られます。つまり、予測不可能な特徴量が予測モデルの正確性を向上させることができるのならば、測定が難しい物性値を測定が簡単な物性値から予測することになり、例えばXRD やDSC 等のデータを用いてなるべく少ない実験回数で、正確に材料物性が予測できるように、合成すべき材料として設定できる記述子を適切に選定する方法の開発を行いました。

本研究で目指した予測モデル(出典:住友化学プレスリリース

開発した手法の有効性を検証するために、15 種類のポリプロピレンについて、各々5つの異なるプロセス加工により得られた合計75 点を対象材料としました。対象とする物性評価は、シャルピー衝撃試験引張弾性率の機械物性で実験までに設定できる記述子としては、分子量、立体規則性、および射出成型冷却温度としました。また、測定によって得られる記述子としては、DSCとXRD、NMR、偏光顕微鏡観察による表面形状、比重を対象としました。

では実験結果に移ります。本研究では、予め機械特性と相関がある予測不可能な記述子をピアソンの相関係数が高い順に10個選択しておき、1-5番目と6-10番目に加えて予測可能な記述子に対して75点すべてを学習データとして使って回帰モデルを作り、一個抜き交差検証で予測と実測値を比較しました。結果、予め選んだ関連性が高い予測不可能な記述子の中では、1-5番目の方が6-10番目よりもどちらの物性値においても高い正確性を持つことが分かりました。シャルピー衝撃試験においては、予測可能な記述子を使ったほうが正確性は高くなりましたが、引張弾性率は1-5番目の予測不可能な記述子の方が正確性は高くなりました。

(a)シャルピー衝撃試験と(b)引張弾性率の実測と予測値の違いを表すプロット図、モデルによるLOOE(leave-one-out error)と決定係数R2の違い(出典:原著論文

次に本題のサンプル作製回数ごとにモデルを改良し正確性を上げていく検討ですが、まず開発方法について見ていきます。最初に予測可能な記述子でのみデータセットを準備しました。次にモデルに使用する記述子が選択されたら予測不可能な記述子とターゲットの物性値を実際に測定しました。さらに予測不可能な記述子からターゲットの物性値を予測するように学習を行います。そしてこの機械学習の予測精度が高くなると期待される試料の作製条件が提示され、そのサンプルの物性値を測定し予測値との比較を行います。試料の作製条件の提示について、従来の不確実性サンプリングは使えず、ベイズ最適化に基づく手法(BOED)と、不確実性サンプリングに基づく手法(USED)を使用しました。論文中では、記号と数式を用いて詳細を解説していますが、紹介するに足りる知識を持ち合わせておらず、本記事では割愛させていただきます。

結果、シャルピー衝撃試験では1-5番目か6-10番目の記述子に関係なく、ランダムに試験を行うよりもBOEDやUSEDの方が少ない試験回数で高い正確性を持つモデルが構築されました。一方で引張弾性率の場合は、1-5番目の記述子のみランダムでの試験選択よりもない試験回数で高い正確性を持つモデルが構築され、6-10番目の記述子を使用するとランダムよりも悪い結果になりました。BOEDとUSEDを比較するとどちらの物性評価でもUSEDの方が効果的であることが観測されていて、この理由について予測可能な記述子と予測不可能な記述子の中でいくつかの関係性があるためだと本文中ではコメントされています。

(a)シャルピー衝撃試験と(b)引張弾性率の実験回数ごとの予測誤差。左の図で1-5番目の記述子を使用し、右の図では6-10番目の記述子を使用(出典:原著論文

まとめとしてサンプルの作製・評価とその結果からモデルを構築し、回を重ねるごとにモデルの正確性を向上させる検討において、予測不可能な記述子を活用しランダムに条件を設定するより有効に実験条件が選択され少ない実験回数で正確性が高いモデルが構築されることを確認しました。もしも予測不可能な記述子が知りたい物性よりも簡単に測定できる場合、両者が予測不可能でありながら、簡単な測定から難しい測定を予測することができ、材料設計の高速化と材料開発のコスト削減が実現できます。これは別の見方をすれば、知りたい物性が簡単に測定できる物性と関係していることを意味しており物質の深い理解につながるとコメントしています。さらに、本手法は必要な実験回数を削減できるため、近年注目されている実験自動化技術と組み合わせることで、材料開発の高速化に貢献できると考えているそうです。

今回は、予め関連性が高い予測不可能な記述子を調査して選んでいますが、実際には予測不可能な記述子と調べる目的の物性値の関係は不明の状態で条件を変えて実験を行うことになり、方法の改良が必要だとしています。

この取り組みは、2017年に発表されたマテリアルオープンプラットフォーム(MOP)において作成されたデータベースが利用されました。MOPでは、NIMSと個々の会社が連携するのではなく、NIMSと各社が水平連携して物性や計算科学の研究を進めているようで、この研究では各社がそれぞれのポリプロピレンと加工プロセスを持ち込んで機械学習を行ったと予想されます。個々のデータで個々に手法を開発するよりも、データを集めて予測手法を開発したほうが効率的かつ良い研究成果が出ると考えたためこのような共同研究を進める運びになったかもしれません。今後、水平連携のなかで手法の開発は続ける一方、商品開発としては各社が注力する分野、材料でこの手法をチューニングし、各社の開発に活かされていくと個人的には予想しています。

研究内容の表層しかを紹介できませんでしたが、実際の現場でも実験結果を見た時に予測不可能な物性値が関連し合っているけど、試料の合成条件とは相関が無く、目的の物性値を持つ試料の合成にたどり着けないことは起こりうると思います。そんなときに他の測定を行って、目的の物性への関係性を明らかにすることができるのであれば大変有用な技術になると思います。素材の物性測定方法は、数多くありますので関係性を示せそうな測定方法をAIが自動的に提案してくれるようになれば、予測の応用が広がるのではないでしょうか。企業での素材開発では、カスタマーからのリクエストや規格の適合のために要求される物性値がいくつもあり、長い年月とコストをかけて数々の試験をクリアし商品化される製品もたくさんあります。そんな場合において手ごろに測れる物性から大掛かりな試験の結果を精度よく予測できるようになれば、研究開発を加速させるだけでなく、今まではリスクを考えて挑戦できなかった新しいアイディアを採用した素材の開発も可能になるかもしれません。今後も化学メーカーからのマテリアルズ・インフォマティクス技術の発表に目が離せません。

関連書籍

[amazonjs asin=”B08R9CXC5M” locale=”JP” title=”マテリアルズ・インフォマティクス 材料開発のための機械学習超入門”] [amazonjs asin=”4764960230″ locale=”JP” title=”詳解 マテリアルズインフォマティクス 有機・無機化学のための深層学習 (近代科学社Digital)”]

関連リンク

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. ダイキン、特許を無償開放 代替フロンのエアコン冷媒
  2. 塩野義製薬/米クレストール訴訟、控訴審でも勝訴
  3. 化学系プレプリントサーバー「ChemRxiv」のβ版が運用開始
  4. シイタケ由来成分に抗アレルギー効果を確認
  5. 女子の強い味方、美味しいチョコレート作りを助ける化合物が見出され…
  6. 宇部興産、オランダDSM社と「キラル技術」で提携
  7. キレーション療法ってなに?
  8. 海水から微量リチウムを抽出、濃縮できる電気化学セルを開発

注目情報

ピックアップ記事

  1. ケック不斉アリル化 Keck Asymmetric Allylation
  2. 根岸 英一 Eiichi Negishi
  3. 光触媒でエステルを多電子還元する
  4. 安価な金属触媒でアルケンの高活性ヒドロシリル化を達成
  5. 学部4年間の教育を振り返る
  6. 1,5,7-トリアザビシクロ[4.4.0]デカ-5-エン:1,5,7-Triazabicyclo[4.4.0]dec-5-ene
  7. 第66回―「超分子集合体と外界との相互作用を研究する」Francesco Stellacci教授
  8. 日本プロセス化学会2005サマーシンポジウム
  9. エストロゲン、閉経を境に正反対の作用
  10. 超原子価ヨウ素反応剤を用いたジアミド類の4-イミダゾリジノン誘導化

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年11月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

7th Compound Challengeが開催されます!【エントリー〆切:2026年03月02日】 集え、”腕に覚えあり”の合成化学者!!

メルク株式会社より全世界の合成化学者と競い合うイベント、7th Compound Challenge…

乙卯研究所【急募】 有機合成化学分野(研究テーマは自由)の研究員募集

乙卯研究所とは乙卯研究所は、1915年の設立以来、広く薬学の研究を行うことを主要事業とし、その研…

大森 建 Ken OHMORI

大森 建(おおもり けん, 1969年 02月 12日–)は、日本の有機合成化学者。東京科学大学(I…

西川俊夫 Toshio NISHIKAWA

西川俊夫(にしかわ としお、1962年6月1日-)は、日本の有機化学者である。名古屋大学大学院生命農…

市川聡 Satoshi ICHIKAWA

市川 聡(Satoshi Ichikawa, 1971年9月28日-)は、日本の有機化学者・創薬化学…

非侵襲で使えるpH計で水溶液中のpHを測ってみた!

今回は、知っているようで知らない、なんとなく分かっているようで実は測定が難しい pH計(pHセンサー…

有馬温泉で鉄イオン水溶液について学んできた【化学者が行く温泉巡りの旅】

有馬温泉の金泉は、塩化物濃度と鉄濃度が日本の温泉の中で最も高い温泉で、黄褐色を呈する温泉です。この記…

HPLCをPATツールに変換!オンラインHPLCシステム:DirectInject-LC

これまでの自動サンプリング技術多くの製薬・化学メーカーはその生産性向上のため、有…

MEDCHEM NEWS 34-4 号「新しいモダリティとして注目を浴びる分解創薬」

日本薬学会 医薬化学部会の部会誌 MEDCHEM NEWS より、新たにオープン…

圧力に依存して還元反応が進行!~シクロファン構造を活用した新機能~

第686回のスポットライトリサーチは、北海道大学大学院理学研究院化学部門 有機化学第一研究室(鈴木孝…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP