[スポンサーリンク]

ケムステニュース

最少の実験回数で高い予測精度を与える汎用的AI技術を開発 ~材料開発のDX:NIMS、旭化成、三菱ケミカル、三井化学、住友化学の水平連携で実現~

[スポンサーリンク]

国立研究開発法人物質・材料研究機構(NIMS)、旭化成株式会社、三菱ケミカル株式会社、三井化学株式会社、住友化学株式会社は、化学マテリアルズオープンプラットフォーム(化学MOP)からなる水平連携において、強度や脆さといった材料物性を機械学習で予測する際に、材料の構造から得られる情報を有効に活用し、少ない実験回数で、予測値と実値の誤差を小さくできる(予測精度の高い)AI技術を開発しました。高分子材料をはじめとした材料開発の強力なツールになると期待されます。 (引用:10月25日住友化学プレスリリース)

今回紹介するのは、NIMSと化学メーカー4社が共同で発表した機械学習に関する論文です。

まず研究の背景ですが、マテリアルサイエンスにおいて機械学習を活用して様々な成果が報告されており、物性予測において機械学習の回帰モデルは強力なツールとなっています。機械学習の予測を使ってうまく調査するには、高い正確性を持つ回帰モデルを構築することが重要で、それには一般的に回帰モデルを構築する際の学習データの量に依存します。しかしながら、学習データの量は時間とコストに比例するため、できるだけ少ない学習データで高い正確性を持つモデルを構築することが課題となっています。

モデルの正確性を調べるには、予測精度を向上させる特徴量を探す特徴選択がありますが、本研究ではデータポイントを学習データに加えて予測精度を向上させる能動学習、特に実測データがない候補から選択する不確実性サンプリングに着目しました。不確実性サンプリングは能動学習において有用で、最も不確実なデータポイントが選択されることで予測精度を向上させることができます。しかしながら、マテリアルサイエンスにおいては不確実性サンプリングは常に可能ではなく、実験前に予測可能な特徴量(分子量や分子構造の情報)が限られていると、予測不可能な特徴量(XRDパターンやDSC)が不確実性サンプリングにおいて選択されてしまいます。予測不可能な特徴量は実際に実験してみてわかるものであり、予測のための情報も予測したい情報も実験が必要となるのでは予測モデルとしては成り立ちません。しかし、予測不可能な特徴量の種類は種々の測定で増え、調べたい物性値とより関連性が高くなることが多くの事例において見られます。つまり、予測不可能な特徴量が予測モデルの正確性を向上させることができるのならば、測定が難しい物性値を測定が簡単な物性値から予測することになり、例えばXRD やDSC 等のデータを用いてなるべく少ない実験回数で、正確に材料物性が予測できるように、合成すべき材料として設定できる記述子を適切に選定する方法の開発を行いました。

本研究で目指した予測モデル(出典:住友化学プレスリリース

開発した手法の有効性を検証するために、15 種類のポリプロピレンについて、各々5つの異なるプロセス加工により得られた合計75 点を対象材料としました。対象とする物性評価は、シャルピー衝撃試験引張弾性率の機械物性で実験までに設定できる記述子としては、分子量、立体規則性、および射出成型冷却温度としました。また、測定によって得られる記述子としては、DSCとXRD、NMR、偏光顕微鏡観察による表面形状、比重を対象としました。

では実験結果に移ります。本研究では、予め機械特性と相関がある予測不可能な記述子をピアソンの相関係数が高い順に10個選択しておき、1-5番目と6-10番目に加えて予測可能な記述子に対して75点すべてを学習データとして使って回帰モデルを作り、一個抜き交差検証で予測と実測値を比較しました。結果、予め選んだ関連性が高い予測不可能な記述子の中では、1-5番目の方が6-10番目よりもどちらの物性値においても高い正確性を持つことが分かりました。シャルピー衝撃試験においては、予測可能な記述子を使ったほうが正確性は高くなりましたが、引張弾性率は1-5番目の予測不可能な記述子の方が正確性は高くなりました。

(a)シャルピー衝撃試験と(b)引張弾性率の実測と予測値の違いを表すプロット図、モデルによるLOOE(leave-one-out error)と決定係数R2の違い(出典:原著論文

次に本題のサンプル作製回数ごとにモデルを改良し正確性を上げていく検討ですが、まず開発方法について見ていきます。最初に予測可能な記述子でのみデータセットを準備しました。次にモデルに使用する記述子が選択されたら予測不可能な記述子とターゲットの物性値を実際に測定しました。さらに予測不可能な記述子からターゲットの物性値を予測するように学習を行います。そしてこの機械学習の予測精度が高くなると期待される試料の作製条件が提示され、そのサンプルの物性値を測定し予測値との比較を行います。試料の作製条件の提示について、従来の不確実性サンプリングは使えず、ベイズ最適化に基づく手法(BOED)と、不確実性サンプリングに基づく手法(USED)を使用しました。論文中では、記号と数式を用いて詳細を解説していますが、紹介するに足りる知識を持ち合わせておらず、本記事では割愛させていただきます。

結果、シャルピー衝撃試験では1-5番目か6-10番目の記述子に関係なく、ランダムに試験を行うよりもBOEDやUSEDの方が少ない試験回数で高い正確性を持つモデルが構築されました。一方で引張弾性率の場合は、1-5番目の記述子のみランダムでの試験選択よりもない試験回数で高い正確性を持つモデルが構築され、6-10番目の記述子を使用するとランダムよりも悪い結果になりました。BOEDとUSEDを比較するとどちらの物性評価でもUSEDの方が効果的であることが観測されていて、この理由について予測可能な記述子と予測不可能な記述子の中でいくつかの関係性があるためだと本文中ではコメントされています。

(a)シャルピー衝撃試験と(b)引張弾性率の実験回数ごとの予測誤差。左の図で1-5番目の記述子を使用し、右の図では6-10番目の記述子を使用(出典:原著論文

まとめとしてサンプルの作製・評価とその結果からモデルを構築し、回を重ねるごとにモデルの正確性を向上させる検討において、予測不可能な記述子を活用しランダムに条件を設定するより有効に実験条件が選択され少ない実験回数で正確性が高いモデルが構築されることを確認しました。もしも予測不可能な記述子が知りたい物性よりも簡単に測定できる場合、両者が予測不可能でありながら、簡単な測定から難しい測定を予測することができ、材料設計の高速化と材料開発のコスト削減が実現できます。これは別の見方をすれば、知りたい物性が簡単に測定できる物性と関係していることを意味しており物質の深い理解につながるとコメントしています。さらに、本手法は必要な実験回数を削減できるため、近年注目されている実験自動化技術と組み合わせることで、材料開発の高速化に貢献できると考えているそうです。

今回は、予め関連性が高い予測不可能な記述子を調査して選んでいますが、実際には予測不可能な記述子と調べる目的の物性値の関係は不明の状態で条件を変えて実験を行うことになり、方法の改良が必要だとしています。

この取り組みは、2017年に発表されたマテリアルオープンプラットフォーム(MOP)において作成されたデータベースが利用されました。MOPでは、NIMSと個々の会社が連携するのではなく、NIMSと各社が水平連携して物性や計算科学の研究を進めているようで、この研究では各社がそれぞれのポリプロピレンと加工プロセスを持ち込んで機械学習を行ったと予想されます。個々のデータで個々に手法を開発するよりも、データを集めて予測手法を開発したほうが効率的かつ良い研究成果が出ると考えたためこのような共同研究を進める運びになったかもしれません。今後、水平連携のなかで手法の開発は続ける一方、商品開発としては各社が注力する分野、材料でこの手法をチューニングし、各社の開発に活かされていくと個人的には予想しています。

研究内容の表層しかを紹介できませんでしたが、実際の現場でも実験結果を見た時に予測不可能な物性値が関連し合っているけど、試料の合成条件とは相関が無く、目的の物性値を持つ試料の合成にたどり着けないことは起こりうると思います。そんなときに他の測定を行って、目的の物性への関係性を明らかにすることができるのであれば大変有用な技術になると思います。素材の物性測定方法は、数多くありますので関係性を示せそうな測定方法をAIが自動的に提案してくれるようになれば、予測の応用が広がるのではないでしょうか。企業での素材開発では、カスタマーからのリクエストや規格の適合のために要求される物性値がいくつもあり、長い年月とコストをかけて数々の試験をクリアし商品化される製品もたくさんあります。そんな場合において手ごろに測れる物性から大掛かりな試験の結果を精度よく予測できるようになれば、研究開発を加速させるだけでなく、今まではリスクを考えて挑戦できなかった新しいアイディアを採用した素材の開発も可能になるかもしれません。今後も化学メーカーからのマテリアルズ・インフォマティクス技術の発表に目が離せません。

関連書籍

関連リンク

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 小林製薬、「神薬」2種類を今春刷新
  2. 東工大発、光を操るイミド化合物/光で創られるロジウムアート錯体
  3. 科学:太古の海底に眠る特効薬
  4. AIで世界最高精度のNMR化学シフト予測を達成
  5. 日本化学会、論文無料公開へ新方式
  6. 富士写、化学材料を事業化
  7. ポリエチレンなど合成樹脂、値上げ浸透
  8. ファイザーがワイスを買収

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. 第134回―「脳神経系の理解を進める分析化学」Jonathan Sweeder教授
  2. 野依賞―受賞者一覧
  3. プロドラッグの話
  4. 三角形ラジカルを使って発光性2次元ハニカムスピン格子構造を組み立てる!
  5. イミデートラジカルを用いた多置換アミノアルコール合成
  6. ビタミンDで肺ガンの生存率が上がる?
  7. トリス(トリフェニルホスフィン)ロジウム(I) クロリド:Tris(triphenylphosphine)rhodium(I) Chloride
  8. 企業研究者たちの感動の瞬間: モノづくりに賭ける夢と情熱
  9. 2016年2月の注目化学書籍
  10. マテリアルズ・インフォマティクス新春座談会 -二刀流で進める素材開発 実験と計算科学-

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年11月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

【十全化学】核酸医薬のGMP製造への挑戦

「核酸医薬」と聞いて、真っ先に思い起こすのは、COVID-19に対するmRNAワ…

十全化学株式会社ってどんな会社?

私たち十全化学は、医薬品の有効成分である原薬及び重要中間体の製造受託を担っている…

化学者と不妊治療

これは理系の夫視点で書いた、私たち夫婦の不妊治療の体験談です。ケムステ読者で不妊に悩まれている方の参…

リボフラビンを活用した光触媒製品の開発

ビタミン系光触媒ジェンタミン®は、リボフラビン(ビタミンB2)を活用した光触媒で…

紅麹を含むサプリメントで重篤な健康被害、原因物質の特定急ぐ

健康食品 (機能性表示食品) に関する重大ニュースが報じられました。血中コレステ…

ユシロ化学工業ってどんな会社?

1944年の創業から培った技術力と信頼で、こっそりセカイを変える化学屋さん。ユシロ化学の事業内容…

日本薬学会第144年会付設展示会ケムステキャンペーン

日本化学会の年会も終わりましたね。付設展示会キャンペーンもケムステイブニングミキ…

ペプチドのN末端でのピンポイント二重修飾反応を開発!

第 605回のスポットライトリサーチは、中央大学大学院 理工学研究科 応用化学専…

材料・製品開発組織における科学的考察の風土のつくりかた ー マテリアルズ・インフォマティクスを活用し最大限の成果を得るための筋の良いテーマとは ー

開催日:2024/03/27 申込みはこちら■開催概要材料開発を取り巻く競争や環境が激し…

石谷教授最終講義「人工光合成を目指して」を聴講してみた

bergです。この度は2024年3月9日(土)に東京工業大学 大岡山キャンパスにて開催された石谷教授…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP