[スポンサーリンク]

ケムステニュース

最少の実験回数で高い予測精度を与える汎用的AI技術を開発 ~材料開発のDX:NIMS、旭化成、三菱ケミカル、三井化学、住友化学の水平連携で実現~

[スポンサーリンク]

国立研究開発法人物質・材料研究機構(NIMS)、旭化成株式会社、三菱ケミカル株式会社、三井化学株式会社、住友化学株式会社は、化学マテリアルズオープンプラットフォーム(化学MOP)からなる水平連携において、強度や脆さといった材料物性を機械学習で予測する際に、材料の構造から得られる情報を有効に活用し、少ない実験回数で、予測値と実値の誤差を小さくできる(予測精度の高い)AI技術を開発しました。高分子材料をはじめとした材料開発の強力なツールになると期待されます。 (引用:10月25日住友化学プレスリリース)

今回紹介するのは、NIMSと化学メーカー4社が共同で発表した機械学習に関する論文です。

まず研究の背景ですが、マテリアルサイエンスにおいて機械学習を活用して様々な成果が報告されており、物性予測において機械学習の回帰モデルは強力なツールとなっています。機械学習の予測を使ってうまく調査するには、高い正確性を持つ回帰モデルを構築することが重要で、それには一般的に回帰モデルを構築する際の学習データの量に依存します。しかしながら、学習データの量は時間とコストに比例するため、できるだけ少ない学習データで高い正確性を持つモデルを構築することが課題となっています。

モデルの正確性を調べるには、予測精度を向上させる特徴量を探す特徴選択がありますが、本研究ではデータポイントを学習データに加えて予測精度を向上させる能動学習、特に実測データがない候補から選択する不確実性サンプリングに着目しました。不確実性サンプリングは能動学習において有用で、最も不確実なデータポイントが選択されることで予測精度を向上させることができます。しかしながら、マテリアルサイエンスにおいては不確実性サンプリングは常に可能ではなく、実験前に予測可能な特徴量(分子量や分子構造の情報)が限られていると、予測不可能な特徴量(XRDパターンやDSC)が不確実性サンプリングにおいて選択されてしまいます。予測不可能な特徴量は実際に実験してみてわかるものであり、予測のための情報も予測したい情報も実験が必要となるのでは予測モデルとしては成り立ちません。しかし、予測不可能な特徴量の種類は種々の測定で増え、調べたい物性値とより関連性が高くなることが多くの事例において見られます。つまり、予測不可能な特徴量が予測モデルの正確性を向上させることができるのならば、測定が難しい物性値を測定が簡単な物性値から予測することになり、例えばXRD やDSC 等のデータを用いてなるべく少ない実験回数で、正確に材料物性が予測できるように、合成すべき材料として設定できる記述子を適切に選定する方法の開発を行いました。

本研究で目指した予測モデル(出典:住友化学プレスリリース

開発した手法の有効性を検証するために、15 種類のポリプロピレンについて、各々5つの異なるプロセス加工により得られた合計75 点を対象材料としました。対象とする物性評価は、シャルピー衝撃試験引張弾性率の機械物性で実験までに設定できる記述子としては、分子量、立体規則性、および射出成型冷却温度としました。また、測定によって得られる記述子としては、DSCとXRD、NMR、偏光顕微鏡観察による表面形状、比重を対象としました。

では実験結果に移ります。本研究では、予め機械特性と相関がある予測不可能な記述子をピアソンの相関係数が高い順に10個選択しておき、1-5番目と6-10番目に加えて予測可能な記述子に対して75点すべてを学習データとして使って回帰モデルを作り、一個抜き交差検証で予測と実測値を比較しました。結果、予め選んだ関連性が高い予測不可能な記述子の中では、1-5番目の方が6-10番目よりもどちらの物性値においても高い正確性を持つことが分かりました。シャルピー衝撃試験においては、予測可能な記述子を使ったほうが正確性は高くなりましたが、引張弾性率は1-5番目の予測不可能な記述子の方が正確性は高くなりました。

(a)シャルピー衝撃試験と(b)引張弾性率の実測と予測値の違いを表すプロット図、モデルによるLOOE(leave-one-out error)と決定係数R2の違い(出典:原著論文

次に本題のサンプル作製回数ごとにモデルを改良し正確性を上げていく検討ですが、まず開発方法について見ていきます。最初に予測可能な記述子でのみデータセットを準備しました。次にモデルに使用する記述子が選択されたら予測不可能な記述子とターゲットの物性値を実際に測定しました。さらに予測不可能な記述子からターゲットの物性値を予測するように学習を行います。そしてこの機械学習の予測精度が高くなると期待される試料の作製条件が提示され、そのサンプルの物性値を測定し予測値との比較を行います。試料の作製条件の提示について、従来の不確実性サンプリングは使えず、ベイズ最適化に基づく手法(BOED)と、不確実性サンプリングに基づく手法(USED)を使用しました。論文中では、記号と数式を用いて詳細を解説していますが、紹介するに足りる知識を持ち合わせておらず、本記事では割愛させていただきます。

結果、シャルピー衝撃試験では1-5番目か6-10番目の記述子に関係なく、ランダムに試験を行うよりもBOEDやUSEDの方が少ない試験回数で高い正確性を持つモデルが構築されました。一方で引張弾性率の場合は、1-5番目の記述子のみランダムでの試験選択よりもない試験回数で高い正確性を持つモデルが構築され、6-10番目の記述子を使用するとランダムよりも悪い結果になりました。BOEDとUSEDを比較するとどちらの物性評価でもUSEDの方が効果的であることが観測されていて、この理由について予測可能な記述子と予測不可能な記述子の中でいくつかの関係性があるためだと本文中ではコメントされています。

(a)シャルピー衝撃試験と(b)引張弾性率の実験回数ごとの予測誤差。左の図で1-5番目の記述子を使用し、右の図では6-10番目の記述子を使用(出典:原著論文

まとめとしてサンプルの作製・評価とその結果からモデルを構築し、回を重ねるごとにモデルの正確性を向上させる検討において、予測不可能な記述子を活用しランダムに条件を設定するより有効に実験条件が選択され少ない実験回数で正確性が高いモデルが構築されることを確認しました。もしも予測不可能な記述子が知りたい物性よりも簡単に測定できる場合、両者が予測不可能でありながら、簡単な測定から難しい測定を予測することができ、材料設計の高速化と材料開発のコスト削減が実現できます。これは別の見方をすれば、知りたい物性が簡単に測定できる物性と関係していることを意味しており物質の深い理解につながるとコメントしています。さらに、本手法は必要な実験回数を削減できるため、近年注目されている実験自動化技術と組み合わせることで、材料開発の高速化に貢献できると考えているそうです。

今回は、予め関連性が高い予測不可能な記述子を調査して選んでいますが、実際には予測不可能な記述子と調べる目的の物性値の関係は不明の状態で条件を変えて実験を行うことになり、方法の改良が必要だとしています。

この取り組みは、2017年に発表されたマテリアルオープンプラットフォーム(MOP)において作成されたデータベースが利用されました。MOPでは、NIMSと個々の会社が連携するのではなく、NIMSと各社が水平連携して物性や計算科学の研究を進めているようで、この研究では各社がそれぞれのポリプロピレンと加工プロセスを持ち込んで機械学習を行ったと予想されます。個々のデータで個々に手法を開発するよりも、データを集めて予測手法を開発したほうが効率的かつ良い研究成果が出ると考えたためこのような共同研究を進める運びになったかもしれません。今後、水平連携のなかで手法の開発は続ける一方、商品開発としては各社が注力する分野、材料でこの手法をチューニングし、各社の開発に活かされていくと個人的には予想しています。

研究内容の表層しかを紹介できませんでしたが、実際の現場でも実験結果を見た時に予測不可能な物性値が関連し合っているけど、試料の合成条件とは相関が無く、目的の物性値を持つ試料の合成にたどり着けないことは起こりうると思います。そんなときに他の測定を行って、目的の物性への関係性を明らかにすることができるのであれば大変有用な技術になると思います。素材の物性測定方法は、数多くありますので関係性を示せそうな測定方法をAIが自動的に提案してくれるようになれば、予測の応用が広がるのではないでしょうか。企業での素材開発では、カスタマーからのリクエストや規格の適合のために要求される物性値がいくつもあり、長い年月とコストをかけて数々の試験をクリアし商品化される製品もたくさんあります。そんな場合において手ごろに測れる物性から大掛かりな試験の結果を精度よく予測できるようになれば、研究開発を加速させるだけでなく、今まではリスクを考えて挑戦できなかった新しいアイディアを採用した素材の開発も可能になるかもしれません。今後も化学メーカーからのマテリアルズ・インフォマティクス技術の発表に目が離せません。

関連書籍

[amazonjs asin=”B08R9CXC5M” locale=”JP” title=”マテリアルズ・インフォマティクス 材料開発のための機械学習超入門”] [amazonjs asin=”4764960230″ locale=”JP” title=”詳解 マテリアルズインフォマティクス 有機・無機化学のための深層学習 (近代科学社Digital)”]

関連リンク

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 抗がん剤大量生産に期待 山大農学部豊増助教授 有機化合物生成の遺…
  2. グローバルCOE審査結果
  3. アレルギー治療に有望物質 受容体を標的に、京都大
  4. 武田や第一三共など大手医薬、特許切れ主力薬を「延命」
  5. のむ発毛薬で五輪アウトに
  6. 製薬各社 2011年度 第2四半期決算
  7. 2021年、ムーアの法則が崩れる?
  8. 化学五輪、「金」の高3連続出場 7月に東京開催

注目情報

ピックアップ記事

  1. 近況報告PartIV
  2. 超高圧合成、添加剤が選択的物質合成の決め手に -電池材料等への応用に期待-
  3. ストックホルム市庁舎
  4. アルファリポ酸 /α-lipoic acid
  5. クロタミトンのはなし 古くて新しいその機構
  6. 既存の石油設備を活用してCO2フリー水素を製造、ENEOSが実証へ
  7. 「誰がそのシャツを縫うんだい」~新材料・新製品と廃棄物のはざま~ 2
  8. オンライン座談会『ケムステスタッフで語ろうぜ』開幕!
  9. 第41回―「クロム錯体のユニークな触媒活性と反応性を解明する」Klaus Theopold教授
  10. 2021年、ムーアの法則が崩れる?

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年11月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

データ駆動型生成AIの限界に迫る!生成AIで信頼性の高い分子設計へ

第663回のスポットライトリサーチは、横浜市立大学大学院 生命医科学研究科(生命情報科学研究室)博士…

MDSのはなし 骨髄異形成症候群とそのお薬の開発状況 その2

Tshozoです。前回はMDSについての簡易な情報と歴史と原因を述べるだけで終わってしまったので…

水-有機溶媒の二液相間電子伝達により進行する人工光合成反応

第662回のスポットライトリサーチは、京都大学 大学院工学研究科 物質エネルギー化学専攻 阿部竜研究…

ケムステイブニングミキサー 2025 報告

3月26日から29日の日本化学会第105春季年会に参加されたみなさま、おつかれさまでした!運営に…

【テーマ別ショートウェビナー】今こそ変革の時!マイクロ波が拓く脱炭素時代のプロセス革新

■ウェビナー概要プロセスの脱炭素化及び効率化のキーテクノロジーである”マイクロ波…

予期せぬパラジウム移動を経る環化反応でベンゾヘテロールを作る

1,2-Pd移動を含む予期せぬ連続反応として進行することがわかり、高収率で生成物が得られた。 合…

【27卒】太陽HD研究開発 1day仕事体験

太陽HDでの研究開発職を体感してみませんか?私たちの研究活動についてより近くで体験していただく場…

熱がダメなら光当てれば?Lugdunomycinの全合成

光化学を駆使した、天然物Lugdunomycinの全合成が報告された。紫外光照射による異性化でイソベ…

第59回有機反応若手の会

開催概要有機反応若手の会は、全国の有機化学を研究する大学院生を中心とした若手研究…

多環式分子を一挙に合成!新たなo-キノジメタン生成法の開発

第661回のスポットライトリサーチは、早稲田大学大学院先進理工学研究科(山口潤一郎研究室)博士課程1…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP