[スポンサーリンク]

ケムステニュース

最少の実験回数で高い予測精度を与える汎用的AI技術を開発 ~材料開発のDX:NIMS、旭化成、三菱ケミカル、三井化学、住友化学の水平連携で実現~

[スポンサーリンク]

国立研究開発法人物質・材料研究機構(NIMS)、旭化成株式会社、三菱ケミカル株式会社、三井化学株式会社、住友化学株式会社は、化学マテリアルズオープンプラットフォーム(化学MOP)からなる水平連携において、強度や脆さといった材料物性を機械学習で予測する際に、材料の構造から得られる情報を有効に活用し、少ない実験回数で、予測値と実値の誤差を小さくできる(予測精度の高い)AI技術を開発しました。高分子材料をはじめとした材料開発の強力なツールになると期待されます。 (引用:10月25日住友化学プレスリリース)

今回紹介するのは、NIMSと化学メーカー4社が共同で発表した機械学習に関する論文です。

まず研究の背景ですが、マテリアルサイエンスにおいて機械学習を活用して様々な成果が報告されており、物性予測において機械学習の回帰モデルは強力なツールとなっています。機械学習の予測を使ってうまく調査するには、高い正確性を持つ回帰モデルを構築することが重要で、それには一般的に回帰モデルを構築する際の学習データの量に依存します。しかしながら、学習データの量は時間とコストに比例するため、できるだけ少ない学習データで高い正確性を持つモデルを構築することが課題となっています。

モデルの正確性を調べるには、予測精度を向上させる特徴量を探す特徴選択がありますが、本研究ではデータポイントを学習データに加えて予測精度を向上させる能動学習、特に実測データがない候補から選択する不確実性サンプリングに着目しました。不確実性サンプリングは能動学習において有用で、最も不確実なデータポイントが選択されることで予測精度を向上させることができます。しかしながら、マテリアルサイエンスにおいては不確実性サンプリングは常に可能ではなく、実験前に予測可能な特徴量(分子量や分子構造の情報)が限られていると、予測不可能な特徴量(XRDパターンやDSC)が不確実性サンプリングにおいて選択されてしまいます。予測不可能な特徴量は実際に実験してみてわかるものであり、予測のための情報も予測したい情報も実験が必要となるのでは予測モデルとしては成り立ちません。しかし、予測不可能な特徴量の種類は種々の測定で増え、調べたい物性値とより関連性が高くなることが多くの事例において見られます。つまり、予測不可能な特徴量が予測モデルの正確性を向上させることができるのならば、測定が難しい物性値を測定が簡単な物性値から予測することになり、例えばXRD やDSC 等のデータを用いてなるべく少ない実験回数で、正確に材料物性が予測できるように、合成すべき材料として設定できる記述子を適切に選定する方法の開発を行いました。

本研究で目指した予測モデル(出典:住友化学プレスリリース

開発した手法の有効性を検証するために、15 種類のポリプロピレンについて、各々5つの異なるプロセス加工により得られた合計75 点を対象材料としました。対象とする物性評価は、シャルピー衝撃試験引張弾性率の機械物性で実験までに設定できる記述子としては、分子量、立体規則性、および射出成型冷却温度としました。また、測定によって得られる記述子としては、DSCとXRD、NMR、偏光顕微鏡観察による表面形状、比重を対象としました。

では実験結果に移ります。本研究では、予め機械特性と相関がある予測不可能な記述子をピアソンの相関係数が高い順に10個選択しておき、1-5番目と6-10番目に加えて予測可能な記述子に対して75点すべてを学習データとして使って回帰モデルを作り、一個抜き交差検証で予測と実測値を比較しました。結果、予め選んだ関連性が高い予測不可能な記述子の中では、1-5番目の方が6-10番目よりもどちらの物性値においても高い正確性を持つことが分かりました。シャルピー衝撃試験においては、予測可能な記述子を使ったほうが正確性は高くなりましたが、引張弾性率は1-5番目の予測不可能な記述子の方が正確性は高くなりました。

(a)シャルピー衝撃試験と(b)引張弾性率の実測と予測値の違いを表すプロット図、モデルによるLOOE(leave-one-out error)と決定係数R2の違い(出典:原著論文

次に本題のサンプル作製回数ごとにモデルを改良し正確性を上げていく検討ですが、まず開発方法について見ていきます。最初に予測可能な記述子でのみデータセットを準備しました。次にモデルに使用する記述子が選択されたら予測不可能な記述子とターゲットの物性値を実際に測定しました。さらに予測不可能な記述子からターゲットの物性値を予測するように学習を行います。そしてこの機械学習の予測精度が高くなると期待される試料の作製条件が提示され、そのサンプルの物性値を測定し予測値との比較を行います。試料の作製条件の提示について、従来の不確実性サンプリングは使えず、ベイズ最適化に基づく手法(BOED)と、不確実性サンプリングに基づく手法(USED)を使用しました。論文中では、記号と数式を用いて詳細を解説していますが、紹介するに足りる知識を持ち合わせておらず、本記事では割愛させていただきます。

結果、シャルピー衝撃試験では1-5番目か6-10番目の記述子に関係なく、ランダムに試験を行うよりもBOEDやUSEDの方が少ない試験回数で高い正確性を持つモデルが構築されました。一方で引張弾性率の場合は、1-5番目の記述子のみランダムでの試験選択よりもない試験回数で高い正確性を持つモデルが構築され、6-10番目の記述子を使用するとランダムよりも悪い結果になりました。BOEDとUSEDを比較するとどちらの物性評価でもUSEDの方が効果的であることが観測されていて、この理由について予測可能な記述子と予測不可能な記述子の中でいくつかの関係性があるためだと本文中ではコメントされています。

(a)シャルピー衝撃試験と(b)引張弾性率の実験回数ごとの予測誤差。左の図で1-5番目の記述子を使用し、右の図では6-10番目の記述子を使用(出典:原著論文

まとめとしてサンプルの作製・評価とその結果からモデルを構築し、回を重ねるごとにモデルの正確性を向上させる検討において、予測不可能な記述子を活用しランダムに条件を設定するより有効に実験条件が選択され少ない実験回数で正確性が高いモデルが構築されることを確認しました。もしも予測不可能な記述子が知りたい物性よりも簡単に測定できる場合、両者が予測不可能でありながら、簡単な測定から難しい測定を予測することができ、材料設計の高速化と材料開発のコスト削減が実現できます。これは別の見方をすれば、知りたい物性が簡単に測定できる物性と関係していることを意味しており物質の深い理解につながるとコメントしています。さらに、本手法は必要な実験回数を削減できるため、近年注目されている実験自動化技術と組み合わせることで、材料開発の高速化に貢献できると考えているそうです。

今回は、予め関連性が高い予測不可能な記述子を調査して選んでいますが、実際には予測不可能な記述子と調べる目的の物性値の関係は不明の状態で条件を変えて実験を行うことになり、方法の改良が必要だとしています。

この取り組みは、2017年に発表されたマテリアルオープンプラットフォーム(MOP)において作成されたデータベースが利用されました。MOPでは、NIMSと個々の会社が連携するのではなく、NIMSと各社が水平連携して物性や計算科学の研究を進めているようで、この研究では各社がそれぞれのポリプロピレンと加工プロセスを持ち込んで機械学習を行ったと予想されます。個々のデータで個々に手法を開発するよりも、データを集めて予測手法を開発したほうが効率的かつ良い研究成果が出ると考えたためこのような共同研究を進める運びになったかもしれません。今後、水平連携のなかで手法の開発は続ける一方、商品開発としては各社が注力する分野、材料でこの手法をチューニングし、各社の開発に活かされていくと個人的には予想しています。

研究内容の表層しかを紹介できませんでしたが、実際の現場でも実験結果を見た時に予測不可能な物性値が関連し合っているけど、試料の合成条件とは相関が無く、目的の物性値を持つ試料の合成にたどり着けないことは起こりうると思います。そんなときに他の測定を行って、目的の物性への関係性を明らかにすることができるのであれば大変有用な技術になると思います。素材の物性測定方法は、数多くありますので関係性を示せそうな測定方法をAIが自動的に提案してくれるようになれば、予測の応用が広がるのではないでしょうか。企業での素材開発では、カスタマーからのリクエストや規格の適合のために要求される物性値がいくつもあり、長い年月とコストをかけて数々の試験をクリアし商品化される製品もたくさんあります。そんな場合において手ごろに測れる物性から大掛かりな試験の結果を精度よく予測できるようになれば、研究開発を加速させるだけでなく、今まではリスクを考えて挑戦できなかった新しいアイディアを採用した素材の開発も可能になるかもしれません。今後も化学メーカーからのマテリアルズ・インフォマティクス技術の発表に目が離せません。

関連書籍

[amazonjs asin=”B08R9CXC5M” locale=”JP” title=”マテリアルズ・インフォマティクス 材料開発のための機械学習超入門”] [amazonjs asin=”4764960230″ locale=”JP” title=”詳解 マテリアルズインフォマティクス 有機・無機化学のための深層学習 (近代科学社Digital)”]

関連リンク

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. キレーション療法ってなに?
  2. サリドマイド、がん治療薬に
  3. 化粧品用マイクロプラスチックビーズ代替素材の市場について調査結果…
  4. 東レ工場炎上2人重傷 名古屋
  5. 化学コミュニケーション賞2022が発表
  6. 昭和電工、青色LEDに参入
  7. 出光・昭和シェル、統合を発表
  8. 国際化学オリンピック開幕間近:今年は日本で開催!

注目情報

ピックアップ記事

  1. 細孔内単分子ポリシラン鎖の特性解明
  2. ディストニックラジカルによる多様なアンモニウム塩の合成法
  3. 歯のバイオフィルム除去と病原体検出を狙ったマイクロロボットの開発
  4. 生合成研究の記事まとめ
  5. 「ニコチンパッチ」6月1日から保険適用
  6. トリス(トリフェニルホスフィン)ロジウム(I) クロリド:Tris(triphenylphosphine)rhodium(I) Chloride
  7. 第95回日本化学会付設展示会ケムステキャンペーン!Part I
  8. 第75回「デジタル技術は化学研究を革新できるのか?」熊田佳菜子 主任研究員
  9. さよならGoogleリーダー!そして次へ…
  10. 低い電位で多電子移動を引き起こす「ドミノレドックス反応」とは!?

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年11月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

光でゆがむ分子 ― アルミニウム錯体の対称性の破れをコヒーレント振動分光で観測

第711回のスポットライトリサーチは、九州大学大学院理学研究院 化学部門(分光分析化学研究室)・江原…

有機合成のカラム精製に革新を 〜モノリスカラムで変わる「研究のスピード」〜

筆者の研究室では有機合成を行っています。合成も大変ですが、何より大変なのが精製操作。最近、とある…

酸素は系内に入り込み続ける【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか3. 反応操作をし…

アンモニウム構造によりラジカル種の発生位置を完全に制御!

第710回のスポットライトリサーチは、関西学院大学理工学研究科 村上研究室の榊原 陽太(さかきばら …

化学つれづれ草【ある研究者の回想】

概要物理化学者で量子機能材料を専門とする著者によるエッセイ集.化学者としての研究,教育,人生…

第60回有機反応若手の会

開催概要有機反応若手の会は、有機化学分野で研究を行う全国の大学院生を中心とした若手研究者が集い、…

ノーベル賞受賞者と語り合う5日間!「第18回HOPEミーティング」参加者募集!

申し込みはこちら概要主催:独立行政法人 日本学術振興会(JSPS)開催地:神奈川…

光触媒による高効率なCO2還元の実現―まさかの光を弱く当てることが重要だった―

第709回のスポットライトリサーチは、東京科学大学 理学院(前田研究室)博士後期課程2年の仲田竜一 …

「π-πスタッキング」という言葉が生む誤解【芳香環の相互作用を見直す: 前編】

芳香環が平行に並んで近接しているとき、その構造を「π–π スタッキング」と表されることがよくあります…

一重項酸素によるC(sp2)−P結合切断を用いた長波長光によるリン化合物のアンケージング

第 708 回のスポットライトリサーチは、同志社女子大学 薬学部 医療薬学科 5…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP