[スポンサーリンク]

ケムステしごと

【化学×AI・機械学習クラウド】実験科学者・エンジニア自身が実践するデータサイエンス/データケミカル株式会社

[スポンサーリンク]

 

化学のAI・機械学習プラットフォーム「Datachemical LAB」

高機能性材料を研究・開発・製造する際、化学・化学工学データを活用してデータ解析・機械学習を行い、分子・材料・プロセスの設計やプロセス管理を効率化することが一般的となっています。しかし、自身の手で実際にデータ解析・機械学習ができなければ、実験科学者にとっては絵に描いた餅に過ぎません。これまで、データ解析・機械学習をするためには、Python をはじめとするプログラミング言語を用いてプログラムを書く必要があり、実験科学者・エンジニアの大きな壁になっていました。
このような状況で、プログラミングなしでデータ解析・機械学習ができるクラウドサービス Datachemical LAB が登場し、ウェブブラウザ (Chrome, Safari, Edge, Firefox など) 上の直感的な操作のみで、化学・化学工学のデータ解析・機械学習が可能になりました。Datachemical LAB を使うことで、実験科学者・エンジニア自身の手で、データ解析・機械学習に基づいた分子・材料・プロセスの設計ができるようになりました。
Datachemical LAB では主に以下の内容を実施できます。

  • 現状のデータセットを解析する最適な回帰モデル・クラス分類モデルの構築
  •  複数の目的変数 y を同時に考慮したモデルの構築
  •  ダブルクロスバリデーションによる少ないサンプルのデータセットの解析
  •  構築されたモデルに基づいた、モデルの適用範囲を考慮した分子設計・材料設計・プロセス設計
  •  ベイズ最適化による外挿探索および設計
  •  仮想的なサンプル (実験条件・合成条件・製造条件・評価条件・プロセス条件など) の自動生成
  •  化学構造の自動生成
  •  化学構造の数値化 (分子記述子・フィンガープリントの計算)
  •  効果的な機械学習が可能になるような最初の実験条件を決める実験計画法
  •  ベイズ最適化に基づく適応的実験計画法
  • 数理モデルの直接的逆解析に基づく適応的実験計画法
  • データセットにおける欠損値の自動的補完
  •  データセットの低次元化・見える化・可視化
  •  特徴量設計・特徴量変換・特徴量選択
  •  高分子や合金等の材料に対する特徴量の計算
  •  ソフトセンサーによるリアルタイム予測
  •  モデルの予測精度を維持する適応的ソフトセンサー
  •  プロセスのモニタリングおよび異常検出

例えば下図では、一般的なモデル(a)と比較して、Datachemical LAB で提案されたモデル(b)により、的確に目的変数 y を予測できています。このような分子・材料・プロセスの設計に用いるモデルを、Datachemical LAB では自動的に最適化できます。

Datachemical LAB による数理モデルの自動的な最適化

数理モデルの直接的逆解析

分子・材料・プロセスの設計に必要なことは 物性・活性・特性などの目的変数 y の目標値から、それを実現するための実験条件・製造条件・プロセス条件などの説明変数 x を導くことです。x と y との間で構築された数理モデル y=f(x) において、理想の y からそれを達成する x の予測は、x を入力して y を予測する順解析とは逆に、y を入力して x を予測することです。しかし、これまでの逆解析は、x の仮想サンプルを大量に生成し、それらをモデルに入力して y を予測し、予測値が良好なサンプルを選択する、すなわち順解析を膨大に繰り返す擬似的な逆解析にすぎませんでした。これでは、人が設定した x の探索範囲における y の予測にすぎず、当初想定しない条件でこそ発現する新機能の探索にはまったく対応できません。また、x の数に対して指数関数的に解空間が増大するため、x が高次元になると網羅的な逆解析は不可能です。
そこで、y の値から x の値を直接的に予測する、すなわち数理モデルを真の意味で逆解析する手法が開発され、Datachemical LAB に実装されました。この手法を直接的逆解析法と呼びます。直接的逆解析法では、x と y との間の関係を同時確率密度関数として複数の正規分布の重ね合わせで表現することで、確率の乗法定理とベイズの定理から、y が与えられた際の x の事後確率密度関数を計算できます。この関数により、y の目標値から確率の高いx の値を直接予測できます。直接的逆解析法は、モデルを真の意味で逆解析できるため、大量の仮想サンプルを生成する必要がなく、膨大な解空間でも即時的に y から x を計算できます。また、変数間の確率分布に基づいた予測をするため、合理的な x の提案となります。
直接的逆解析法により様々な材料設計を達成し、例えば熱電変換材料の実験データを用いた直接的逆解析により、熱伝導率・電気伝導率・ゼーベック係数のすべてが既存の材料を超越する熱電変換材料の実験条件 (各元素の配合割合や合成温度など) の提案に成功しました。さらに、生体材料の実験データとして実験条件や材料特性、そして動物実験後の骨形成率を用いて、骨形成率が既存のデータを超えるための材料特性の条件、およびその材料特性を達成するための実験条件を、それぞれ直接的逆解析で予測することを達成しました。なお、熱電変換材料および生体材料それぞれ、材料の実験条件と材料特性との間の本質的な関係 (特性発現のメカニズム) は複雑でしたが、数理モデルの直接的逆解析を可能にしました。これより、他の材料においても直接的逆解析法が効果的に機能すると考えられます。さらに下図より、数理モデルの直接的逆解析を適応的実験計画法に応用することで、ベイズ最適化と比較して実験回数を約3分の1に抑え、既存の y を大きく上回る実験条件を設計できることを確認しました。

直接的逆解析法による実験回数の削減および既存データを超越するyの実現

 

Datachemical LAB により実験科学者やエンジニアが実験・製造に集中できるようになりました

実験データ・製造データを扱ったり、数理モデルを構築したり、モデルに基づいて予測したり、新たな分子・材料・プロセスを設計したりするには、データ解析・機械学習の知識・知見・技術が必要です。データは嘘をつきませんが、誤ったデータ解析・機械学習によって人が嘘をついてしまうこともあります。さらに、実際にデータ解析・機械学習をするためには、Python をはじめとするプログラミングを学ぶ必要があります。データ解析・機械学習の他に、自身で実験・製造をする人にとっては、勉強・仕事・業務の時間が増えることになり、データ解析・機械学習を実践的に行うのは、かなりハードルが高いものでした。
しかし、Datachemical LAB がデータ解析・機械学習のハードルを大きく下げました。プログラミングのハードルは 0 になり (プログラミング不要)、データ解析・機械学習で人が嘘をつけないような仕組みがあるため、安心して結果を解釈できます。もちろんデータを準備することは必要ですが、データさえあればモデル構築や構築したモデルによる予測、そして分子・材料・プロセスの設計を自動的に行なってくれます。
Datachemical LAB ができるまでは、新たにデータ解析・機械学習を始める人にとって、その勉強やプログラミングなどが律速 (ボトルネック) になっていました。データ解析・機械学習は実験・製造をサポートする位置づけのため、データ解析・機械学習がボトルネックになるのはおかしな話です。
Datachemical LAB がデータ解析・機械学習のハードルを大幅に下げ、データ解析・機械学習を気軽に、プログラミングの勉強をすることなく行えるようになったことで、データ解析・機械学習ではないこと、すなわち本職の実験や製造に集中できるようになりました。ボトルネックが変わったといえます。
もちろん、Datachemical LAB の導入にはコストがかかります。ただ、そのコストによって実験科学者やエンジニアの方々の時間 (プログラミングを身につけたりデータ解析・機械学習を勉強したりする時間) を何時間も何日も、節約することができます。さらに、Datachemical LAB によるデータ解析・機械学習の活用により、例えばベイズ最適化や直接的逆解析などで、材料開発にかかる日数を何日も効率化することができることを考えると、Datachemical LAB の導入は非常に効果的といえます。
実験科学者やエンジニアがデータ解析・機械学習をしつつも、実験や製造に集中するため、Datachemical LAB は不可欠です。

Datachemical LAB による、次の効果的な実験条件・製造条件の提案

 

関連記事

Avatar photo

webmaster

投稿者の記事一覧

Chem-Station代表。早稲田大学理工学術院教授。専門は有機化学。主に有機合成化学。分子レベルでモノを自由自在につくる、最小の構造物設計の匠となるため分子設計化学を確立したいと考えている。趣味は旅行(日本は全県制覇、海外はまだ20カ国ほど)、ドライブ、そしてすべての化学情報をインターネットで発信できるポータルサイトを作ること。

関連記事

  1. 化学探偵Mr.キュリー6
  2. 電気化学ことはじめ(1) 何が必要なの??
  3. マテリアルズ・インフォマティクスの手法:条件最適化に用いられるベ…
  4. SFTSのはなし ~マダニとその最新情報 後編~
  5. コーヒーブレイク
  6. 第3回慶應有機合成化学若手シンポジウム
  7. カルコゲン結合でロジウム二核錯体の構造を制御する!
  8. 可視光で働く新しい光触媒を創出 -常識を覆す複合アニオンの新材料…

注目情報

ピックアップ記事

  1. 特許にまつわる初歩的なあれこれ その2
  2. IR情報から読み解く大手化学メーカーの比較
  3. 第122回―「分子軌道反応論の教科書を綴る」Ian Fleming教授
  4. 第62回―「再生医療・ドラッグデリバリーを発展させる高分子化学」Molly Shoichet教授
  5. システインから無機硫黄を取り出す酵素反応の瞬間を捉える
  6. 有機触媒によるトリフルオロボレート塩の不斉共役付加
  7. MOF 結晶表面の敏感な応答をリアルタイム観察
  8. 【書籍】機器分析ハンドブック2 高分子・分離分析編
  9. 日本薬学会第125年会
  10. 果たして作ったモデルはどのくらいよいのだろうか【化学徒の機械学習】

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2023年9月
 123
45678910
11121314151617
18192021222324
252627282930  

注目情報

最新記事

有馬温泉で鉄イオン水溶液について学んできた【化学者が行く温泉巡りの旅】

有馬温泉の金泉は、塩化物濃度と鉄濃度が日本の温泉の中で最も高い温泉で、黄褐色を呈する温泉です。この記…

HPLCをPATツールに変換!オンラインHPLCシステム:DirectInject-LC

これまでの自動サンプリング技術多くの製薬・化学メーカーはその生産性向上のため、有…

MEDCHEM NEWS 34-4 号「新しいモダリティとして注目を浴びる分解創薬」

日本薬学会 医薬化学部会の部会誌 MEDCHEM NEWS より、新たにオープン…

圧力に依存して還元反応が進行!~シクロファン構造を活用した新機能~

第686回のスポットライトリサーチは、北海道大学大学院理学研究院化学部門 有機化学第一研究室(鈴木孝…

第58回Vシンポ「天然物フィロソフィ2」を開催します!

第58回ケムステVシンポジウムの開催告知をさせて頂きます!今回のVシンポは、コロナ蔓延の年202…

第76回「目指すは生涯現役!ロマンを追い求めて」櫛田 創 助教

第76回目の研究者インタビューは、第56回ケムステVシンポ「デバイスとともに進化する未来の化学」の講…

第75回「デジタル技術は化学研究を革新できるのか?」熊田佳菜子 主任研究員

第75回目の研究者インタビューは、第56回ケムステVシンポ「デバイスとともに進化する未来の化学」の講…

第74回「理想的な医薬品原薬の製造法を目指して」細谷 昌弘 サブグループ長

第74回目の研究者インタビューは、第56回ケムステVシンポ「デバイスとともに進化する未来の化学」の講…

第57回ケムステVシンポ「祝ノーベル化学賞!金属有機構造体–MOF」を開催します!

第57回ケムステVシンポは、北川 進 先生らの2025年ノーベル化学賞受賞を記念して…

櫛田 創 Soh Kushida

櫛田 創(くしだそう)は日本の化学者である。筑波大学 数理物質系 物質工学域・助教。専門は物理化学、…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP