[スポンサーリンク]

化学書籍レビュー

化学のためのPythonによるデータ解析・機械学習入門

[スポンサーリンク]

hodaです。今回は筆者の勉強用に読んだ機械学習関連の書籍を紹介します。

概要

本書は、化学・化学工学分野でPythonを使って機械学習を行うための入門書です。
これまでに蓄積してきた実験/製造データをデータ解析・機械学習を用いて分析することで、いままでとはまったく別のアプローチで材料開発を加速させたり、プロセス管理を効率化・安定化させたりすることができます。なぜなら、実験や製造データは、目に見えない、研究者・技術者の知識・知見・経験・勘の宝庫だからです。そして、データ解析・機械学習を用いることで、これらを目に見える形にすることができるからです。
読者が一から実践できるよう、Pythonのインストール方法、データ解析・機械学習の基本理論から、材料設計、分子設計、プロセス管理について実際にサンプルプログラムとサンプルデータセットを使った実践までを丁寧に解説しています。
(引用:オーム社HP)

対象者

・化学系、化学工学系でデータ解析や機械学習に挑戦したい人。

・ケモインフォマティクスやマテリアルズインフォマティクスの経験が多少ある中級者も。

・線形代数を少しでも学んだ大学生以上。

内容

本書は3部構成になっており、第1部で「Pythonと統計の基礎知識」、第2部で「データ解析・機械学習の基礎」、第3部で「化学・化学工学データでの実践のしかた」を学びます。

第1部では機械学習でよく用いられるプログラミング言語のPythonの基礎(第1章)と、ヒストグラムや散布図などデータの図示についての説明があります(第2章)。

第2部では、多変量データ、データの前処理、主成分分析、階層的クラスタリング、非線形の可視化手法といった多変量データとデータの可視化の説明があります(第3章)。さらに回帰分析、クラス分類といった化学データを用いたモデリングに必要な知識を学ぶことができます(第4章)。モデルの適用範囲、データ密度、アンサンブル学習法といった回帰モデル・クラス分類モデルの適用範囲についても述べられています(第5章)。

第3部では、材料設計、分子設計・医薬品設計、化学構造の表現方法、化合物群の扱い、化学構造の数値化・生成の他、化合物のデータセットを扱うときの注意点、具体的なデータセットを用いた解析を学びます(第6章)。また化学工学データを用いる機械学習として化学プラントにおける推定制御・ソフトセンサー、時系列データ解析の特徴、モデルの劣化と適応型ソフトセンサー、データ解析・機械学習による化学プラントのプロセス管理(異常検出・異常診断)といった時系列データの解析についても述べられています(第7章)。

サンプルコード、サンプルデータもダウンロード可能です。

感想

本書の構成は大きく分けると第1部、第2部がデータ解析・機械学習の基礎、第3部が化学や化学工学における機械学習の実践になっています。全体的に各コードに対しての説明が詳しいため、数値やパラメーターの変更がしやすく実践に非常に役立つと思いました。

第1部では、データの図示の章が筆者のお気に入りです。データの図示は視覚情報として重要であり、本書はデータの図示方法について簡潔にまとまっているので非常にわかりやすいです。

第2部では教師なし学習であるPCA、断層的クラスタリングなどや教師あり学習であるサポートベクターマシン、ランダムフォレストなどが具体的にどのようなデータ処理がなされていくのか説明されています(教師なし学習、教師あり学習については過去記事をご参照ください)。本書の対象者に「線形代数を少しでも学んだ大学生以上」と記載したのはこの部分で一部行列が出てくるからです。数式を避けることなくしっかりと説明されているという印象を受けたので、タイトルに「機械学習入門」と書かれてはいますが、初心者だけでなくデータ解析・機械学習の経験が多少ある中級者であっても勉強になる書籍であると思います。数式も少なくないということで、数学が得意でない人たちが心配するかもしれませんが、図も多く挿入されているので理解を助けてくれると思います。他にも回帰モデル・クラス分類モデルの適用範囲について1章分説明されており、さらに発展的な内容も含まれていて、推定モデルの適応範囲についても詳しく学ぶことができます。

第3部の「化学・化学工学データの実践のしかた」は特に実践を意識した構成になっていると感じました。材料設計における機械学習の例として樹脂材料などのデータを用いながら第2部までに学習したデータの図示、教師なし学習、教師あり学習、そしてモデルの適応範囲と実践でも行うであろう順番に沿って説明されており、初心者でも内容を追って行きやすいと思います。分子設計では特に必要な化学構造をPythonで扱うための説明も簡潔でわかりやすいです。また、薬理活性に関する機械学習の一例も紹介されています。化学工学系の機械学習としては時系列データ解析に焦点を当てており、化学プラントにおける適切な機械学習のモデル構築方法の一例が示されていると思います。

筆者はすべてのサンプルコードを動かしてみたわけではありませんが、サンプルコード、サンプルデータも充実しており、基礎から実践の具体例までが詰まっていると思いました。

関連書籍

正誤表

明治大学理工学部応用化学科・金子研のホームページに本書の正誤表が掲載されていました。

関連リンク

金子研(明治大学理工学部応用化学科)による本書の紹介

ゼロから学ぶ機械学習【化学徒の機械学習】

表紙の画像はオーム社HPから引用しました。

hoda

投稿者の記事一覧

Python好きな学部生です。勉強しながら執筆します。

関連記事

  1. 実践・化学英語リスニング(3)生化学編: 世界トップの化学者と競…
  2. 化学のブレークスルー【有機化学編】
  3. 【書籍】新版 元素の小辞典
  4. 有機化学1000本ノック【命名法編】【立体化学編】
  5. Classics in Total Synthesis
  6. Small Molecule Medicinal Chemist…
  7. Handbook of Reagents for Organic…
  8. Side Reactions in Organic Synthe…

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. アンモニアがふたたび世界を変える ~第2次世界大戦中のとある出来事~
  2. もし炭素原子の手が6本あったら
  3. アメリカ大学院留学:研究室選びの流れ
  4. 【速報】2010年ノーベル物理学賞に英の大学教授2人
  5. 有機合成化学協会誌2021年5月号:『有機合成のブレークスルー』合成反応の選択性制御によるブレークスルー
  6. 経営戦略を成功に導く知財戦略【実践事例集】
  7. 採用が広がるユーグレナのバイオディーゼル燃料、ユーグレナバイオジェット燃料も完成
  8. Accufluor(NFPI-OTf)
  9. アノマー効果を説明できますか?
  10. ご注文は海外大学院ですか?〜選考編〜

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年4月
« 3月   5月 »
 1234
567891011
12131415161718
19202122232425
2627282930  

注目情報

注目情報

最新記事

自己組織化ねじれ双極マイクロ球体から円偏光発光の角度異方性に切り込む

第327回のスポットライトリサーチは、筑波大学大学院数理物質科学研究科 物性・分子工学専攻 山本・山…

第159回―「世界最大の自己組織化分子を作り上げる」佐藤宗太 特任教授

第159回の海外化学者インタビューは日本から、佐藤宗太 特任教授です。東京大学工学部応用化学科に所属…

π-アリルイリジウムに新たな光を

可視光照射下でのイリジウム触媒によるアリルアルコールの不斉アリル位アルキル化が開発されたキラルな…

うっかりドーピングの化学 -禁止薬物と該当医薬品-

「うっかりドーピング」という言葉をご存知でしょうか。禁止薬物に該当する成分を含む風邪…

第五回ケムステVプレミアレクチャー「キラルブレンステッド酸触媒の開発と新展開」

新型コロナ感染者数は大変なことになっていますが、無観客東京オリンピック盛り上がっ…

がん治療用の放射性物質、国内で10年ぶり製造へ…輸入頼みから脱却

政府は、がんの治療や臓器の検査をする医療用の放射性物質の国内製造を近く再開する。およそ10年ぶりとな…

三洋化成の新分野への挑戦

三洋化成と長瀬産業は、AI 技術を応用した人工嗅覚で匂いを識別する「匂いセンサー」について共同で事業…

ケムステSlack、開設二周年!

Chem-Stationが立ち上げた化学系オープンコミュニティ、ケムステSlackを開設して早くも二…

過酸がC–H結合を切ってメチル基を提供する

光増感剤とニッケル触媒を用いたC(sp3)–Hメチル化が開発された。合成終盤でのメチル化に威力を発揮…

化学の祭典!国際化学オリンピック ”53rd IChO 2021 Japan” 開幕!

2021年7月「オリンピック/パラリンピック 東京2020大会」も無観客ではあるものの無事開幕されま…

Chem-Station Twitter

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP