[スポンサーリンク]

化学書籍レビュー

化学のためのPythonによるデータ解析・機械学習入門

[スポンサーリンク]

hodaです。今回は筆者の勉強用に読んだ機械学習関連の書籍を紹介します。

概要

本書は、化学・化学工学分野でPythonを使って機械学習を行うための入門書です。
これまでに蓄積してきた実験/製造データをデータ解析・機械学習を用いて分析することで、いままでとはまったく別のアプローチで材料開発を加速させたり、プロセス管理を効率化・安定化させたりすることができます。なぜなら、実験や製造データは、目に見えない、研究者・技術者の知識・知見・経験・勘の宝庫だからです。そして、データ解析・機械学習を用いることで、これらを目に見える形にすることができるからです。
読者が一から実践できるよう、Pythonのインストール方法、データ解析・機械学習の基本理論から、材料設計、分子設計、プロセス管理について実際にサンプルプログラムとサンプルデータセットを使った実践までを丁寧に解説しています。
(引用:オーム社HP)

対象者

・化学系、化学工学系でデータ解析や機械学習に挑戦したい人。

・ケモインフォマティクスやマテリアルズインフォマティクスの経験が多少ある中級者も。

・線形代数を少しでも学んだ大学生以上。

内容

本書は3部構成になっており、第1部で「Pythonと統計の基礎知識」、第2部で「データ解析・機械学習の基礎」、第3部で「化学・化学工学データでの実践のしかた」を学びます。

第1部では機械学習でよく用いられるプログラミング言語のPythonの基礎(第1章)と、ヒストグラムや散布図などデータの図示についての説明があります(第2章)。

第2部では、多変量データ、データの前処理、主成分分析、階層的クラスタリング、非線形の可視化手法といった多変量データとデータの可視化の説明があります(第3章)。さらに回帰分析、クラス分類といった化学データを用いたモデリングに必要な知識を学ぶことができます(第4章)。モデルの適用範囲、データ密度、アンサンブル学習法といった回帰モデル・クラス分類モデルの適用範囲についても述べられています(第5章)。

第3部では、材料設計、分子設計・医薬品設計、化学構造の表現方法、化合物群の扱い、化学構造の数値化・生成の他、化合物のデータセットを扱うときの注意点、具体的なデータセットを用いた解析を学びます(第6章)。また化学工学データを用いる機械学習として化学プラントにおける推定制御・ソフトセンサー、時系列データ解析の特徴、モデルの劣化と適応型ソフトセンサー、データ解析・機械学習による化学プラントのプロセス管理(異常検出・異常診断)といった時系列データの解析についても述べられています(第7章)。

サンプルコード、サンプルデータもダウンロード可能です。

感想

本書の構成は大きく分けると第1部、第2部がデータ解析・機械学習の基礎、第3部が化学や化学工学における機械学習の実践になっています。全体的に各コードに対しての説明が詳しいため、数値やパラメーターの変更がしやすく実践に非常に役立つと思いました。

第1部では、データの図示の章が筆者のお気に入りです。データの図示は視覚情報として重要であり、本書はデータの図示方法について簡潔にまとまっているので非常にわかりやすいです。

第2部では教師なし学習であるPCA、断層的クラスタリングなどや教師あり学習であるサポートベクターマシン、ランダムフォレストなどが具体的にどのようなデータ処理がなされていくのか説明されています(教師なし学習、教師あり学習については過去記事をご参照ください)。本書の対象者に「線形代数を少しでも学んだ大学生以上」と記載したのはこの部分で一部行列が出てくるからです。数式を避けることなくしっかりと説明されているという印象を受けたので、タイトルに「機械学習入門」と書かれてはいますが、初心者だけでなくデータ解析・機械学習の経験が多少ある中級者であっても勉強になる書籍であると思います。数式も少なくないということで、数学が得意でない人たちが心配するかもしれませんが、図も多く挿入されているので理解を助けてくれると思います。他にも回帰モデル・クラス分類モデルの適用範囲について1章分説明されており、さらに発展的な内容も含まれていて、推定モデルの適応範囲についても詳しく学ぶことができます。

第3部の「化学・化学工学データの実践のしかた」は特に実践を意識した構成になっていると感じました。材料設計における機械学習の例として樹脂材料などのデータを用いながら第2部までに学習したデータの図示、教師なし学習、教師あり学習、そしてモデルの適応範囲と実践でも行うであろう順番に沿って説明されており、初心者でも内容を追って行きやすいと思います。分子設計では特に必要な化学構造をPythonで扱うための説明も簡潔でわかりやすいです。また、薬理活性に関する機械学習の一例も紹介されています。化学工学系の機械学習としては時系列データ解析に焦点を当てており、化学プラントにおける適切な機械学習のモデル構築方法の一例が示されていると思います。

筆者はすべてのサンプルコードを動かしてみたわけではありませんが、サンプルコード、サンプルデータも充実しており、基礎から実践の具体例までが詰まっていると思いました。

関連書籍

正誤表

明治大学理工学部応用化学科・金子研のホームページに本書の正誤表が掲載されていました。

関連リンク

金子研(明治大学理工学部応用化学科)による本書の紹介

Pythonで気軽に化学・化学工学(書籍レビュー)

ゼロから学ぶ機械学習【化学徒の機械学習】

表紙の画像はオーム社HPから引用しました。

hoda

投稿者の記事一覧

学部生です。ケモインフォマティクス→触媒

関連記事

  1. 実験室の笑える?笑えない!事故実例集
  2. ヘゲダス遷移金属による有機合成
  3. Dead Ends And Detours: Direct Wa…
  4. 学振申請書の書き方とコツ
  5. Reaction and Synthesis: In the O…
  6. 理系のための就活ガイド
  7. 入門 レアアースの化学 
  8. 化学産業を担う人々のための実践的研究開発と企業戦略

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. DNAを切らずにゲノム編集-一塩基変換法の開発
  2. 自動車のスリ傷を高熱で自己修復する塗料
  3. なぜ青色LEDがノーベル賞なのか?ー性能向上・量産化編
  4. 遷移金属を用いない脂肪族C-H結合のホウ素化
  5. ゴードン会議に参加して:ボストン周辺滞在記 PartI
  6. 芳香族メチルの酸化 Oxidation of Methyl Group of Aryl Compounds
  7. 論説フォーラム「研究の潮目が変わったSDGsは化学が主役にーさあ、始めよう!」
  8. α‐リポ酸の脂肪蓄積抑制作用を高める効果を実証
  9. 有機合成化学 vs. 合成生物学 ― 将来の「薬作り」を席巻するのはどっち?
  10. 化学者のためのエレクトロニクス講座~無電解貴金属めっきの各論編~

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年4月
 1234
567891011
12131415161718
19202122232425
2627282930  

注目情報

最新記事

【十全化学】新卒採用情報

当社は行動指針の一つとして、「会社と仕事を通じて自己成長を遂げ、仕事を愉しもう!…

【十全化学】核酸医薬のGMP製造への挑戦

「核酸医薬」と聞いて、真っ先に思い起こすのは、COVID-19に対するmRNAワ…

十全化学株式会社ってどんな会社?

私たち十全化学は、医薬品の有効成分である原薬及び重要中間体の製造受託を担っている…

化学者と不妊治療

これは理系の夫視点で書いた、私たち夫婦の不妊治療の体験談です。ケムステ読者で不妊に悩まれている方の参…

リボフラビンを活用した光触媒製品の開発

ビタミン系光触媒ジェンタミン®は、リボフラビン(ビタミンB2)を活用した光触媒で…

紅麹を含むサプリメントで重篤な健康被害、原因物質の特定急ぐ

健康食品 (機能性表示食品) に関する重大ニュースが報じられました。血中コレステ…

ユシロ化学工業ってどんな会社?

1944年の創業から培った技術力と信頼で、こっそりセカイを変える化学屋さん。ユシロ化学の事業内容…

日本薬学会第144年会付設展示会ケムステキャンペーン

日本化学会の年会も終わりましたね。付設展示会キャンペーンもケムステイブニングミキ…

ペプチドのN末端でのピンポイント二重修飾反応を開発!

第 605回のスポットライトリサーチは、中央大学大学院 理工学研究科 応用化学専…

材料・製品開発組織における科学的考察の風土のつくりかた ー マテリアルズ・インフォマティクスを活用し最大限の成果を得るための筋の良いテーマとは ー

開催日:2024/03/27 申込みはこちら■開催概要材料開発を取り巻く競争や環境が激し…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP