[スポンサーリンク]

分析化学

PythonとChatGPTを活用するスペクトル解析実践ガイド

[スポンサーリンク]

概要

ケモメトリクスと機械学習によるスペクトル解析を、Pythonの使い方と数学の基礎から実践まで一気通貫で解説。サポートページのソースコードですぐに始められる。
プログラムの解説動画を購入者限定で無料公開。(引用:講談社サイエンティフィック

対象者

  • スペクトルを取り扱う研究者,データサイエンティスト
  • 意欲ある大学生

目次

第1章 スペクトル解析の基礎知識
1.1 機器分析
1.2 分光分析とスペクトル
1.3 スペクトル解析
1.4 従来のスペクトル解析とPythonによるスペクトル解析
1.5 Pythonを使用する利点
1.6 機械学習とケモメトリクスのスペクトル解析への適用
1.6.1 機械学習とは
1.6.2 ケモメトリクスとは
1.6.3 ケモメトリクスと機械学習の違い
1.6.4 スペクトル解析における相関と因果の区別の重要性
1.6.5 検量線と検量モデル
1.7 相関と因果
1.8 ノーフリーランチ定理
コラム1:公理と定理

第2章 Pythonプログラミングの導入と基礎
2.1 Python(Jupyter Notebook)の環境構築
2.2 GitHubからのデータのダウンロード
2.3 Pythonプログラミング入門
2.3.1 キーボードショートカットとMarkdown
2.3.2 変数の取り扱い
2.3.3 リスト
2.3.4 タプル
2.3.5 bool型
2.3.6 if文
2.3.7 for文
2.3.8 関数の定義
2.4 ライブラリ
2.4.1 ライブラリとは
2.4.2 ライブラリのインストールとインポート
2.4.3 Pythonとライブラリのバージョンについて
2.4.4 ライブラリの利用方法

第3章 Pythonで理解する基礎統計
3.1 平均,分散,標準偏差
3.2 正規分布
3.3 データフレームの取り扱い
3.3.1 データフレームの作成
3.3.2 インデックスがないデータ
3.3.3 インデックスもカラム名もないデータ
3.3.4 データフレームの操作
3.4 pandasで正規分布を理解する
3.4.1 平均値と標準偏差の計算
3.4.2 ヒストグラムと正規分布のグラフの作成
3.4.3 Zスコアを用いた統計的指標の計算
3.5 母集団と標本,偶然誤差と系統誤差
3.6 点推定
3.7 区間推定
3.7.1 母集団の分散が既知の場合の信頼区間の求め方
3.7.2 母集団の分散が未知の場合の信頼区間の求め方
3.7.3 母集団の信頼区間の推定
3.8 対応のあるt検定
3.9 対応のないt検定
3.10 相関係数とp値

第4章 Pythonで理解する線形代数
4.1 行列の基本演算
4.1.1 行列の和,差,積
4.1.2 単位行列と逆行列
4.1.3 Pythonを用いた行列の基本演算
4.2 逆行列で連立方程式を解く
4.2.1 逆行列を用いた連立方程式の解き方
4.2.2 Pythonによる行列を用いた連立方程式の解き方
4.2.3 逆行列が求まらない連立方程式
4.2.4 単回帰分析(最小二乗法)
4.2.5 Python による単回帰分析(最小二乗法)
4.3 DataFrame(pandas)とndarray(NumPy)の関係
コラム2:バタフライ効果(グーテンベルグ・リヒター則と偶然性)

第5章 ChatGPTの効果的な使い方
5.1 ChatGPTの概要
5.2 ChatGPTの機能
5.2.1 プラグイン
5.2.2 ウェブブラウジング
5.2.3 Advanced data analysis
5.2.4 DALL‒E画像生成
5.2.5 MyGPTs
5.3 プロンプトエンジニアリング
5.3.1 プログラムの理解
5.3.2 プログラムのデバッグ
5.3.3 プログラムの更新
5.3.4 プログラムの生成
コラム3:社会学(相関と蓋然性)

第6章 ケモメトリクスの基礎知識
6.1 ランベルト・ベール則
6.2 古典的最小二乗(CLS)法
6.2.1 ランベルト・ベール則を拡張する
6.2.2 純スペクトル行列を解く(CLS 法)
6.2.3 CLS法の問題点
6.2.4 CLS法の実装
6.3 逆最小二乗(ILS)法
6.3.1 ILS法の特徴
6.3.2 ILS法の計算と欠点
6.3.3 ILS法の実装

第7章 ケモメトリクスの基礎知識:応用編
7.1 主成分分析(PCA)
7.1.1 PCAの概念
7.1.2 ローディングの性質
7.1.3 PCAローディングの性質をPython確認する
7.1.4 PCAと固有値問題(特異値分解)
7.1.5 中心化と標準化がローディングに与える影響
7.1.6 中心化と標準化がローディングに与える影響をPythonで確認する
7.1.7 スコアとローディングによるスペクトルの再構築
7.1.8 スコアとローディングによるスペクトルの再構築をPythonで確認する
7.1.9 主成分回帰(PCR)と最適な主成分数の決定(バリデーション)
7.1.10 クロスバリデーションとテストセット
コラム4:正確度と精度
7.2 部分的最小二乗回帰(PLS回帰)
7.2.1 PLS回帰の概要
7.2.2 ウェイトローディングとローディングの違い
7.2.3 ウェイトローディングとローディングの違いをPythonで確認する
7.3 スペクトル分解としてのケモメトリクス
コラム5:医療と治験

第8章 スペクトルデータの前処理
8.1 スペクトルデータの一括読み込み
8.2 横軸の間隔が異なるスペクトル
8.3 行方向(試料方向)の前処理
8.3.1 中心化と標準化
8.3.2 乗算的散乱補正(MSC)
8.4 列方向(波長方向)の前処理
8.4.1 スムージング,一次微分,二次微分による前処理
8.4.2 スムージング,一次微分,二次微分による前処理の実行
8.4.3 標準正規変量(SNV)による前処理の実行
8.5 前処理の関数のモジュール化
コラム6:ビッグデータとGAMAM

第9章 機械学習の基礎知識
9.1 クラスタリング
9.2 k近傍法
9.3 決定木をベースとしたアルゴリズム
9.3.1 ランダムフォレスト
9.3.2 勾配ブースティング
9.3.3 Pythonによる実践
9.4 重回帰分析(最小二乗法,最小絶対値法,リッジ回帰,ラッソ回帰)
9.5 サポートベクトルマシン(SVM)
9.5.1 SVMの損失関数
9.5.2 SVM(ハードマージン)の条件
9.5.3 SVM(ソフトマージン)の条件
9.5.4 主問題と双対問題(カーネル化と非線形判別分析)
9.5.5 SVM による非線形判別分析の実践
9.5.6 サポートベクトル回帰(SV回帰)
9.5.7 スペクトルに現れる非線形項
9.6 ニューラルネットワーク(NN)
Appendix SVM の主問題から双対問題への変換

第10章 スペクトル操作の実践
10.1 スペクトルデータの読み込み
10.2 箱ひげ図による目的変数の分布の把握
10.3 スペクトル表示
10.4 ピーク検出
10.5 相関スペクトル
10.6 ベースライン補正
10.7 カーブフィッティング
10.8 ヒートマップによるスペクトル表示

第11章 ケモメトリクスと機械学習の実践
11.1 アウトライヤーの検出と除去
11.2 各モジュールでの標準化自由度
11.3 PLSウェイトローディング,ローディング,回帰係数
11.4 ウェイトローディングと寄与率
11.5 GridSearchCVによるクロスバリデーション
11.6 パイプイラインを用いたモデルの最適化

第12章 ハイパースペクトルイメージング解析
12.1 RGB画像とハイパースペクトルイメージング(HSI)
12.2 NIR‒HSIデータの構造と読み込み
12.3 画像とスペクトルの抽出
12.4 木材試料領域のスペクトルと画像を抽出
12.4.1 任意の波長領域でのHSIとスペクトルの抽出
12.4.2 試料領域の抽出
12.5 PLS回帰を用いた目的変数の予測値の空間分布を可視化
12.6 HSIデータ解析への畳み込みニューラルネットワーク(CNN)の適用

あとがき
索引

・全320ページ

内容

様々な科学的機器を駆使して物質の物理的・化学的な分析を行うことを機器分析といいます。その中でも物質の光の吸収・放出を測定する分光分析は,物質の特性や濃度を把握するために,化学・生物・物理など多くの分野において活用されています。

分光分析においては,光の波長や周波数に応じた物質の応答(吸収・発光)の分布を考えることが多く,これは物質固有の特性を反映します。
このような分布をスペクトルと呼び,皆さんも1度は見たことのあるものだと思います (図1) 。

図1. オクタンのIRスペクトル(SDBSより引用)

単純な物質のスペクトルであればスペクトル測定装置に付属する専用のソフトウェアを用いて解析を行うだけで十分だと思われます。
多くの場合,専用のソフトウェアにはピークピッキング,カーブフィッティング,スペクトル分解といった基本的な解析機能を搭載しているためです。

しかしながら,複雑なスペクトルデータの解析や,大量のデータを扱う場合には,従来のソフトウェアでは対応できないことがあります。
これを補うためのソフトウェアも販売されてきましたが,新しい手法やアルゴリズムの適用にはアップデートが必要なことが多く,研究の妨げになることが多いです。

そのためスペクトルに対してケモメトリクスや機械学習を適用することで,定量・分類を皆さん自身の力で行うことが必要となり,本書はそれらの理論と実践の両方を丁寧に解説してくれます。

構成

皆さん自身がプログラムを駆使して解析を自由自在にできるようになるためには

  • プログラミング(Python)
  • 統計
  • ケモメトリクスと機械学習
  • スペクトル
  • 試料

などについて学ぶ必要があります。
本書では以上の内容を,初学者の人でも分かるように,丁寧な図解付きでプログラミングや統計学について解説してくれます。
私は主成分分析についてなんとなくの雰囲気を知っているだけで,自分でプログラミングすることはできない状態でしたが,本を読みながら基礎となる理論とプログラムの実装の仕方を学ぶことでしっかりを身につけることができました。

ChatGPTを活用しよう

プログラムを扱う上で今やChatGPTなどの大規模言語モデル (LLM) に基づく対話型生成AIは必須のツールとなりました。
本書ではChatGPTの概要から機能,そしてプロンプトエンジニアリングまで解説してくれます。
(ChatGPTに質問する文章のことをプロンプトと言い,これを工夫して目的の応答を得ること目指すことをプロンプトエンジニアリングと言います。)

例えば逆最小二乗 (ILS) 法によって,ある混合物の吸収スペクトルデータと既知の濃度データから,成分ごとの濃度を予測することプログラムを作成することを考えます。

何も考えずにChatGPTに対してプロンプトを投げて,プログラムを出力してもらうと,回答が間違える場合や,希望の回答が得られない場合があります。
本書では,そのようなミスを少なくするために,プロンプトの作成の仕方から学びます

また,希望の回答が得られた場合であっても,出力されたコードを正しく理解する必要があり,時間がかかってしまいます。
ChatGPTから出力されたコードでなくとも,他の人が作成したコードを理解することは難しいことが多いです。
そのような時でもChatGPTを活用することで,プログラムを素早く理解することができ,本書ではその方法についても学びます。

最後に,実際にコードを動かすと少々のデバッグ (プログラムのエラーや不具合を特定し,修正すること) が必要になることが多いです。
デバッグは非常に煩雑な作業ですが,適切なプロンプトを作成することで,ここでもChatGPTは強力な味方になってくれます。

本書ではILS法だけでなく,多くの手法や問題を取り上げながら,その1つ1つのプログラムの実装の仕方やChatGPTの使い方について解説してくれます。

関連書籍

関連記事

  1. 新課程視覚でとらえるフォトサイエンス化学図録
  2. 論文・学会発表に役立つ! 研究者のためのIllustrator素…
  3. 有機合成創造の軌跡―126のマイルストーン
  4. English for Writing Research Pap…
  5. 革新的医薬品の科学 薬理・薬物動態・代謝・安全性から合成まで
  6. 改正 研究開発力強化法
  7. カリカリベーコンはどうして美味しいにおいなの?
  8. 【書籍】有機スペクトル解析入門

注目情報

ピックアップ記事

  1. 資生堂:育毛成分アデノシン配合の発毛促進剤
  2. 有機合成化学協会誌2023年3月号:Cynaropicri・DPAGT1阻害薬・トリフルオロメチル基・イソキサゾール・触媒的イソシアノ化反応
  3. 20年新卒の志望業界ランキング、化学は総合3位にランクイン
  4. シャピロ反応 Shapiro Reaction
  5. 名古屋市科学館で化学してみた
  6. 「電子の動きを観る」ーマックスプランク研究所・ミュンヘン大学・Krausz研より
  7. 有機機能性色素におけるマテリアルズ・インフォマティクスの活用とは?
  8. 読むだけで身につく化学千夜一夜物語 食品、日用品から最先端技術まで75話
  9. 239th ACS National Meeting に行ってきた
  10. A-Phosパラジウム錯体

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年3月
 12
3456789
10111213141516
17181920212223
24252627282930
31  

注目情報

最新記事

miHub®で叶える、研究開発現場でのデータ活用と人材育成のヒント

参加申し込みする開催概要多くの化学・素材メーカー様でMI導入が進む一…

医薬品容器・包装材市場について調査結果を発表

この程、TPCマーケティングリサーチ株式会社(本社=大阪市西区、代表取締役社長=松本竜馬)は、医…

X 線回折の基礎知識【原理 · 基礎知識編】

X 線回折 (X-ray diffraction) は、原子の配列に関する情報を得るために使われる分…

有機合成化学協会誌2026年1月号:エナミンの極性転換・2-メチル-6-ニトロ安息香酸無水物(MNBA)・細胞内有機化学反応・データ駆動型マルチパラメータスクリーニング・位置選択的重水素化法

有機合成化学協会が発行する有機合成化学協会誌、2026年1月号がオンラインで公開されています。…

偶然と観察と探求の成果:中毒解毒剤から窒素酸化物を窒素分子へ変換する分子へ!

第692回のスポットライトリサーチは、同志社大学大学院理工学研究科(小寺・北岸研究室)博士後期課程3…

嬉野温泉で論文執筆缶詰め旅行をしてみた【化学者が行く温泉巡りの旅】

論文を書かなきゃ!でもせっかくの休暇なのでお出かけしたい! そうだ!人里離れた温泉地で缶詰めして一気…

光の強さで分子集合を巧みに制御!様々な形を持つ非平衡超分子集合体の作り分けを実現

第691回のスポットライトリサーチは、千葉大学大学院 融合理工学府 分子集合体化学研究室(矢貝研究室…

化学系研究職の転職は難しいのか?求人動向と転職を成功させる考え方

化学系研究職の転職の難点は「専門性のニッチさ」と考えられることが多いですが、企業が求めるのは研究プロ…

\課題に対してマイクロ波を試してみたい方へ/オンライン個別相談会

プロセスの脱炭素化及び効率化のキーテクノロジーである”マイクロ波”について、今回は、適用を検討してみ…

四国化成ってどんな会社?

私たち四国化成ホールディングス株式会社は、企業理念「独創力」を掲げ、「有機合成技術」…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP