果たして作ったモデルはどのくらいよいのだろうか【化学徒の機械学習】

[スポンサーリンク]

一般的な話題

果たして作ったモデルはどのくらいよいのだろうか【化学徒の機械学習】

2021/6/30
一般的な話題, 化学者のつぶやき
ケモインフォマティクス, マテリアルズインフォマティクス, 機械学習, 評価指標
コメント: 0
投稿者: hoda

[スポンサーリンク]

hodaです。「ゼロから学ぶ機械学習」からだいぶ時間がたってしまいましたが、今回の記事では前回取り上げることのできなかったモデルの精度評価について取り上げたいと思います。今回は機械学習のうちの教師あり学習の話です。（教師あり学習？？？という方は前回の記事をご覧ください。）

『モデル』とは?

なんとなく『モデル』という言葉を使ってきましたが、ここでモデルとは何を指すのか確認したいと思います。

モデルと各変数との関係¹

関数y = f(x)のように入力データxを関数に入れて出力yを得る、この関数y = f(x)に当たるものがモデルになります²。xに入る数字は数字１つというよりは行列みたいなイメージです。yが離散的である場合は出力変数を『ラベル』と呼ぶこともあります³。

性能指標

性能指標はモデルを評価する際に使います。分類と回帰のときで使われる指標は異なります。

分類のとき

分類では複数のクラスへ正しく分類することを目的としています。出力ｙが離散であるときに用います。
犬と猫の分類や、特定の機能を持つか持たないか(activeとinactive)など、2つのクラスに分けることが多いでしょう。まずは2つのクラスに分類するモデルの評価基準について記したいと思います。

予測はポジティブで、実際もポジティブに分類されることを真陽性（True Positive）、
予測はポジティブで、実際はネガティブ分類されることを偽陽性（False Positive）、
予測はネガティブで、実際はポジティブに分類されることを偽陰性（False Negative）、
予測はネガティブで、実際もネガティブに分類されることを真陰性（True Negative）

の４つに分けることができます⁴。

これは混同行列（Confusion matrix）と呼ばれます。

混同行列はモデルの性能評価に優れていますが、他のモデルと比較となると単純には比較しづらいです。そこで性能を具体的な数値として出力してくれる４つの指標を今回紹介します。

正解率 (Accuracy)…これが高いほど、クラスを正しく分類できていることを表します⁴。

分類の性能指標はクラスが正しく分類されているかを表す正解率（Accuracy）を用いることもありますが、正解率だけ確認してモデルの精度を判断することはおすすめしません。

例えば犬と猫の写真100枚を見分けようとしようとして、100枚中92枚が犬の写真だった場合の正解率（Accuracy）を考えましょう。この場合100枚すべてを犬と予測したモデルでも正解率は92 %になります。高い正解率から良いモデルのように感じるかもしれませんが、一般的に同じ出力しかしないモデルは良いモデルとは言いがたいです。上記の例のように用意したデータセットのクラスに元々偏りがあることは少なくないため、モデルの性能評価は正解率以外からも判断する必要があります。

適合率 (Precision）…予測結果のうちの正解した割合を表します⁵。

再現率 (Recall)…正解した予測結果が実際の正解のうちの割合を表します⁵。

F値 (F1, F-measure)…複数の呼び方があります。適合率と再現率にはトレードオフの関係があるので、適合率と再現率のバランスの良さを見る指標です。これが高いと適合率と再現率に大きな偏りがなく高いことを表します。

ここでは詳しく紹介しませんが、他にもROC曲線やAUCなどの評価指標があります。

回帰のとき

回帰では、実測値と同じ数値に近くなるような出力ｙを目指します。出力ｙが連続であるときに用います。

平均二乗誤差 (Root Mean Square Error, RMSE)…誤差なので、小さいほどよいです。

平均絶対誤差（Mean Absolute Error, MAE）…RMSEと同様に誤差なので、小さいほど良いです。

決定係数(R²) …Excelでも近似曲線を設定すれば出てくる指標です。データが対象となる曲線からどの程度離れているかを表します。1に近いほど良い性能を、０に近いほどその性能は良くないことを示します。

回帰の性能指標評価では主にRMSE（平均二乗誤差）が使われ、外れ値が多い場合などはMAE（平均絶対誤差）が良いとされています⁶。これはRMSEの場合、1点だけでも大きな外れ値が存在すると誤差を二乗しているために全体の評価が著しく下がってしまうためです⁷。

多クラス分類の場合

さきほどの分類の性能指標では2クラスに分類するときの話でした。少し考えると、分類するときはいつも2クラスなわけではないはずです。
2クラス以上に分類する多クラス分類（Multiclass Classification）ではどのような評価指標を用いれば良いのでしょうか。

多クラス分類の場合はクラス全体の平均の取り方がマイクロ平均とマクロ平均の２種類あります^{8, 9}。

マイクロ平均（Micro-average）…すべてのクラスの結果を重みづけなくフラットに評価します。クラスを超えて全体のパフォーマンスを知ることができます⁸。

マクロ平均（Macro-average）…特定のクラスのデータが少ないなどクラスごとにデータの偏りがある場合にデータの偏りによる影響を考慮したいときに用いると良いでしょう⁸。

混同行列です。それぞれのクラスの真陽性、偽陽性をTP1、FP1というように表しています。TP1は実際も予測もクラス１に分類されているもの、FP1は予測ではクラス1だが実際はクラス１ではないものを表しています。

適合率のマイクロ平均から行きたいと思います。
混同行列から適合率のマイクロ平均は式で表すと以下のようになります。

次は適合率のマクロ平均を考えたいと思います。
各クラスに対して適合率を考えるため３つの混同行列を作り、それぞれの適合率を考えます。
例えば、クラス１に注目して、クラス1かクラス１ではないかというよう分類します。

他のクラスに足しても同様に計算します。

それぞれの適合率から適合率のマクロ平均の式は以下のようになります。

さらに拡張することにより、より多くのクラスを含む多クラス分類においても評価を行うことができます¹⁰。

終わりに

今回取り上げたモデルの性能指標は化学系・材料系における機械学習だけでなく、機械学習全般に当てはまる話でした。モデルの性能評価にどのような指標が使われているのか注目してみると面白いかもしれません。

参考文献

全体の参考も含む

金子弘昌著, Pythonで気軽に化学・化学工学, p. 147, 丸善出版, 2021
大曽根圭輔, 関喜史, 米田武著, 現場で使える！Python機械学習入門, pp. 138-142, 翔泳社, 2019
大曽根圭輔, 関喜史, 米田武著, 現場で使える！Python機械学習入門, p. 130, 翔泳社, 2019
金子弘昌著, 化学のためのPythonによるデータ解析・機械学習入門, pp. 81-82, オーム社, 2019
島田達郎, 越水直人, 早川敦士, 山田育矢著, Pythonによるはじめての機械学習プログラミング, p. 159, 技術評論社, 2019
下田倫大監訳, scikit-learnとTensorFlowによる実践機械学習, pp. 37–39, オライリージャパン, 2018
堅田洋資, 菊田遥平, 谷田和章, 森本哲也著, フリーライブラリで学ぶ機械学習入門, pp.37-38, 秀和システム, 2017
有賀康顕, 中山心太, 西林孝著, 仕事で始める機械学習, pp. 65–75, オライリージャパン, 2018
中田秀基訳, Pythonではじめる機械学習, pp. 292-295, オライリージャパン, 2017
福島真太朗監訳, [第3版]Python機械学習プログラミング達人データサイエンティストによる理論と実践, p. 191, インプレス, 2020

式など全体の参考

11. 金子弘昌著, 化学のためのPythonによるデータ解析・機械学習入門, pp. 55-57, オーム社, 2019

12. 下田倫大監訳, scikit-learnとTensorFlowによる実践機械学習, pp. 86-89, オライリージャパン, 2018

hoda

投稿者の記事一覧

大学院生です。ケモインフォマティクス→触媒

第20回ケムステVシンポ『アカデミア創薬 A to Z』を開催します！

浜松ホトニクスがケムステVプレミアレクチャーに協賛しました

注目情報

ピックアップ記事

TMSClを使ってチタンを再生！チタン触媒を用いたケトン合成
- 2023/9/10
奈良坂・プラサード還元 Narasaka-Prasad Reduction
- 2019/7/14
メリフィールド氏死去　ノーベル化学賞受賞者
- 2006/5/23
製薬各社　2010年度第２四半期決算を発表
- 2010/10/31
3日やったらやめられない：独自配位子開発と応用
- 2017/2/14
危険物に関する法令：危険物の標識・掲示板
- 2005/6/17
CSJカレントレビューシリーズ書評
- 2018/1/6
非相溶元素間の原子拡散障壁が未踏結晶相形成に及ぼす影響を解明
- 2025/10/14
論文執筆で気をつけたいこと２０（１）
- 2017/9/5
特許にまつわる初歩的なあれこれ　その1
- 2014/7/28

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年6月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

注目情報

最新記事

フィーゼルマンチオフェン合成／Fiesselmann Thiophene Synthesis

概要フィーゼルマンチオフェン合成（Fiesselmann Thiophene Synthesi…

2026/7/28
F, odos　有機反応データベース

“とび跳ねる水滴”に潜む物理〜接触時間とエネルギー源で読む撥水・防氷のテク〜

熱したフライパンに落ちた水滴が、玉になってコロコロと走り回り、冷えた面では、結露水が合体した瞬間に跳…

2026/7/28
化学者のつぶやき, 日常から, 論文

AI時代に研究者がすでに持っている力・これから伸ばしたい力

論文要約や文献検索など、研究現場でもAI活用が日常化する一方、「自分の仕事の先行き」に漠然とした不安…

2026/7/27
化学者のつぶやき, 日常から

miHub®を活用した探索的データ解析の実践

開催概要研究開発においてデータ活用が進む中、機械学習モデルの構築や予測解析に…

2026/7/25
archives, セミナー, 会告, 化学者のつぶやき

“ある特効薬”のはなし　～本田宗一郎氏の回想から

Tshozoです。最近実家に戻っては色々と廃棄するなどの店じまいを少しずつ進めているのですが、中…

2026/7/24
一般的な話題, 化学者のつぶやき

高分子鎖を束ねた新しい共重合体「束状共重合体」が誕生

第715回のスポットライトリサーチは、東京大学大学院工学系研究科（植村研究室）に所属されていた亀谷…

2026/7/23
スポットライトリサーチ, 化学者のつぶやき

2026年「有機溶媒危機」へのアンサー。北大発・メカノクロスが挑む、溶媒に依存しない新たな合成法＝ “メカノケミカル有機合成”の社会実装

株式会社メカノクロスは、メカノケミカル有機合成技術の社会実装に挑む北海道大学発の…

2026/7/22
一般的な話題, 化学者のつぶやき, 実験・テクニック

“壊れないよう” に作ってきた半導体ポリマーを、あえて “壊れるよう” に作る化学

半導体ポリマーは長いあいだ、「いかに壊れにくく、長持ちさせるか」といったような安定性を競って進歩して…

2026/7/22
化学者のつぶやき, 論文

有機合成化学協会誌2026年7月号：固体高分子電解質・電子ドナー・アクセプター錯体・機械学習法・trichodermamide類・エナンチオ選択的スキップジエン合成法

有機合成化学協会が発行する有機合成化学協会誌、2026年7月号がオンラインで公開されています。…

2026/7/21
一般的な話題, 化学者のつぶやき

第62回Vシンポ「見えない空気を科学する～センサによる室内環境・臭気の見える化と快適空間デザインの最前線～」を開催します！

こんにちは、Macyです。第62回Vシンポのご案内をさせていただきます。今回は、前回同様…

2026/7/20
ケムステVシンポ, 化学者のつぶやき

一般的な話題

果たして作ったモデルはどのくらいよいのだろうか【化学徒の機械学習】

『モデル』とは?

性能指標

分類のとき

回帰のとき

多クラス分類の場合

終わりに

参考文献

関連リンク

関連書籍

hoda

関連記事

注目情報

ピックアップ記事

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

注目情報

最新記事

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

ケムステチャンネル

Chem-Station (ケムステ)

化学ポータルサイト