[スポンサーリンク]

一般的な話題

果たして作ったモデルはどのくらいよいのだろうか【化学徒の機械学習】

[スポンサーリンク]

hodaです。「ゼロから学ぶ機械学習」からだいぶ時間がたってしまいましたが、今回の記事では前回取り上げることのできなかったモデルの精度評価について取り上げたいと思います。今回は機械学習のうちの教師あり学習の話です。(教師あり学習???という方は前回の記事をご覧ください。)

『モデル』とは?

なんとなく『モデル』という言葉を使ってきましたが、ここでモデルとは何を指すのか確認したいと思います。

モデルと各変数との関係1

関数y = f(x)のように入力データxを関数に入れて出力yを得る、この関数y = f(x)に当たるものがモデルになります2。xに入る数字は数字1つというよりは行列みたいなイメージです。yが離散的である場合は出力変数を『ラベル』と呼ぶこともあります3

性能指標

性能指標はモデルを評価する際に使います。分類と回帰のときで使われる指標は異なります。

分類のとき

分類では複数のクラスへ正しく分類することを目的としています。出力yが離散であるときに用います。
犬と猫の分類や、特定の機能を持つか持たないか(activeとinactive)など、2つのクラスに分けることが多いでしょう。まずは2つのクラスに分類するモデルの評価基準について記したいと思います。

予測はポジティブで、実際もポジティブに分類されることを真陽性(True Positive)、
予測はポジティブで、実際はネガティブ分類されることを偽陽性(False Positive)、
予測はネガティブで、実際はポジティブに分類されることを偽陰性(False Negative)、
予測はネガティブで、実際もネガティブに分類されることを真陰性(True Negative)

の4つに分けることができます4

これは混同行列(Confusion matrix)と呼ばれます。

混同行列はモデルの性能評価に優れていますが、他のモデルと比較となると単純には比較しづらいです。そこで性能を具体的な数値として出力してくれる4つの指標を今回紹介します。

正解率 (Accuracy)…これが高いほど、クラスを正しく分類できていることを表します4

分類の性能指標はクラスが正しく分類されているかを表す正解率(Accuracy)を用いることもありますが、正解率だけ確認してモデルの精度を判断することはおすすめしません。

例えば犬と猫の写真100枚を見分けようとしようとして、100枚中92枚が犬の写真だった場合の正解率(Accuracy)を考えましょう。この場合100枚すべてを犬と予測したモデルでも正解率は92 %になります。高い正解率から良いモデルのように感じるかもしれませんが、一般的に同じ出力しかしないモデルは良いモデルとは言いがたいです。上記の例のように用意したデータセットのクラスに元々偏りがあることは少なくないため、モデルの性能評価は正解率以外からも判断する必要があります。

適合率 (Precision)…予測結果のうちの正解した割合を表します5

再現率 (Recall)…正解した予測結果が実際の正解のうちの割合を表します5

F値 (F1, F-measure)…複数の呼び方があります。適合率と再現率にはトレードオフの関係があるので、適合率と再現率のバランスの良さを見る指標です。これが高いと適合率と再現率に大きな偏りがなく高いことを表します。

 

ここでは詳しく紹介しませんが、他にもROC曲線やAUCなどの評価指標があります。

回帰のとき

回帰では、実測値と同じ数値に近くなるような出力yを目指します。出力yが連続であるときに用います。

平均二乗誤差 (Root Mean Square Error, RMSE)…誤差なので、小さいほどよいです。

平均絶対誤差(Mean Absolute Error, MAE)…RMSEと同様に誤差なので、小さいほど良いです。

決定係数(R2) …Excelでも近似曲線を設定すれば出てくる指標です。データが対象となる曲線からどの程度離れているかを表します。1に近いほど良い性能を、0に近いほどその性能は良くないことを示します。

回帰の性能指標評価では主にRMSE(平均二乗誤差)が使われ、外れ値が多い場合などはMAE(平均絶対誤差)が良いとされています6。これはRMSEの場合、1点だけでも大きな外れ値が存在すると誤差を二乗しているために全体の評価が著しく下がってしまうためです7

多クラス分類の場合

さきほどの分類の性能指標では2クラスに分類するときの話でした。少し考えると、分類するときはいつも2クラスなわけではないはずです。
2クラス以上に分類する多クラス分類(Multiclass Classification)ではどのような評価指標を用いれば良いのでしょうか。

多クラス分類の場合はクラス全体の平均の取り方がマイクロ平均マクロ平均の2種類あります8, 9

マイクロ平均Micro-average)…すべてのクラスの結果を重みづけなくフラットに評価します。クラスを超えて全体のパフォーマンスを知ることができます8

マクロ平均Macro-average)…特定のクラスのデータが少ないなどクラスごとにデータの偏りがある場合にデータの偏りによる影響を考慮したいときに用いると良いでしょう8

混同行列です。それぞれのクラスの真陽性、偽陽性をTP1、FP1というように表しています。TP1は実際も予測もクラス1に分類されているもの、FP1は予測ではクラス1だが実際はクラス1ではないものを表しています。

適合率のマイクロ平均から行きたいと思います。
混同行列から適合率のマイクロ平均は式で表すと以下のようになります。

次は適合率のマクロ平均を考えたいと思います。
各クラスに対して適合率を考えるため3つの混同行列を作り、それぞれの適合率を考えます。
例えば、クラス1に注目して、クラス1かクラス1ではないかというよう分類します。

他のクラスに足しても同様に計算します。

それぞれの適合率から適合率のマクロ平均の式は以下のようになります。

さらに拡張することにより、より多くのクラスを含む多クラス分類においても評価を行うことができます10

終わりに

今回取り上げたモデルの性能指標は化学系・材料系における機械学習だけでなく、機械学習全般に当てはまる話でした。モデルの性能評価にどのような指標が使われているのか注目してみると面白いかもしれません。

参考文献

全体の参考も含む

  1. 金子弘昌 著, Pythonで気軽に化学・化学工学, p. 147, 丸善出版, 2021
  2. 大曽根圭輔, 関喜史, 米田武 著, 現場で使える!Python機械学習入門, pp. 138-142, 翔泳社, 2019
  3. 大曽根圭輔, 関喜史, 米田武 著, 現場で使える!Python機械学習入門, p. 130, 翔泳社, 2019
  4. 金子弘昌 著, 化学のためのPythonによるデータ解析・機械学習入門, pp. 81-82, オーム社, 2019
  5. 島田達郎, 越水直人, 早川敦士, 山田育矢 著, Pythonによるはじめての機械学習プログラミング, p. 159, 技術評論社, 2019
  6. 下田倫大 監訳, scikit-learnとTensorFlowによる実践機械学習, pp. 37–39, オライリージャパン, 2018
  7. 堅田洋資, 菊田遥平, 谷田和章, 森本哲也 著, フリーライブラリで学ぶ機械学習入門, pp.37-38, 秀和システム, 2017
  8. 有賀康顕, 中山心太, 西林孝 著, 仕事で始める機械学習, pp. 65–75, オライリージャパン, 2018
  9. 中田秀基 訳, Pythonではじめる機械学習, pp. 292-295, オライリージャパン, 2017
  10. 福島真太朗 監訳, [第3版]Python機械学習プログラミング達人データサイエンティストによる理論と実践, p. 191, インプレス, 2020

式など全体の参考

11. 金子弘昌 著, 化学のためのPythonによるデータ解析・機械学習入門, pp. 55-57, オーム社, 2019

12. 下田倫大 監訳, scikit-learnとTensorFlowによる実践機械学習, pp. 86-89, オライリージャパン, 2018

関連リンク

ゼロから学ぶ機械学習【化学徒の機械学習】

化学のためのPythonによるデータ解析・機械学習入門(書籍レビュー)

関連書籍

scikit-learnとTensorFlowによる実践機械学習

scikit-learnとTensorFlowによる実践機械学習

Aurelien Geron, 下田倫大, 長尾高弘
Amazon product information
仕事ではじめる機械学習

仕事ではじめる機械学習

有賀康顕, 中山心太, 西林孝
Amazon product information

hoda

投稿者の記事一覧

大学院生です。ケモインフォマティクス→触媒

関連記事

  1. 新たな有用活性天然物はどのように見つけてくるのか~新規抗真菌剤m…
  2. どっちをつかう?:cooperateとcollaborate
  3. 【速報】2017年ノーベル化学賞は「クライオ電子顕微鏡の開発」に…
  4. 男性研究者、育休を取る。
  5. 親水性ひも状分子を疎水性空間に取り込むナノカプセル
  6. 化学者のためのエレクトロニクス講座~5Gで活躍する化学メーカー編…
  7. 分子レベルでお互いを見分けるゲル
  8. 多核テルビウムクラスターにおけるエネルギー移動機構の解明

注目情報

ピックアップ記事

  1. 窒素を挿入してペリレンビスイミドを曲げる〜曲面π共役分子の新設計指針の確立を目指して〜
  2. [5+1]環化戦略による触媒的置換シクロヘキサン合成
  3. 有機合成の進む道~先駆者たちのメッセージ~
  4. 第14回「らせん」分子の建築家ー八島栄次教授
  5. 【マイクロ波化学(株)医薬分野向けウェビナー】 #ペプチド #核酸 #有機合成 #凍結乾燥 第3のエネルギーがプロセスと製品を変える  マイクロ波適用例とスケールアップ
  6. 大学生向け”オイシイ”情報の集め方
  7. ペルフルオロデカリン (perfluorodecalin)
  8. 【9月開催】第十一回 マツモトファインケミカル技術セミナー   オルガチックスを用いたゾルゲル反応による金属酸化物膜の形成
  9. ウルリッヒ・ウィーズナー Ulrich Wiesner
  10. 極小の「分子ペンチ」開発

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年6月
 123456
78910111213
14151617181920
21222324252627
282930  

注目情報

最新記事

ラングミュアの吸着等温式 Langmuir equation

ラングミュアの吸着等温式 (Langmuir equation) は、等価な吸着サイトが独立に振舞い…

【化学・食品業界向け】 蒸留による分離・濃縮をシンプルで省エネに ~無機分離膜が起こすイノベーション~

■概要ものづくりにおいて重要な分離操作。有機溶剤の混合物の分離リサイクル。水の分離(脱水…

濃硫酸の1000倍強い超酸の中でも蛍光を保ち続ける”超酸耐性BODIPY”

第705回のスポットライトリサーチは、北海道大学大学院総合化学院(反応有機化学研究室)博士後期課程2…

安田修祥・裕美子 若手化学者留学支援事業

大学院生時代の経験として、海外留学は本当に素晴らしいものです。かくいう私も、1か…

有機合成化学協会誌2026年5月号:特集号 有機合成化学の力で切り拓く次世代モダリティの地平

有機合成化学協会が発行する有機合成化学協会誌、2026年5月号がオンラインで公開されています。…

チームディレクター募集(理化学研究所研究室主宰者、無期雇用職)

募集研究室理化学研究所 環境資源科学研究センター募集の概要国立研究開発法人理化学研究所で…

<製品サンプル進呈>細胞増殖/毒性測定 はじめてを応援キャンペーン【同仁化学研究所】

Cell Counting Kit-8(CCK-8)は同仁化学研究所で開発され、世界中で細胞増殖や細…

ポンコツ博士の国内奮闘録 ~博士、教員として過ごしてはや2年~

本稿は,少子化の影響が著しい地方私立大で学位を取得したとあるしがない博士(薬学)が、厳しい世の中を生…

2026年、過去最大規模の「有機溶媒危機」が始まった?

2026 年 2 月 28 日、アメリカとイスラエルがイランに対し軍事攻撃作戦を…

蒸留操作で水はどう動くのか【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか3. 反応操作をし…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP