[スポンサーリンク]

化学者のつぶやき

【python版】新規化合物データチェックリストとWord整形プログラムver2

[スポンサーリンク]

こんにちは、Macyです。
以前こちらの記事で、NMRやMS、旋光度のデータを一つのExcelにまとめて管理し、NMR帰属の確認と補助が可能なExcelファイルを公開しました。
これをベースに、より高精度に書式変換が行えるプログラムにアップデートしたのでご紹介します。
新プログラムは以前公開したwebサーバーと同様のURLにver13として公開しました(こちらをクリック)。
軽微な点ですが、誤植を修正したのでver14としてアップロードし直しています(2025/12/08)。

最新版をGitHubに公開しました。リリースノートや実装方法を詳細に解説しています。
また、Windows、Macユーザーともに、pythonを動かさずに済むように、簡便な実行方法も構築しました(2026/04/29更新)。

 

自動で読みやすい形式にデータを整形

これまでのデータ出力欄は、セルの統合をしていたり、特徴量が規則的に並んでいなかったりと、プログラムで自動的にセルを見つけ出すのが極めて困難な状況でした。
そこで、プログラムに読ませるための新しい「Python」という名前のシートを作成し、データの種類(タイトル)とデータの内容の2列に全てのコンテンツを格納しました。

A列:データタイトル、B列:データ内容

 

ChatGPTでプログラム作成

過去に作成したVBAプログラムをベースに、ChatGPTに色々指示を出して、以下のようなプログラムを作成しました。
① 帰属チェックリスト.xlsxを指定して開く
② Pythonという名前のシートを参照し、A1:B5の内容を抽出
③ 化学式の数値下付きや核種の上付き、タイトルの太字、フォントサイズ、行間などのフォーマットを整えて、Wordに出力
④ 出力されたデータを再度チェックし、1H数の合計と13C数の合計を算出し、HRMS用の分子式のH数・C数と比較して整合性が取れているかチェック
⑤ 判定結果を末尾に記載
⑥ Excelファイル名_SI.docxという名前のWordファイルを保存

過去に公開したバージョンでは、文字列を検索し、カーソルを移動して範囲選択をして書式変更をかけるといったプログラムだったので、例外的なデータがあると対応できなくなっていました。
今回のバージョンでは、規則に則って書式を変換するプログラムになっているので、あらゆるケースに対応可能です。

 

Python実行環境の整備

(pythonに馴染みのない人向けに、簡単に実行できる環境を整えました。詳細はGitHubを参照してください。以下は一般的なpythonの使用方法にもなるので、元記事のまま残しておきます。)
このPythonプログラムは、再現性、安全性、柔軟性の観点からvenv(virtual environment)にて実行するのが良いです。
terminalやwindows powershellでvenvを構築する方法はChatGPTに次のように聞いて方法を教えてもらってください。

venvを<mac/windows>で構築する方法を教えて下さい。

venv環境ができたら、terminal上でvenvを有効化し、以下のコマンドで実行します。

以下最初のみ実行
pip install python-docx pandas openpyxl

以下のコマンドでpythonを実行:

cdコマンドでExceltoWord.pyを保存したディレクトリに移動

(mac)
python3 ExceltoWord.py ~/pass/to/帰属チェックリストVer13.xlsx
<python3で動かない場合はpythonコマンドを試してみてください。>

(windows)
python .\ExceltoWord.py .\帰属チェックリストVer13.xlsx
<ファイルが見つかりませんといわれる場合は、ExceltoWord.pyが存在するディレクトリにいないか、帰属チェックリストのpass指定が間違っています。>

 

おまけ: 実験項のミス発見AI

もうやっている人も多いかと思いますが、ChatGPTなどのオープンAIで機械的にSIの単純なミスを探すと大幅な時短になる上に、探しても見つからないミスまで見つかります。
全データを同時に読ませると判定精度が下がるので、読ませるデータは以下のように分類します。

  • 化合物タイトル+合成プロトコルの文章のみ
  • 化合物タイトル+NMR/MS/IR/mp/旋光度などのデータのみ
  • 化合物タイトル+合成プロトコルの文章+NMR/MS/IR/mp/旋光度などのデータ

テキストエディタなどにSI wordファイルの内容を添付し、上のようにデータを整形します。化合物タイトルはCompound Xという形式を推奨します。ブロックの判定がうまく行きやすくデータ抽出精度が上がります。
このテキストを.txtファイルとして保存し、ChatGPTにアップロードし、色々とチェックしてもらいましょう。論文の査読にもかなり使えます。

質問例1: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、帰属のH/C数がMSのH/C数と整合性が取れているか判定してください。
質問例2: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、MS記載の分子式からイオンを除き、分子量を算出してください。to give の後ろに続く(収量 (g or mg), 収率%)の値を取得し、分子量と収量(g or mg)から収量 (mol)および収率を計算してください。同一ブロック内の原料と思われる化合物の使用量(g, mol, 1 equiv.)のモル数を取得し、収率計算が正しいか判定して下さい。

表記ブレがあるとミス判定をすることがあるのですが、数値はあっているのにミス判定がでている場合は逆に表記ブレの疑いがあるので、間接的なミス発見も可能です。

おわりに

記事だけでは伝わりづらい部分もあると思いますので、ケムステSlack内のMacyにDMでご相談ください。
直接の連絡先を知っている人はご連絡いただければと思います。

 

関連記事

化学者のためのWordマクロ -Supporting Informationの作成作業効率化-
電子実験ノートSignals Notebookを紹介します ①
電子実験ノートSignals Notebookを紹介します ②
電子実験ノートSignals Notebookを紹介します ③
IASO R7の試薬データベースを構造式検索できるようにしてみた
電子実験ノートSignals Notebookを紹介します ④

Macy

投稿者の記事一覧

有機合成を専門とする教員。将来取り組む研究分野を探し求める「なんでも屋」。若いうちに色々なケミストリーに触れようと邁進中。

関連記事

  1. C&EN コラム記事 ~Bench & Cu…
  2. 研究室でDIY!~エバポ用真空制御装置をつくろう~ ②
  3. CV書いてみた:ポスドク編
  4. プロトン共役電子移動を用いた半導体キャリア密度の精密制御
  5. 2009年ノーベル化学賞『リボソームの構造と機能の解明』
  6. (+)-フロンドシンBの超短工程合成
  7. 【9月開催】マイクロ波化学のQ&A付きセミナー
  8. 第四回ケムステVシンポ「持続可能社会をつくるバイオプラスチック」…

注目情報

ピックアップ記事

  1. トロスト不斉アリル位アルキル化反応 Trost Asymmetric Allylic Alkylation
  2. 化学英語論文/レポート執筆に役立つPCツール・決定版
  3. 軽量・透明・断熱!エアロゲル(aerogel)を身近に
  4. 小型質量分析装置expression® CMSを試してみた
  5. 米ファイザー、今期業績予想を上方修正・1株利益1.68ドルに
  6. 独自の有機不斉触媒反応を用いた (—)-himalensine Aの全合成
  7. 製薬各社の被災状況
  8. ジョン・アンソニー・ポープル Sir John Anthony Pople
  9. カンブリア爆発の謎に新展開
  10. 低分子医薬に代わり抗体医薬がトップに?

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

アンモニウム構造によりラジカル種の発生位置を完全に制御!

第710回のスポットライトリサーチは、関西学院大学理工学研究科 村上研究室の榊原 陽太(さかきばら …

化学つれづれ草【ある研究者の回想】

概要物理化学者で量子機能材料を専門とする著者によるエッセイ集.化学者としての研究,教育,人生…

第60回有機反応若手の会

開催概要有機反応若手の会は、有機化学分野で研究を行う全国の大学院生を中心とした若手研究者が集い、…

ノーベル賞受賞者と語り合う5日間!「第18回HOPEミーティング」参加者募集!

申し込みはこちら概要主催:独立行政法人 日本学術振興会(JSPS)開催地:神奈川…

光触媒による高効率なCO2還元の実現―まさかの光を弱く当てることが重要だった―

第709回のスポットライトリサーチは、東京科学大学 理学院(前田研究室)博士後期課程2年の仲田竜一 …

「π-πスタッキング」という言葉が生む誤解【芳香環の相互作用を見直す: 前編】

芳香環が平行に並んで近接しているとき、その構造を「π–π スタッキング」と表されることがよくあります…

一重項酸素によるC(sp2)−P結合切断を用いた長波長光によるリン化合物のアンケージング

第 708 回のスポットライトリサーチは、同志社女子大学 薬学部 医療薬学科 5…

マテリアルズ・インフォマティクスにおける画像解析の活用ガイド

開催概要材料開発において、電子顕微鏡やX線トモグラフィーを用いて材料の微細構造を観察するために画…

世界初のPROTAC医薬、ついに承認 ―「タンパク質を阻害する」から「分解する」時代へ

2026年5月、創薬化学の歴史に残る大きな出来事が起きました。米国 FDA は、…

有機蛍光とは異なる新しい有機りん光の分子設計指針の発見

第707回のスポットライトリサーチは、電気通信大学 情報理工学研究科(牧昌次郎研究室)の林希久也 助…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP