[スポンサーリンク]

化学者のつぶやき

新規化合物データチェックリストとWord整形プログラムver2

[スポンサーリンク]

こんにちは、Macyです。
以前こちらの記事で、NMRやMS、旋光度のデータを一つのExcelにまとめて管理し、NMR帰属の確認と補助が可能なExcelファイルを公開しました。
これをベースに、より高精度に書式変換が行えるプログラムにアップデートしたのでご紹介します。
新プログラムは以前公開したwebサーバーと同様のURLにver13として公開しました(こちらをクリック)。
軽微な点ですが、誤植を修正したのでver14としてアップロードし直しています(2025/12/08)。

–内包ファイル–
|– ExceltoWord_v1.txt:初期版VBAコード
|– ExceltoWord_v2.txt:Python版とほぼ同様のVBAコード、帰属チェックExcelファイルを指定して実行
|– ExceltoWord.py:python版、上記よりも少し高機能
|– 帰属チェックリストVer14.xlsx
|– マクロ有効化マニュアル20231004.pdf

自動で読みやすい形式にデータを整形

これまでのデータ出力欄は、セルの統合をしていたり、特徴量が規則的に並んでいなかったりと、プログラムで自動的にセルを見つけ出すのが極めて困難な状況でした。
そこで、プログラムに読ませるための新しい「Python」という名前のシートを作成し、データの種類(タイトル)とデータの内容の2列に全てのコンテンツを格納しました。

A列:データタイトル、B列:データ内容

 

ChatGPTでプログラム作成

過去に作成したVBAプログラムをベースに、ChatGPTに色々指示を出して、以下のようなプログラムを作成しました。
① 帰属チェックリスト.xlsxを指定して開く
② Pythonという名前のシートを参照し、A1:B5の内容を抽出
③ 化学式の数値下付きや核種の上付き、タイトルの太字、フォントサイズ、行間などのフォーマットを整えて、Wordに出力
④ 出力されたデータを再度チェックし、1H数の合計と13C数の合計を算出し、HRMS用の分子式のH数・C数と比較して整合性が取れているかチェック
⑤ 判定結果を末尾に記載
⑥ Excelファイル名_SI.docxという名前のWordファイルを保存

過去に公開したバージョンでは、文字列を検索し、カーソルを移動して範囲選択をして書式変更をかけるといったプログラムだったので、例外的なデータがあると対応できなくなっていました。
今回のバージョンでは、規則に則って書式を変換するプログラムになっているので、あらゆるケースに対応可能です。

 

Python実行環境の整備

このPythonプログラムは、再現性、安全性、柔軟性の観点からvenv(virtual environment)にて実行するのが良いです。
terminalやwindows powershellでvenvを構築する方法はChatGPTに次のように聞いて方法を教えてもらってください。

venvを<mac/windows>で構築する方法を教えて下さい。

venv環境ができたら、terminal上でvenvを有効化し、以下のコマンドで実行します。

以下最初のみ実行
pip install python-docx pandas openpyxl

以下のコマンドでpythonを実行:

cdコマンドでExceltoWord.pyを保存したディレクトリに移動

(mac)
python3 ExceltoWord.py ~/pass/to/帰属チェックリストVer13.xlsx
<python3で動かない場合はpythonコマンドを試してみてください。>

(windows)
python .\ExceltoWord.py .\帰属チェックリストVer13.xlsx
<ファイルが見つかりませんといわれる場合は、ExceltoWord.pyが存在するディレクトリにいないか、帰属チェックリストのpass指定が間違っています。>

 

おまけ: 実験項のミス発見AI

もうやっている人も多いかと思いますが、ChatGPTなどのオープンAIで機械的にSIの単純なミスを探すと大幅な時短になる上に、探しても見つからないミスまで見つかります。
全データを同時に読ませると判定精度が下がるので、読ませるデータは以下のように分類します。

  • 化合物タイトル+合成プロトコルの文章のみ
  • 化合物タイトル+NMR/MS/IR/mp/旋光度などのデータのみ
  • 化合物タイトル+合成プロトコルの文章+NMR/MS/IR/mp/旋光度などのデータ

テキストエディタなどにSI wordファイルの内容を添付し、上のようにデータを整形します。化合物タイトルはCompound Xという形式を推奨します。ブロックの判定がうまく行きやすくデータ抽出精度が上がります。
このテキストを.txtファイルとして保存し、ChatGPTにアップロードし、色々とチェックしてもらいましょう。論文の査読にもかなり使えます。

質問例1: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、帰属のH/C数がMSのH/C数と整合性が取れているか判定してください。
質問例2: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、MS記載の分子式からイオンを除き、分子量を算出してください。to give の後ろに続く(収量 (g or mg), 収率%)の値を取得し、分子量と収量(g or mg)から収量 (mol)および収率を計算してください。同一ブロック内の原料と思われる化合物の使用量(g, mol, 1 equiv.)のモル数を取得し、収率計算が正しいか判定して下さい。

表記ブレがあるとミス判定をすることがあるのですが、数値はあっているのにミス判定がでている場合は逆に表記ブレの疑いがあるので、間接的なミス発見も可能です。

おわりに

記事だけでは伝わりづらい部分もあると思いますので、ケムステSlack内のMacyにDMでご相談ください。
直接の連絡先を知っている人はご連絡いただければと思います。

 

関連記事

化学者のためのWordマクロ -Supporting Informationの作成作業効率化-
電子実験ノートSignals Notebookを紹介します ①
電子実験ノートSignals Notebookを紹介します ②
電子実験ノートSignals Notebookを紹介します ③
IASO R7の試薬データベースを構造式検索できるようにしてみた
電子実験ノートSignals Notebookを紹介します ④

Macy

投稿者の記事一覧

有機合成を専門とする教員。将来取り組む研究分野を探し求める「なんでも屋」。若いうちに色々なケミストリーに触れようと邁進中。

関連記事

  1. ケムステイブニングミキサー2016へ参加しよう!
  2. ADC薬 応用編:捨てられたきた天然物は宝の山?・タンパクも有機…
  3. SciFinder Future Leaders 2017: プ…
  4. ルテニウム触媒によるC-C結合活性化を介した水素移動付加環化型カ…
  5. ジャーナル編集ポリシーデータベース「Transpose」
  6. 日本化学会 第104春季年会 付設展示会ケムステキャンペーン P…
  7. 研究者の活躍の場は「研究職」だけなのだろうか?
  8. 嫌気性コリン代謝阻害剤の開発

注目情報

ピックアップ記事

  1. 育て!燃料電池を担う子供たち
  2. 電気化学と数理モデルを活用して、複雑な酵素反応の解析に成功
  3. 有機合成化学協会誌2023年7月号:ジボロン酸無水物触媒・E-E (E = Si, Ge, Sn)結合・擬複合糖質・官能基複合型有機分子触媒・植物概日時計制御分子
  4. 非平衡な外部刺激応答材料を「自律化」する
  5. ペロブスカイト太陽電池開発におけるマテリアルズ・インフォマティクスの活用
  6. 食品添加物はなぜ嫌われるのか: 食品情報を「正しく」読み解くリテラシー
  7. ポリフェノールに食品アレルギー予防効果
  8. ピレスロイド系殺虫剤のはなし~追加トピック~
  9. 日本化学会 第104春季年会 付設展示会ケムステキャンペーン Part3
  10. 活性マグネシウム

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

CIPイノベーション共創プログラム「有機電解合成の今:最新技術動向と化学品製造への応用の可能性」

日本化学会第106春季年会(2026)で開催されるシンポジウムの一つに、CIPセッション「有機電解合…

CIPイノベーション共創プログラム「世界を変えるバイオベンチャーの新たな戦略」

日本化学会第106春季年会(2026)で開催されるシンポジウムの一つに、CIPセッション「世界を変え…

年会特別企画「XAFSと化学:錯体, 触媒からリュウグウまで –放射光ことはじめ」

放射光施設を利用したX線吸収分光法(XAFS)は、物質の電子状態や局所構造を元素選択的に明らかにでき…

超公聴会 2026 で発表します!!【YouTube 配信】

超公聴会は、今年度博士号を取得する大学院生が公聴会の内容を持ち寄ってオンライン上で発表する会です。主…

日本化学会 第104春季年会 付設展示会ケムステキャンペーン Part II

さて、Part Iに引き続きPart II!年会をさらに盛り上げる企画として、2011年より…

凍結乾燥の常識を覆す!マイクロ波導入による乾燥時間短縮と効率化

「凍結乾燥は時間がかかるもの」と諦めていませんか?医薬品や食品、新素材開発において、品質を維…

日本化学会 第104春季年会 付設展示会ケムステキャンペーン Part I

まだ寒い日が続いておりますが、あっという間に3月になりました。今年も日本化学会春季年会の季節です。…

アムホテリシンBのはなし 70年前に開発された奇跡の抗真菌薬

Tshozoです。以前から自身の体調不良を記事にしているのですが、昨今流行りのAIには産み出せな…

反応操作をしなくても、化合物は変化する【プロセス化学者のつぶやき】

前回まで1. 設定温度と系内の実温度のお話2. 温度値をどう判断するか温度を測ること…

ジチオカーバメートラジカル触媒のデザイン〜三重項ビラジカルの新たな触媒機能を発見〜

第698回のスポットライトリサーチは、名古屋大学大学院工学研究科(大井研究室)博士後期課程1年の川口…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP