[スポンサーリンク]

化学者のつぶやき

新規化合物データチェックリストとWord整形プログラムver2

[スポンサーリンク]

こんにちは、Macyです。
以前こちらの記事で、NMRやMS、旋光度のデータを一つのExcelにまとめて管理し、NMR帰属の確認と補助が可能なExcelファイルを公開しました。
これをベースに、より高精度に書式変換が行えるプログラムにアップデートしたのでご紹介します。
新プログラムは以前公開したwebサーバーと同様のURLにver13として公開しました(こちらをクリック)。
軽微な点ですが、誤植を修正したのでver14としてアップロードし直しています(2025/12/08)。

–内包ファイル–
|– ExceltoWord_v1.txt:初期版VBAコード
|– ExceltoWord_v2.txt:Python版とほぼ同様のVBAコード、帰属チェックExcelファイルを指定して実行
|– ExceltoWord.py:python版、上記よりも少し高機能
|– 帰属チェックリストVer14.xlsx
|– マクロ有効化マニュアル20231004.pdf

自動で読みやすい形式にデータを整形

これまでのデータ出力欄は、セルの統合をしていたり、特徴量が規則的に並んでいなかったりと、プログラムで自動的にセルを見つけ出すのが極めて困難な状況でした。
そこで、プログラムに読ませるための新しい「Python」という名前のシートを作成し、データの種類(タイトル)とデータの内容の2列に全てのコンテンツを格納しました。

A列:データタイトル、B列:データ内容

 

ChatGPTでプログラム作成

過去に作成したVBAプログラムをベースに、ChatGPTに色々指示を出して、以下のようなプログラムを作成しました。
① 帰属チェックリスト.xlsxを指定して開く
② Pythonという名前のシートを参照し、A1:B5の内容を抽出
③ 化学式の数値下付きや核種の上付き、タイトルの太字、フォントサイズ、行間などのフォーマットを整えて、Wordに出力
④ 出力されたデータを再度チェックし、1H数の合計と13C数の合計を算出し、HRMS用の分子式のH数・C数と比較して整合性が取れているかチェック
⑤ 判定結果を末尾に記載
⑥ Excelファイル名_SI.docxという名前のWordファイルを保存

過去に公開したバージョンでは、文字列を検索し、カーソルを移動して範囲選択をして書式変更をかけるといったプログラムだったので、例外的なデータがあると対応できなくなっていました。
今回のバージョンでは、規則に則って書式を変換するプログラムになっているので、あらゆるケースに対応可能です。

 

Python実行環境の整備

このPythonプログラムは、再現性、安全性、柔軟性の観点からvenv(virtual environment)にて実行するのが良いです。
terminalやwindows powershellでvenvを構築する方法はChatGPTに次のように聞いて方法を教えてもらってください。

venvを<mac/windows>で構築する方法を教えて下さい。

venv環境ができたら、terminal上でvenvを有効化し、以下のコマンドで実行します。

以下最初のみ実行
pip install python-docx pandas openpyxl

以下のコマンドでpythonを実行:

cdコマンドでExceltoWord.pyを保存したディレクトリに移動

(mac)
python3 ExceltoWord.py ~/pass/to/帰属チェックリストVer13.xlsx
<python3で動かない場合はpythonコマンドを試してみてください。>

(windows)
python .\ExceltoWord.py .\帰属チェックリストVer13.xlsx
<ファイルが見つかりませんといわれる場合は、ExceltoWord.pyが存在するディレクトリにいないか、帰属チェックリストのpass指定が間違っています。>

 

おまけ: 実験項のミス発見AI

もうやっている人も多いかと思いますが、ChatGPTなどのオープンAIで機械的にSIの単純なミスを探すと大幅な時短になる上に、探しても見つからないミスまで見つかります。
全データを同時に読ませると判定精度が下がるので、読ませるデータは以下のように分類します。

  • 化合物タイトル+合成プロトコルの文章のみ
  • 化合物タイトル+NMR/MS/IR/mp/旋光度などのデータのみ
  • 化合物タイトル+合成プロトコルの文章+NMR/MS/IR/mp/旋光度などのデータ

テキストエディタなどにSI wordファイルの内容を添付し、上のようにデータを整形します。化合物タイトルはCompound Xという形式を推奨します。ブロックの判定がうまく行きやすくデータ抽出精度が上がります。
このテキストを.txtファイルとして保存し、ChatGPTにアップロードし、色々とチェックしてもらいましょう。論文の査読にもかなり使えます。

質問例1: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、帰属のH/C数がMSのH/C数と整合性が取れているか判定してください。
質問例2: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、MS記載の分子式からイオンを除き、分子量を算出してください。to give の後ろに続く(収量 (g or mg), 収率%)の値を取得し、分子量と収量(g or mg)から収量 (mol)および収率を計算してください。同一ブロック内の原料と思われる化合物の使用量(g, mol, 1 equiv.)のモル数を取得し、収率計算が正しいか判定して下さい。

表記ブレがあるとミス判定をすることがあるのですが、数値はあっているのにミス判定がでている場合は逆に表記ブレの疑いがあるので、間接的なミス発見も可能です。

おわりに

記事だけでは伝わりづらい部分もあると思いますので、ケムステSlack内のMacyにDMでご相談ください。
直接の連絡先を知っている人はご連絡いただければと思います。

 

関連記事

化学者のためのWordマクロ -Supporting Informationの作成作業効率化-
電子実験ノートSignals Notebookを紹介します ①
電子実験ノートSignals Notebookを紹介します ②
電子実験ノートSignals Notebookを紹介します ③
IASO R7の試薬データベースを構造式検索できるようにしてみた
電子実験ノートSignals Notebookを紹介します ④

Macy

投稿者の記事一覧

有機合成を専門とする教員。将来取り組む研究分野を探し求める「なんでも屋」。若いうちに色々なケミストリーに触れようと邁進中。

関連記事

  1. 【25卒 化学業界就活スタート講座 5月13日(土)Zoomウェ…
  2. 有機合成化学協会誌2020年5月号:特集号 ニューモダリティ;有…
  3. 配位子で保護された金クラスターの結合階層性の解明
  4. ギ酸ナトリウムでconPETを進化!
  5. ベンゼン環が壊れた?!ー小分子を活性化するー
  6. 有機合成化学協会誌2021年12月号:人工核酸・Post-com…
  7. 可視光エネルギーを使って単純アルケンを有用分子に変換するハイブリ…
  8. 高活性な不斉求核有機触媒の創製

注目情報

ピックアップ記事

  1. 2007年度ノーベル化学賞を予想!(2)
  2. 書類選考は3分で決まる!面接に進める人、進めない人
  3. 超高速レーザー分光を用いた有機EL発光材料の分子構造変化の実測
  4. 官能基化オレフィンのクロスカップリング
  5. 第21回 バイオインフォ-マティクスによる創薬 – Heather Carlson
  6. 文具に凝るといふことを化学者もしてみむとてするなり⑫:「コクヨのペーパーナイフ」の巻
  7. 液体中で高機能触媒として働くペロブスカイト酸化物の開発
  8. テトラセノマイシン類の全合成
  9. 【速報】2023年ノーベル化学賞は「量子ドットの発見と合成」へ!
  10. ゲルマベンゼニルアニオンを用いた単原子ゲルマニウム導入反応の開発

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

7th Compound Challengeが開催されます!【エントリー〆切:2026年03月02日】 集え、”腕に覚えあり”の合成化学者!!

メルク株式会社より全世界の合成化学者と競い合うイベント、7th Compound Challenge…

乙卯研究所【急募】 有機合成化学分野(研究テーマは自由)の研究員募集

乙卯研究所とは乙卯研究所は、1915年の設立以来、広く薬学の研究を行うことを主要事業とし、その研…

大森 建 Ken OHMORI

大森 建(おおもり けん, 1969年 02月 12日–)は、日本の有機合成化学者。東京科学大学(I…

西川俊夫 Toshio NISHIKAWA

西川俊夫(にしかわ としお、1962年6月1日-)は、日本の有機化学者である。名古屋大学大学院生命農…

市川聡 Satoshi ICHIKAWA

市川 聡(Satoshi Ichikawa, 1971年9月28日-)は、日本の有機化学者・創薬化学…

非侵襲で使えるpH計で水溶液中のpHを測ってみた!

今回は、知っているようで知らない、なんとなく分かっているようで実は測定が難しい pH計(pHセンサー…

有馬温泉で鉄イオン水溶液について学んできた【化学者が行く温泉巡りの旅】

有馬温泉の金泉は、塩化物濃度と鉄濃度が日本の温泉の中で最も高い温泉で、黄褐色を呈する温泉です。この記…

HPLCをPATツールに変換!オンラインHPLCシステム:DirectInject-LC

これまでの自動サンプリング技術多くの製薬・化学メーカーはその生産性向上のため、有…

MEDCHEM NEWS 34-4 号「新しいモダリティとして注目を浴びる分解創薬」

日本薬学会 医薬化学部会の部会誌 MEDCHEM NEWS より、新たにオープン…

圧力に依存して還元反応が進行!~シクロファン構造を活用した新機能~

第686回のスポットライトリサーチは、北海道大学大学院理学研究院化学部門 有機化学第一研究室(鈴木孝…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP