[スポンサーリンク]

化学者のつぶやき

新規化合物データチェックリストとWord整形プログラムver2

[スポンサーリンク]

こんにちは、Macyです。
以前こちらの記事で、NMRやMS、旋光度のデータを一つのExcelにまとめて管理し、NMR帰属の確認と補助が可能なExcelファイルを公開しました。
これをベースに、より高精度に書式変換が行えるプログラムにアップデートしたのでご紹介します。
新プログラムは以前公開したwebサーバーと同様のURLにver13として公開しました(こちらをクリック)。
軽微な点ですが、誤植を修正したのでver14としてアップロードし直しています(2025/12/08)。

–内包ファイル–
|– ExceltoWord_v1.txt:初期版VBAコード
|– ExceltoWord_v2.txt:Python版とほぼ同様のVBAコード、帰属チェックExcelファイルを指定して実行
|– ExceltoWord.py:python版、上記よりも少し高機能
|– 帰属チェックリストVer14.xlsx
|– マクロ有効化マニュアル20231004.pdf

自動で読みやすい形式にデータを整形

これまでのデータ出力欄は、セルの統合をしていたり、特徴量が規則的に並んでいなかったりと、プログラムで自動的にセルを見つけ出すのが極めて困難な状況でした。
そこで、プログラムに読ませるための新しい「Python」という名前のシートを作成し、データの種類(タイトル)とデータの内容の2列に全てのコンテンツを格納しました。

A列:データタイトル、B列:データ内容

 

ChatGPTでプログラム作成

過去に作成したVBAプログラムをベースに、ChatGPTに色々指示を出して、以下のようなプログラムを作成しました。
① 帰属チェックリスト.xlsxを指定して開く
② Pythonという名前のシートを参照し、A1:B5の内容を抽出
③ 化学式の数値下付きや核種の上付き、タイトルの太字、フォントサイズ、行間などのフォーマットを整えて、Wordに出力
④ 出力されたデータを再度チェックし、1H数の合計と13C数の合計を算出し、HRMS用の分子式のH数・C数と比較して整合性が取れているかチェック
⑤ 判定結果を末尾に記載
⑥ Excelファイル名_SI.docxという名前のWordファイルを保存

過去に公開したバージョンでは、文字列を検索し、カーソルを移動して範囲選択をして書式変更をかけるといったプログラムだったので、例外的なデータがあると対応できなくなっていました。
今回のバージョンでは、規則に則って書式を変換するプログラムになっているので、あらゆるケースに対応可能です。

 

Python実行環境の整備

このPythonプログラムは、再現性、安全性、柔軟性の観点からvenv(virtual environment)にて実行するのが良いです。
terminalやwindows powershellでvenvを構築する方法はChatGPTに次のように聞いて方法を教えてもらってください。

venvを<mac/windows>で構築する方法を教えて下さい。

venv環境ができたら、terminal上でvenvを有効化し、以下のコマンドで実行します。

以下最初のみ実行
pip install python-docx pandas openpyxl

以下のコマンドでpythonを実行:

cdコマンドでExceltoWord.pyを保存したディレクトリに移動

(mac)
python3 ExceltoWord.py ~/pass/to/帰属チェックリストVer13.xlsx
<python3で動かない場合はpythonコマンドを試してみてください。>

(windows)
python .\ExceltoWord.py .\帰属チェックリストVer13.xlsx
<ファイルが見つかりませんといわれる場合は、ExceltoWord.pyが存在するディレクトリにいないか、帰属チェックリストのpass指定が間違っています。>

 

おまけ: 実験項のミス発見AI

もうやっている人も多いかと思いますが、ChatGPTなどのオープンAIで機械的にSIの単純なミスを探すと大幅な時短になる上に、探しても見つからないミスまで見つかります。
全データを同時に読ませると判定精度が下がるので、読ませるデータは以下のように分類します。

  • 化合物タイトル+合成プロトコルの文章のみ
  • 化合物タイトル+NMR/MS/IR/mp/旋光度などのデータのみ
  • 化合物タイトル+合成プロトコルの文章+NMR/MS/IR/mp/旋光度などのデータ

テキストエディタなどにSI wordファイルの内容を添付し、上のようにデータを整形します。化合物タイトルはCompound Xという形式を推奨します。ブロックの判定がうまく行きやすくデータ抽出精度が上がります。
このテキストを.txtファイルとして保存し、ChatGPTにアップロードし、色々とチェックしてもらいましょう。論文の査読にもかなり使えます。

質問例1: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、帰属のH/C数がMSのH/C数と整合性が取れているか判定してください。
質問例2: 添付.txtファイル中のCompound Xから始まるブロック内のデータを読み、MS記載の分子式からイオンを除き、分子量を算出してください。to give の後ろに続く(収量 (g or mg), 収率%)の値を取得し、分子量と収量(g or mg)から収量 (mol)および収率を計算してください。同一ブロック内の原料と思われる化合物の使用量(g, mol, 1 equiv.)のモル数を取得し、収率計算が正しいか判定して下さい。

表記ブレがあるとミス判定をすることがあるのですが、数値はあっているのにミス判定がでている場合は逆に表記ブレの疑いがあるので、間接的なミス発見も可能です。

おわりに

記事だけでは伝わりづらい部分もあると思いますので、ケムステSlack内のMacyにDMでご相談ください。
直接の連絡先を知っている人はご連絡いただければと思います。

 

関連記事

化学者のためのWordマクロ -Supporting Informationの作成作業効率化-
電子実験ノートSignals Notebookを紹介します ①
電子実験ノートSignals Notebookを紹介します ②
電子実験ノートSignals Notebookを紹介します ③
IASO R7の試薬データベースを構造式検索できるようにしてみた
電子実験ノートSignals Notebookを紹介します ④

Macy

投稿者の記事一覧

有機合成を専門とする教員。将来取り組む研究分野を探し求める「なんでも屋」。若いうちに色々なケミストリーに触れようと邁進中。

関連記事

  1. 離れた場所で互いを認識:新たなタイプの人工塩基対の開発
  2. 化学者のためのエレクトロニクス講座~無電解貴金属めっきの各論編~…
  3. 有機合成化学協会誌2019年8月号:パラジウム-フェナントロリン…
  4. 創薬・医療系ベンチャー支援プログラム”BlockbusterTO…
  5. 小さなケイ素酸化物を得る方法
  6. 原子一個の電気陰性度を測った! ―化学結合の本質に迫る―
  7. 含フッ素カルボアニオン構造の導入による有機色素の溶解性・分配特性…
  8. (-)-ウシクライドAの全合成と構造決定

注目情報

ピックアップ記事

  1. 第32回 液晶材料の新たな側面を開拓する― Duncan Bruce教授
  2. 創薬におけるモダリティの意味と具体例
  3. おっさんマウスが小学生マウスを襲う?待ったの決め手はフェロモンにあり
  4. 低分子ゲル化剤の分子設計、合成法と応用技術【終了】
  5. 3回の分子内共役付加が導くブラシリカルジンの網羅的全合成
  6. 二酸化セレン Selenium Dioxide
  7. 高知和夫 J. K. Kochi
  8. サイエンスイングリッシュキャンプin東京工科大学
  9. ホウ素化反応の常識を覆し分岐型アルケンの製造工程を大幅短縮
  10. プラスマイナスエーテル!?

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年9月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

「MI×データ科学」コース 〜LLM・自動実験・計算・画像とベイズ最適化ハンズオン〜

1 開講期間2026年5月26日(火)、29日(金) 計2日間2 コースのねらい、特色近…

材料の数理モデリング – マルチスケール材料シミュレーション –

材料の数理モデリング概要材料科学分野におけるシミュレーションを「マルチスケール」で理解するた…

第59回天然物化学談話会@宮崎(7/8~10)

ごあいさつ天然物化学談話会は、全国の天然物化学および有機合成化学を研究する大学生…

トッド・ハイスター Todd K. Hyster

トッド・カート・ハイスター(Todd Kurt Hyster、1985年10月10日–)はアメリカ出…

“最難関アリル化”を劇的に加速する固定化触媒の開発

第 703回のスポットライトリサーチは、横浜国立大学大学院 理工学府 博士課程前期で…

「ニューモダリティと有機合成化学」 第5回公開講演会

従来の低分子、抗体だけでなく、核酸、ペプチド、あるいはその複合体(例えばADC(抗体薬物複合体))、…

溶融する半導体配位高分子の開発に成功!~MOFの成形加工性の向上に期待~

第702回のスポットライトリサーチは、関西学院大学理学部(田中研究室)にて助教をされていた秋吉亮平 …

ミン・ユー・ガイ Ming-Yu Ngai

魏明宇(Ming-Yu Ngai、1981年X月XX日–)は米国の有機化学者である。米国パデュー大学…

第55回複素環化学討論会

複素環化学討論会は、「複素環の合成、反応、構造および物性」をテーマとして、化学・薬学・農芸化学など幅…

逐次的脱芳香族化と光環化付加で挑む!Annotinolide B初の全合成

Annotinolide Bの初の全合成が報告された。キノリンの逐次的な脱芳香族化と分子内光環化付加…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP