[スポンサーリンク]

化学者のつぶやき

IASO R7の試薬データベースを構造式検索できるようにしてみた

[スポンサーリンク]

今回はSignals Notebookを使ってIASOの試薬データベースを構造検索できるようにしてみたので、その方法をご紹介します。
(IASO以外のデータベースを使っていても、そのデータベースから化合物のcas番号のリストをダウンロードできれば同じことができます!)

シリーズ一覧

電子実験ノートSignals Notebookを紹介します ①

電子実験ノートSignals Notebookを紹介します ②

電子実験ノートSignals Notebookを紹介します ③

IASO R7の試薬データベースを構造式検索できるようにしてみた

試薬を取り扱う研究室であれば、「試薬管理システム」を使っていると思いますが、皆さんはどの試薬管理システムを使っているでしょうか?

試薬管理システム – 企業6社の製品一覧とランキング

アカデミアでは、比較的コストが安い「IASO」を大学で契約しているという所も少なくないのではないでしょうか。しかし残念なことにIASOには構造式情報がなく、自分の研究室のInventoryにどのような試薬やビルディングブロックがあるかということが把握しづらいです。棚ごとに試薬を分類してある程度類似のビルディングブロックをまとめて保管することはできますが、複数の特徴を持つ化合物はどの棚に入れるか?という問題が出てくるため、結局完璧な管理方法にはなりません。

上記リンクの最近使われている試薬管理システムは構造検索もできて便利なものがありますが、とあるシステムに問い合わせると1ラボ単位で年間〇〇◯万円!?(値段は伏せますが)、とても大学や研究室単位で契約できる値段ではありませんでした。

そこで、IASOに登録されている化合物のデータを効率よく構造情報化して、「Signals Notebook(Standard Edition)」を使って検索できるようにしてみたので、その過程をご紹介しようと思います!

 

1.     IASOから登録試薬のリストを.csvで書き出す

1-1. IASO R7にログインし、Data Manager → 在庫リスト → 検索対象は特に選択せず全てのままLISTを選択

1-2. 在庫リストの全てのチェックボックスにチェックを入れてダウンロード

試薬情報がまとまったcsvファイルが手に入る。

2.     ChemCell(フリーソフト)でCAS番号をSMILESに変換

2-1. ChemCell(GitHub)のCode → Zip DownloadでChemCell(マクロ入り.xls)を入手します。

2-2. ChemCellを開きマクロを有効に。

2-3. 先程IASOからダウンロードした.csvファイルをexcelで開き、CAS No.と容量の列をコピーしてChemCellの適当なシートのB,C列にペーストする。「内容量」は「Amount」などに書き換えておく。

2-4. A1 cellに「Structure」、A2 cellに=getSMILES(B2)と入力(B2 = CAS番号のcell)

2-5. A列のD2からデータがあるセルまで全てを選択

(C1にカーソルを持っていき、[Ctrl+↓]で一番下に飛ぶので、Aの一番下のcellにカーソルをあわせて[Ctrl+Shift+↑]で一挙に選択できる)

2-6. [Ctrl+D]で全てのCAS番号を一挙にSMILESに変換

ここでデータ数によるが、2600件程度だと大体25~30分程度かかりました。CPUのマルチコア性能に依存します。

2-7. ここで一旦名前を付けてマクロ有効ブックで保存。マクロを無効にした通常の.xlsxファイルでも保存しておくとよい(後述)。

 

2. (追記) SMILESをPythonで取得する方法

先日(2024/03/22)行われたSignals Notebookのユーザーミーティングで講演させて頂きました。
実は、上記のChemCellを使う方法は誰にでもできる簡単な手法である反面、PCのメモリをだいぶ食ってしまうのと、変換精度が完璧ではない(excel上でエラーも含む)ので、ヒット率が9割を下回る結果でした。そこで、以下のサイトを参考に、pythonを使ってCAS番号をSMILESに変換する方法を確立しました。

Win環境Mac環境

【動作を確認した開発環境】 Windows: Python 3.12.2、pubchempy 1.0.4, Mac: Python 3.11.8、pubchempy 1.0.4

メリットとしては、SMILESへの変換精度がよいです。約95%の試薬が一括変換できました。また、PCのメモリを圧迫せず、1時間程度で2400化合物ほどの変換処理を完了しました。
ここに書くとだいぶ長いですので、Webサーバーにアップロードした講演資料とマニュアルをご参照ください。
※Python素人が公開されている方法を使って作成したものですので、もっと効率の良い方法はあると思います。もし詳しい方でコメントがあれば、ぜひご連絡いただければと思います。

 

3.     ChemDraw for ExcelでSMILESを構造式に変換

3-1. シートをChem Office worksheetに変換する。

3-2. 生成したSMILESを全選択し、ConvertからConvert SMILES to Structure

(ここは結構さっくり、2,3分で終わりました。もともとSMILESに変換しそびれていた83個のセルは正常に変換できませんでしたと言われました。CAS to SMILESの問題です。)

3-3. 構造式に変換できなかったCellのみデータを消去したい。A2 cellにカーソルをあわせて[Ctrl+Shift+↓]でA2以下のcellを全選択し、右クリック → 値と数式のクリアによって構造情報のみを残す

4.     SDファイル(.sdf)で書き出してSignals NotebookのMaterialsに一括登録

4-1. SDファイルで書き出す際に、A2 cellに構造が入っていないとエラーになり書き出せないので、はじめに構造が出てくるcellまで空行を消去する。

4-2. Inport/Export → Export Table → 名前を付けて.sdfで保存

4-3Signals NotebookMaterials.sdfを読み込む。Materials内のReagents (SNB)()を選択して、右上のAdd NewからBulk Import Compounds.sdfファイルを読み込みます。

Materialsは初期設定ではONになっていないので、System Configurationで設定する必要がある。長くなるのでこちらは次回!

5.     実際に検索してみると・・・

例えば、名前検索で「ベンジルアルコール構造」を部分構造にもつ化合物を検索しようと思ってもなかなか難しいはず。ベンジルアルコールの構造を描きSubstructure Searchをし、検索範囲をMaterialsに絞り込むとこの通り。ベンジルアルコール構造を持つものだけがヒットしました。

ただし、今回の方法では、CAS to SMILESが100%の精度ではないため、完璧な構造データベースへの移行はできていません。構造式が入らなかった化合物は、ChemOffice Worksheetに変換する前の状態で名前を付けて保存しておいた.xlsxファイルを開けば確認可能。マクロ有効ブックやChemOffice Worksheetはデータ量が多く重いので、データ量を減らしたsheetで確認する方がよい。

現状では、IUPAC名を出してくれないIASOではCAS to Structureしか構造式に一括変換する手法は存在しないため、変換漏れしたものは手作業で入力するしかない。

なにか良い方法を知っている人がいればご連絡いただければ非常に助かります!

6.     継続的なデータベースの更新方法

IASOでData Managerを開き、登録薬品リストをクリック。集計期間を指定してLISTを押すと、その期間中に登録された試薬を集計できます。
ダウンロードボタンでcsvファイルをダウンロードできます。

 

Signals Notebookの設定は次回記事で!

関連リンク

電子ノートSignals Notebookを紹介します!

Macy

投稿者の記事一覧

有機合成を専門とする教員。将来取り組む研究分野を探し求める「なんでも屋」。若いうちに色々なケミストリーに触れようと邁進中。

関連記事

  1. 【速報】2010年ノーベル生理医学賞決定ーケンブリッジ大のエドワ…
  2. 化学系ラボの3Dプリンター導入ガイド
  3. 化学素人の化学読本
  4. 【イベント】「化学系学生のための企業研究セミナー」「化学系女子学…
  5. 第15回ケムステVシンポジウム「複合アニオン」を開催します!
  6. メソポーラスシリカ(2)
  7. ルイスペア形成を利用した電気化学発光の増強
  8. ウレエートを強塩基性官能基として利用したキラルブレンステッド塩基…

注目情報

ピックアップ記事

  1. 免疫不応答の抗原抗体反応を利用できるハプテン標識化試薬
  2. C–C, C–F, C–Nを切ってC–N, C–Fを繋げるβ-フルオロアミン合成
  3. 医療用酸素と工業用酸素の違い
  4. イライアス・コーリー E. J. Corey
  5. 樹脂コンパウンド材料におけるマテリアルズ・インフォマティクスの活用とは?
  6. 生きた細胞内のヘムを検出する蛍光プローブ
  7. 第23回 医療、工業、軍事、広がるスマートマテリアル活躍の場ーPavel Anzenbacher教授
  8. 計算化学:汎関数って何?
  9. 日本のお家芸、糖転移酵素を触媒とするための簡便糖ドナー合成法
  10. 第38 回化学反応討論会でケムステをみたキャンペーン

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2022年3月
 123456
78910111213
14151617181920
21222324252627
28293031  

注目情報

最新記事

【11月開催】 【第二期 マツモトファインケミカル技術セミナー開催】 題目:アクリル含浸樹脂 ビステックスシリーズのご紹介

■セミナー概要当社ではチタン、ジルコニウム、アルミニウム、ケイ素等の有機金属化合物の“オルガチッ…

【日産化学 27卒/Zoomウェビナー配信!】START your ChemiSTORY あなたの化学をさがす 研究職限定 キャリアマッチングLIVE

3日間で12領域の研究職社員がプレゼンテーション!日産化学の全研究領域を公開する、研…

hERG阻害 –致死性副作用をもたらす創薬の大敵–

創薬の臨床試験段階において、予期せぬ有害事象 (または副作用) の発生は、数十億円以…

久保田 浩司 Koji Kubota

久保田 浩司(Koji Kubota, 1989年4月2日-)は、日本の有機合成化学者である。北海道…

ACS Publications主催 創薬企業フォーラム開催のお知らせ Frontiers of Drug Discovery in Japan: ACS Industrial Forum 2025

日時2025年12月5日(金)13:00~17:45会場大阪大学産業科学研究所 管理棟 …

【太陽ホールディングス】新卒採用情報(2027卒)

■■求める人物像■■「大きな志と好奇心を持ちまだ見ぬ価値造像のために前進できる人…

欧米化学メーカーのR&D戦略について調査結果を発表

この程、TPCマーケティングリサーチ株式会社(本社=大阪市西区、代表取締役社長=松本竜馬)は、欧米化…

有馬温泉でラドン泉の放射線量を計算してみた【化学者が行く温泉巡りの旅】

有馬温泉は、日本の温泉で最も高い塩分濃度を持ち黄褐色を呈する金泉と二酸化炭素と放射性のラドンを含んだ…

アミンホウ素を「くっつける」・「つかう」 ~ポリフルオロアレーンの光触媒的C–Fホウ素化反応と鈴木・宮浦カップリングの開発~

第684回のスポットライトリサーチは、名古屋工業大学大学院工学研究科(中村研究室)安川直樹 助教と修…

第56回ケムステVシンポ「デバイスとともに進化する未来の化学」を開催します!

第56回ケムステVシンポの会告を致します。3年前(32回)・2年前(41回)・昨年(49回)…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP