[スポンサーリンク]

化学者のつぶやき

Open Babel を使ってみよう~ケモインフォマティクス入門~

[スポンサーリンク]

こんにちは、アセトアミノフェンといいます。今回初投稿です。これからどうぞよろしくお願いいたします。

さて、今回は Open Babel について書いてみることにしました。

 

Open Babel ってなに?

Open Babel とは、主に化学構造を保持しているさまざまなファイルフォーマットを変換するシステムです。Sourceforge からフリーで配布されています。分子のモデリングというよりは“分子の情報学”(ケモインフォマティクスなどともいわれます)の目的で使われるシステムで、化学構造のライブラリ、構造が類似しているかどうかの判定などにも役立つアルゴリズムです。

入出力ファイル形式は相当数あり、おそらく化学構造を表すために用いられるほとんどのフォーマットをカバーしています。主なものでは

  • .mol (MDL MOL format):化学構造を記述する標準的なフォーマットで、結合表 (Connection Table) という考えに基づく行列表記法の1つ
  • .cml (Chemical Markup Language):化学情報をXMLと同じように扱おうという言語
  • .cdx (ChemDraw binary format):化学系で最もメジャーな構造式描画ソフトの標準出力形式
  • .smi (SMILES files):Simplified Molecular Input Line Entry Specificationの略で、線形表記法の1つ

といったところでしょうか。フォーマットの詳しい日本語リソースとしては、例えば

などがあります。

 

そんな Open Babel はこんな時に役立ちます

  • ChemDraw 形式のファイル(拡張子.cdx)をもらったが、手元に ChemDraw がなくて開けない!
  • いちいちGUI(グラフィカルユーザインタフェース)で開くのではなく、一発でコマンド処理したい!

もちろん、化学構造式を描くためのフリーソフトとして ChemSketch (Windows), Accelrys Draw (Windows), Marvin Sketch (Windows/Mac/Linux) などがあります。これらは独自フォーマットのほかに、一般的な .mol や .cdx にも対応しています。しかし、いずれも商用ソフトの無料部分を活用することになるので、いくぶん制約がかかってしまいます。

それに対し、Open Babel はオープンソースで、世界中の有志が開発に参加し、常に不具合を修正したり機能を追加したりすることによって維持されています。つまり、内部の処理が公開されているということで、興味があればソフトが内部でどういうことをやっているのか直接見ることができます。また、OS によらずどこでも利用でき、そのうえコマンドライン(Windows のコマンドプロンプトや Mac のターミナル)から操作する機能もあるので、たくさんあるファイルをいちいち直感的に操作するのではなく、まとめて素早く処理したい場合にも役立ちます。

 

ダウンロードとインストール

まずは、Open Babel をインストールしましょう。Open Babel の Wiki ページに行って、自分のOSにあったインストーラをダウンロードしましょう。ここでは私はWindows 用のインストーラの場合で説明します。

最新のインストーラは「OpenBabel2.3.2a_Windows_Installer.exe」でした。これをダウンロードして起動すると、こんな画面が出てきます。

 

OpenBabel-inst01

OpenBabelセットアップウィザード

 

Next をクリックするとライセンス使用条件が現れるので、読んだら I Agree をクリック。あとは数回 Next をクリックするだけで、簡単にインストールが終了します。

完了したらスタートメニューに追加されるはずなので、起動してみましょう。左側がインプット、右側がアウトプットで、中央で変換処理の調節になっています。たくさんの入力フォーマットがあるのが分かると思います。

 

OpenBabelGUI

起動するとこんな画面が現れる

 

使ってみよう

では、いよいよ Open Babel を使ってみましょう。

最初は特に中央をいじらずに、入力と出力だけ指定してみましょう。私のペンネームであるアセトアミノフェンを例に説明します。今回は自力で構造式を描かずに、ChemSpider からとってきたものを使ってみます。みなさんも検索窓から acetaminophen と入力して検索してみてください。別名の Paracetamol がヒットしますので、Save をクリックして MOL 形式でダウンロードしましょう。ここでは分かりやすく acetaminophen.mol と名前を変更しておきます。

 

ChemSpider

ChemSpiderから構造式を取得

 

はじめに一般的な PNG という画像形式に変換してみます。Open Babelの画面左側でINPUT FORMATの下向き矢印から「mol — MDL MOL format」を指定し、そのすぐ下にある細い入力エリアの右についている「…」をクリックして今ダウンロードしたacetaminophen.molを探します。右側でOUTPUT FORMATを「png — PNG 2D depiction」を指定し、保存先を指定します。

 

OpenBabel-MOLtoPNG

PNGに変換

 

Convert をクリックすると、ちゃんとPNG画像が出力されます。

acetaminophen

アセトアミノフェンの構造式

 

もう一つ試してみましょう。今度は SMILES 表記法から MOL 形式への変換をやってみます。先ほどの ChemSpider のページには「SMILES and InChIs」という項目がありました。ここのSMILES表記を見ると、アセトアミノフェンは

CC(=O)Nc1ccc(cc1)O

と書かれています。これをコピーし、今度は Open Babel の画面左の大きな入力エリアに貼り付けましょう。Input below にチェックを入れると入力や貼り付けが可能になります。先ほどの方法をまねて、右側で出力を「mol — MDL MOL format」に指定し、保存先を決めたら Convert をクリックします。

 

OpenBabel-SMItoMOL

SMILES 表記法から MOL 形式への変換

 

出てきたMOLファイルをChemSketchで開いてみます。あれ、なんか変ですね。コンパクトになってしまいました。

 

acetaminophen-01

ChemSketchで開く

 

こんなときは、Clean Structureをクリックします(図の矢印)。ちゃんとアセトアミノフェンの構造式になっていました。

 

acetaminophen-02

Clean Structureをクリックすると正しい構造式が得られる

 

終わりに

いかがだったでしょうか? 今回はファイル変換しか行いませんでしたが、Open Babel はもっと高機能です。興味のある方は関連記事を見てください。

初めての投稿で、慣れない部分もありましたが、今後ともよろしくお願いいたします。

関連情報:今回の著者・アセトアミノフェンは「はてなブログ」で個人ブログを運営しております。今回はケムステの化学者のつぶやきと連動して Open Babel 特集を組みました。こちらでは、Open Babel を GUI ではなくコマンドで使用する例を紹介しておりますので、併せてよろしくお願いいたします。

 

関連記事

 

関連書籍

アセトアミノフェン

アセトアミノフェン

投稿者の記事一覧

工学(修士);専門は応用化学・生物物理学。会社員です。

関連記事

  1. 18万匹のトコジラミ大行進 ~誘因フェロモンを求めて①~
  2. 光学活性有機ホウ素化合物のカップリング反応
  3. ビシナルジハライドテルペノイドの高効率全合成
  4. 天才児の見つけ方・育て方
  5. その電子、私が引き受けよう
  6. 「ドイツ大学論」 ~近代大学の根本思想とは~
  7. ブロック共重合体で無機ナノ構造を組み立てる
  8. ペプチド縮合を加速する生体模倣型有機触媒

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. 三菱化学、来年3月にナイロン原料の外販事業から撤退=事業環境悪化で
  2. DOIって何?
  3. 【速報】Mac OS X Lionにアップグレードしてみた
  4. アブノーマルNHC
  5. 技術者・研究者のためのプレゼンテーション入門
  6. カルベンで挟む!
  7. ディーン・トースト F. Dean Toste
  8. 米デュポンの7-9月期、ハリケーン被害などで最終赤字
  9. マテリアルズ・インフォマティクスの基本とMI推進
  10. フェイスト・ベナリー フラン合成 Feist-Benary Furan Synthesis

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2014年11月
« 10月   12月 »
 12
3456789
10111213141516
17181920212223
24252627282930

注目情報

注目情報

最新記事

抗リーシュマニア活性を有するセスキテルペンShagene AおよびBの全合成研究

第362回のスポットライトリサーチは、京都大学大学院農学研究科(入江研究室)・八木田凌太郎さんにお願…

マテリアルズ・インフォマティクスに欠かせないデータ整理の進め方とは?

見逃し配信のお申込みはこちら■概要2021年10月13日に開催されたウェブセミナー「マテ…

第3の生命鎖、糖鎖の意味を解明する!【ケムステ×Hey!Labo 糖化学ノックインインタビュー③】

2021年度科学研究費助成事業 学術変革領域研究(B)に採択された『糖鎖ケミカルノックインが拓く膜動…

腎細胞がん治療の新薬ベルツチファン製造プロセスの開発

2021年夏に米国 FDA はベルツチファン (belzutifan, WeliregTM) という…

マテリアルズ・インフォマティクスの基本とMI推進

見逃し配信視聴申込はこちら■概要2021年9月7日に開催されたウェブセミナー「マテリアル…

【四国化成工業】新卒採用情報(2023卒)

◆求める人財像:『使命感にあふれ、自ら考え挑戦する人財』私たちが社員に求めるのは、「独創力」…

四国化成工業ってどんな会社?

私たち四国化成工業株式会社は、企業理念「独創力」のもと「有機合成技術」を武器に「これまでになかった材…

ポンコツ博士の海外奮闘録 外伝② 〜J-1 VISA取得編〜

ポンコツシリーズ番外編 その2 J-1 VISA取得までの余談と最近日本で問題になった事件を経験した…

結合をアリーヴェデルチ! Agarozizanol Bの全合成

セスキテルペンAgarozizanol Bの全合成が初めて達成された。光照射下で進行するカスケード反…

有機合成化学協会誌2022年1月号:無保護ケチミン・高周期典型金属・フラビン触媒・機能性ペプチド・人工核酸・脂質様材料

有機合成化学協会が発行する有機合成化学協会誌、2022年1月号がオンライン公開されました。本…

Chem-Station Twitter

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP