[スポンサーリンク]

ケムステニュース

続々と提供される化学に特化したAIサービス

[スポンサーリンク]

オルツは21日、「AI GIJIROKU(AI議事録)」の分野・業種別音声認識機能として、教育向け強化音声認識エンジン「化学GIJIROKU」の提供を開始したと発表した。化学分野に特化学習した、強化音声認識エンジンで、これまでは認識不可能だった専門性の高い用語や言い回しなどに対応し、非常に高い認識精度を実現しているという。(ICT教育ニュース7月27日)

Langsmith株式会社は、2021年4月より英語論文執筆支援システム「Langsmith Editor」の正式版を世界向けに開始いたしましたが、この度、Freeプラン登録時の無料トライアル期間(7日間)にて医学・化学・生物学・機械学習・画像処理・自然言語処理各分野に特化したエンジンをお試しいただけるようになりました.   (PRTIMES 8月2日)

AIを活用したデスクワークをサポートするツールが近年数多く開発されていますが、化学においては化合物の名前や用語が特殊で、汎用のサービスではうまく機能しないことが多々あります。今回は、化学向けのオプションが機能された2つのサービスを紹介します。サービスの紹介だけでなく、実際に使用してみて使い勝手や性能も確かめました。

音声認識を活用したサービスを提供するオルツでは、会議中の発言を自動で文字に起こすサービスAI GIJIROKUを提供していますが、この度、化学分野に特化学習した強化音声認識エンジンを搭載し化学用語に特化したサービスの提供を始めました。

使い方は至って単純で、書き起こしを始めたいタイミング(会議直前など)でStart Recordingを押すと書き起こしが始まります。書き起こすだけであればGoogleやMicrosoftのサービスにも実装されていますが、このAI GIJIROKUでは、発言者を事前に登録しておくことで、誰が発言しているかを認識しLINEのトーク画面のように、誰が発言したのかを後で確認できるように編集してくれます。その場での書き起こしだけでなく、録音した音声ファイルから書き起こしをすることも可能です。スマホでもこのサービスを使用することは可能ですが、例えば突然の話し合いや、インターネット環境がなく録音しかできなかった場合でも後で書き起こすことができます。

AI GIJIROKUのメイン画面、下部の認識エンジンや発音言語下を選択後、Start Recordingで書き起こしがスタートします。書き起こしたデータは中央に保存され、選択すると確認できる。

では本題の化学に特化した音声認識についてですが、これは認識エンジンを化学と選択することで有効になります。化学だけでなく、金融、法律、日本史、世界史、保険、医療、自治体、コロナ対策、国会も選択でき、製薬、建築もリリース予定のようです。性能については、汎用音声認識との比較例が公式ページに掲載されており、化学独特の機器名や化合物名の認識率において化学の認識エンジンの方が高く、結果として高い正答率を示すようです。

では、化学研究の現場で使用されている言葉も認識できるか、ケムステ記事や論文を音読しGoogleの音声認識と比較を行いました。音読したのは「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」と「π-アリルイリジウムに新たな光を」の論文の概要に加えて、英語の題材としてスキンケア・化粧品に含まれる有害物質を巡る騒動で取り上げた「Fluorinated Compounds in North American Cosmetics」のアブストラクトです。音声の品質で差が出ないように一回の同じ音読でどちらの書き起こしも実施し、テキスト比較ツールでオリジナルの文章とどこが異なるかを比較しました。言葉によっては正しく書き起こされているものの、文字としては異なる場合もありますので、ざっと見てそれぞれの相違個所をカウントしました。

書き起こしの確認画面、音声の位置に応じて文字が緑色でハイライトされる。音声やテキストをダウンロードすることも可能

まずスルフィドの記事ですが、日本語の文章ながら化合物の名前など英語読みが多い特徴があります。Googleでもその点を概ねクリアしていますが、AI GIJIROKUでは、トリエチルボランなどもしっかりと認識されています。化学において「脱」や「付加」を物質名の前後に付けることが多々あり、この文章でも脱窒素ということが使われていますが、これに関してもAI GIJIROKUでのみ正しく認識されています。結果、AI GIJIROKUの方が相違箇所が少ない結果となりました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。アルファベットの官能基は、そのまま読んでいます(SF5であれば、エスエフファイヴ)。

次にアリルイリジウムの記事ですが、アリルイリジウムという言葉が多く登場するのが特徴です。こちらに関しては、Googleも負けず劣らず高い認識を示していますが、AI GIJIROKUではエファビレンツ誘導体を正しく書き起こしている点が圧巻です。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。

最後に英語のアブストラクトは、文章の比較だけにとどめましたが、AI GIJIROKUの方が単語の認識能が高く、また文章として成り立つように書き起こされている印象を受けました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。発音やスピードが書き起こしに向いていないのかもしれません。

総じてAI GIJIROKUの化学エンジンが高いパフォーマンスを示しましたが、宮殿性キス歌詞など一般的な言語に引き込まれている箇所もありましたので、今後の学習により精度が上がることを期待します。サービスはサブスクリプション制で、スタンダード(1500円/月、1年一括契約割引あり)とビジネス(29800円/月、1年一括契約割引あり)の2つのコースがあります。スタンダードはリーズナブルな価格で提供されていて個人や小チームでの使用に適しているようです。ビジネスは、スタンダードよりもひと月に書き起こしできる時間が長く、例えば化学を含む高精度/業種別オプションは、1000分まで月に使えます(スタンダードは100分)。スマホの普及で高音質な録音は手軽にできますが、振り返るときには、文字に起こされていたほうが理解しやすく学会の質疑応答の場面や外部との会議で役に立つのではないかと思います。

※多くの学会で対面、オンラインを問わず録音は禁止されており、許可なく録音することは問題になります。

 

次にLangsmith Editorの話題に移りますが、これはLangsmith株式会社が開発したAIで英語論文の執筆をサポートしてくれるツールで、スペルミスの訂正といった基本的な校正機能に加え、様々な言い回しや続きの文章などを提案しより自然な文章の作成をサポートするサービスです。使い方はワードなどと同じで、ブラウザー上のエディタに英文を打ち込んでいくとスペルミスなどが赤色の点線で指摘されます。ここまでは、他のエディタでも実装されていますが、Langsmith Editorでは特定の単語を選択するとAIがその単語が含まれる文章を解析し、言い回しを変えた文章がいくつか提案してくれます。提案された文章にはTypicaltiyのスコアが表示され、どの文章が一般的かを知ることができます。もちろん作成者は、どの文章を変えるかそのままにするかを自由に選択することができ、自分が作成した文章がAI提案に含まれる場合は👍が表示されます。

こちらのサービスも実際に使用してみました。具体的には書き起こしでも題材にした「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」の論文の概要を和訳し、その後Microsoft エディターで文章校正とスペルチェックを行い、その文章をLangsmith Editorにコピペして解析を行いました。

まずMicrosoft エディターでは、過去/現在形や、単数/複雑の修正が入り、またTriedがTiredになっていたのも指摘してくれました。カルボニル化合物の合成が疲れていました。

記事を英訳しMicrosoft エディターの指摘が表示された後の文章、青色の波線が指摘された箇所

次にLangsmith Editorで分析を行いました。Fieldで医学・化学・生物学・機械学習・画像処理・自然言語処理を選択することができます。また文章の使われる場所をSection nameで指定することで、それぞれに適した言い回しが提案されるようです。言い回しの選定は、文章を作りながらの方が適していると思いますが、今回は比較のため作成した文章をコピペしWhere to Rewriteで文章全体を調べました。

分野選択

セクション選択

別の表現が良い文章は、黄色かオレンジ色でハイライトされ、単語を選択すると他の言い回しが提案されます。ハイライトされていない文章もその単語を選択すると別の表現が提案されます。

Where to Rewriteをクリック後の画面

文章を選択し、異なる言い回しが表示されたときの様子

一通り提案を受け入れてみましたが、変更後の方が自然な気がしました。他者が作成した文章をそのまま和訳しそれを自分自身で評価するのは難しいですが、もうちょっと良い書き方があるとも感じました。自分で考えた文章について分析を繰り返すと自然な英文になるかもしれません。

分析と変更を数回繰り返して完成した文章。

他の機能として自動補完があり、文章の途中でtabを押すと続く文章の候補も提示してくれます。また、特定の単語が使われている論文の検索文章の典型度の比較などを行う機能も搭載されています。文章の冠詞や前置詞の置き方は、他の文章を参考して習得するのが一つの方法であるため、文章作成途中で検索や比較ができるのは大変便利だと思います。

文章の比較結果

Langsmith Editorは使用無制限のサブスクリプション制で、化学をはじめとする専門分野に対応するのはPremiumプラン(1800円/月、3か月と1年一括契約割引あり)とEnterpriseプラン(価格お問い合わせ)です。Premiumは個人ユーザーに最適で、Enterpriseでは、Premiumに加えてユーザーの管理と組織に応じた支払方法が可能であるためチームユーザーに最適だそうです。8月より無料トライアルの提供を始めており、専門分野に対応したモデルと文章の比較を7日間試すことができます。論文や学会のアブストラクトを提出する際には、誰もが言い回しにかなり気を付けると思います。気軽にネイティブに相談できる環境であったとしても、自分で考える作業は必要であり、単なる校正としてだけではなく学習目的でこちらのサービスは有用ではないでしょうか。Langsmith株式会社の創業者である伊藤拓海さんと栗林樹生さんは、東北大学大学院情報科学研究科 乾研究室 博士課程に在籍しており、大学院生の視点を活かしてさらなるユニークなサービスの開発を期待します。

AIを活用したサービスではユーザーがインプットしたデータを元に再学習を行い、精度を向上させていることがよくあります。しかし企業サイドとしては、使用された情報を外部保存されることには機密情報の漏洩リスクがあります。そのため、AI GIJIROKUのビジネスプランでは学習されないことになっています。Langsmith Editorのトライアルを除くPremiumとEnterpriseプランでも、入力された文章内容をサーバーに一切残さない設定になっています。サービスを選ぶ際には、サブスクリプションの条件とともにAI独特のセキュリティ問題にも目を向ける必要があります。

高校生の時には電子辞書の便利さに驚き、大学生になるとパソコンの辞書ソフトでさらに驚いていましたが、今ではgoogleで「Tango 英語」で調べれば、意味はもちろんのこと、たくさんの例文も調べることができます。これからもAIを活用したツールは開発され、言語の壁は小さくなると予想されますが、どんなにツールが便利になっても最終判断は人間にあり、ある程度のところまでは人間が理解しなければらないと思います。研究活動においてはツールのアシストを上手に利用して、これからも英語と付き合う必要があるのではないでしょうか。

関連書籍

音声認識・英語校閲に関連するケムスケ過去記事

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 分子標的薬、手探り続く
  2. 薄くて巻ける有機ELディスプレー・京大など開発
  3. 8億4400万円で和解 青色LED発明対価訴訟
  4. トンボ手本にUV対策 産総研など 分泌物の主成分を解明
  5. 『分子科学者がいどむ12の謎』
  6. 東レから発表された電池と抗ウイルスに関する研究成果
  7. 核のごみを貴金属に 現代の錬金術、実験へ
  8. 超高性能プラスチック、微生物で原料を生産

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. 第54回―「ナノカーボンを機能化する合成化学」Maurizio Prato教授
  2. マイヤース・斉藤環化 Myers-Saito Cyclization
  3. 大幸薬品、「クレベリン」の航空輸送で注意喚起 搭載禁止物質や危険物に該当
  4. スコット・デンマーク Scott E. Denmark
  5. PL法 ? ものづくりの担い手として知っておきたい法律
  6. ディーン・トースト F. Dean Toste
  7. 第132回―「遷移金属触媒における超分子的アプローチ」Joost Reek教授
  8. sp2-カルボカチオンを用いた炭化水素アリール化
  9. 触媒と光で脳内のアミロイドβを酸素化
  10. 蛍光標識で定性的・定量的な解析を可能に:Dansyl-GSH

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年8月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

注目情報

注目情報

最新記事

国内最大級の研究者向けDeepTech Company Creation Program「BRAVE FRONTIER」 2022年度の受付開始 (7/15 〆切)

Beyond Next Ventures株式会社(本社:東京都中央区、代表取締役社⻑:伊藤毅、以下「…

イミンアニオン型Smiles転位によるオルトヒドロキシフェニルケチミン合成法の開発

第394回のスポットライトリサーチは、東京農工大学 大学院工学府 応用化学専攻 森研究室の神野 峻輝…

マテリアルズ・インフォマティクスで用いられる統計[超入門]-研究者が0から始めるデータの見方・考え方-

開催日:2022/07/06 申込みはこちら■開催概要近年、少子高齢化、働き手の不足の影…

表面酸化した銅ナノ粒子による低温焼結に成功~銀が主流のプリンテッドエレクトロニクスに、銅という選択肢を提示~

第393回のスポットライトリサーチは、北海道大学 大学院工学院 材料科学専攻 マテリアル設計講座 先…

高分子材料におけるマテリアルズ・インフォマティクスの活用とは?

 申込みはこちら■セミナー概要本動画は、20022年5月18日に開催されたセミナー「高分…

元素のふるさと図鑑

2022年も折り返しに差し掛かりました。2022年は皆さんにとってどんな年になり…

Q&A型ウェビナー カーボンニュートラル実現のためのマイクロ波プロセス 〜ケミカルリサイクル・乾燥・濃縮・焼成・剥離〜

<内容>本ウェビナーでは脱炭素化を実現するための手段として、マイクロ波プロセスをご紹介いたします…

カルボン酸、窒素をトスしてアミノ酸へ

カルボン酸誘導体の不斉アミノ化によりキラルα-アミノ酸の合成法が報告された。カルボン酸をヒドロキシル…

海洋シアノバクテリアから超強力な細胞増殖阻害物質を発見!

第 392回のスポットライトリサーチは、慶應義塾大学大学院 理工学研究科 博士後期課…

ポンコツ博士の海外奮闘録⑧〜博士,鍵反応を仕込む②〜

ポンコツシリーズ一覧国内編:1話・2話・3話国内外伝:1話・2話・留学TiPs海外編:1…

Chem-Station Twitter

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP