[スポンサーリンク]

ケムステニュース

続々と提供される化学に特化したAIサービス

[スポンサーリンク]

オルツは21日、「AI GIJIROKU(AI議事録)」の分野・業種別音声認識機能として、教育向け強化音声認識エンジン「化学GIJIROKU」の提供を開始したと発表した。化学分野に特化学習した、強化音声認識エンジンで、これまでは認識不可能だった専門性の高い用語や言い回しなどに対応し、非常に高い認識精度を実現しているという。(ICT教育ニュース7月27日)

Langsmith株式会社は、2021年4月より英語論文執筆支援システム「Langsmith Editor」の正式版を世界向けに開始いたしましたが、この度、Freeプラン登録時の無料トライアル期間(7日間)にて医学・化学・生物学・機械学習・画像処理・自然言語処理各分野に特化したエンジンをお試しいただけるようになりました.   (PRTIMES 8月2日)

AIを活用したデスクワークをサポートするツールが近年数多く開発されていますが、化学においては化合物の名前や用語が特殊で、汎用のサービスではうまく機能しないことが多々あります。今回は、化学向けのオプションが機能された2つのサービスを紹介します。サービスの紹介だけでなく、実際に使用してみて使い勝手や性能も確かめました。

音声認識を活用したサービスを提供するオルツでは、会議中の発言を自動で文字に起こすサービスAI GIJIROKUを提供していますが、この度、化学分野に特化学習した強化音声認識エンジンを搭載し化学用語に特化したサービスの提供を始めました。

使い方は至って単純で、書き起こしを始めたいタイミング(会議直前など)でStart Recordingを押すと書き起こしが始まります。書き起こすだけであればGoogleやMicrosoftのサービスにも実装されていますが、このAI GIJIROKUでは、発言者を事前に登録しておくことで、誰が発言しているかを認識しLINEのトーク画面のように、誰が発言したのかを後で確認できるように編集してくれます。その場での書き起こしだけでなく、録音した音声ファイルから書き起こしをすることも可能です。スマホでもこのサービスを使用することは可能ですが、例えば突然の話し合いや、インターネット環境がなく録音しかできなかった場合でも後で書き起こすことができます。

AI GIJIROKUのメイン画面、下部の認識エンジンや発音言語下を選択後、Start Recordingで書き起こしがスタートします。書き起こしたデータは中央に保存され、選択すると確認できる。

では本題の化学に特化した音声認識についてですが、これは認識エンジンを化学と選択することで有効になります。化学だけでなく、金融、法律、日本史、世界史、保険、医療、自治体、コロナ対策、国会も選択でき、製薬、建築もリリース予定のようです。性能については、汎用音声認識との比較例が公式ページに掲載されており、化学独特の機器名や化合物名の認識率において化学の認識エンジンの方が高く、結果として高い正答率を示すようです。

では、化学研究の現場で使用されている言葉も認識できるか、ケムステ記事や論文を音読しGoogleの音声認識と比較を行いました。音読したのは「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」と「π-アリルイリジウムに新たな光を」の論文の概要に加えて、英語の題材としてスキンケア・化粧品に含まれる有害物質を巡る騒動で取り上げた「Fluorinated Compounds in North American Cosmetics」のアブストラクトです。音声の品質で差が出ないように一回の同じ音読でどちらの書き起こしも実施し、テキスト比較ツールでオリジナルの文章とどこが異なるかを比較しました。言葉によっては正しく書き起こされているものの、文字としては異なる場合もありますので、ざっと見てそれぞれの相違個所をカウントしました。

書き起こしの確認画面、音声の位置に応じて文字が緑色でハイライトされる。音声やテキストをダウンロードすることも可能

まずスルフィドの記事ですが、日本語の文章ながら化合物の名前など英語読みが多い特徴があります。Googleでもその点を概ねクリアしていますが、AI GIJIROKUでは、トリエチルボランなどもしっかりと認識されています。化学において「脱」や「付加」を物質名の前後に付けることが多々あり、この文章でも脱窒素ということが使われていますが、これに関してもAI GIJIROKUでのみ正しく認識されています。結果、AI GIJIROKUの方が相違箇所が少ない結果となりました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。アルファベットの官能基は、そのまま読んでいます(SF5であれば、エスエフファイヴ)。

次にアリルイリジウムの記事ですが、アリルイリジウムという言葉が多く登場するのが特徴です。こちらに関しては、Googleも負けず劣らず高い認識を示していますが、AI GIJIROKUではエファビレンツ誘導体を正しく書き起こしている点が圧巻です。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。

最後に英語のアブストラクトは、文章の比較だけにとどめましたが、AI GIJIROKUの方が単語の認識能が高く、また文章として成り立つように書き起こされている印象を受けました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。発音やスピードが書き起こしに向いていないのかもしれません。

総じてAI GIJIROKUの化学エンジンが高いパフォーマンスを示しましたが、宮殿性キス歌詞など一般的な言語に引き込まれている箇所もありましたので、今後の学習により精度が上がることを期待します。サービスはサブスクリプション制で、スタンダード(1500円/月、1年一括契約割引あり)とビジネス(29800円/月、1年一括契約割引あり)の2つのコースがあります。スタンダードはリーズナブルな価格で提供されていて個人や小チームでの使用に適しているようです。ビジネスは、スタンダードよりもひと月に書き起こしできる時間が長く、例えば化学を含む高精度/業種別オプションは、1000分まで月に使えます(スタンダードは100分)。スマホの普及で高音質な録音は手軽にできますが、振り返るときには、文字に起こされていたほうが理解しやすく学会の質疑応答の場面や外部との会議で役に立つのではないかと思います。

※多くの学会で対面、オンラインを問わず録音は禁止されており、許可なく録音することは問題になります。

 

次にLangsmith Editorの話題に移りますが、これはLangsmith株式会社が開発したAIで英語論文の執筆をサポートしてくれるツールで、スペルミスの訂正といった基本的な校正機能に加え、様々な言い回しや続きの文章などを提案しより自然な文章の作成をサポートするサービスです。使い方はワードなどと同じで、ブラウザー上のエディタに英文を打ち込んでいくとスペルミスなどが赤色の点線で指摘されます。ここまでは、他のエディタでも実装されていますが、Langsmith Editorでは特定の単語を選択するとAIがその単語が含まれる文章を解析し、言い回しを変えた文章がいくつか提案してくれます。提案された文章にはTypicaltiyのスコアが表示され、どの文章が一般的かを知ることができます。もちろん作成者は、どの文章を変えるかそのままにするかを自由に選択することができ、自分が作成した文章がAI提案に含まれる場合は👍が表示されます。

こちらのサービスも実際に使用してみました。具体的には書き起こしでも題材にした「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」の論文の概要を和訳し、その後Microsoft エディターで文章校正とスペルチェックを行い、その文章をLangsmith Editorにコピペして解析を行いました。

まずMicrosoft エディターでは、過去/現在形や、単数/複雑の修正が入り、またTriedがTiredになっていたのも指摘してくれました。カルボニル化合物の合成が疲れていました。

記事を英訳しMicrosoft エディターの指摘が表示された後の文章、青色の波線が指摘された箇所

次にLangsmith Editorで分析を行いました。Fieldで医学・化学・生物学・機械学習・画像処理・自然言語処理を選択することができます。また文章の使われる場所をSection nameで指定することで、それぞれに適した言い回しが提案されるようです。言い回しの選定は、文章を作りながらの方が適していると思いますが、今回は比較のため作成した文章をコピペしWhere to Rewriteで文章全体を調べました。

分野選択

セクション選択

別の表現が良い文章は、黄色かオレンジ色でハイライトされ、単語を選択すると他の言い回しが提案されます。ハイライトされていない文章もその単語を選択すると別の表現が提案されます。

Where to Rewriteをクリック後の画面

文章を選択し、異なる言い回しが表示されたときの様子

一通り提案を受け入れてみましたが、変更後の方が自然な気がしました。他者が作成した文章をそのまま和訳しそれを自分自身で評価するのは難しいですが、もうちょっと良い書き方があるとも感じました。自分で考えた文章について分析を繰り返すと自然な英文になるかもしれません。

分析と変更を数回繰り返して完成した文章。

他の機能として自動補完があり、文章の途中でtabを押すと続く文章の候補も提示してくれます。また、特定の単語が使われている論文の検索文章の典型度の比較などを行う機能も搭載されています。文章の冠詞や前置詞の置き方は、他の文章を参考して習得するのが一つの方法であるため、文章作成途中で検索や比較ができるのは大変便利だと思います。

文章の比較結果

Langsmith Editorは使用無制限のサブスクリプション制で、化学をはじめとする専門分野に対応するのはPremiumプラン(1800円/月、3か月と1年一括契約割引あり)とEnterpriseプラン(価格お問い合わせ)です。Premiumは個人ユーザーに最適で、Enterpriseでは、Premiumに加えてユーザーの管理と組織に応じた支払方法が可能であるためチームユーザーに最適だそうです。8月より無料トライアルの提供を始めており、専門分野に対応したモデルと文章の比較を7日間試すことができます。論文や学会のアブストラクトを提出する際には、誰もが言い回しにかなり気を付けると思います。気軽にネイティブに相談できる環境であったとしても、自分で考える作業は必要であり、単なる校正としてだけではなく学習目的でこちらのサービスは有用ではないでしょうか。Langsmith株式会社の創業者である伊藤拓海さんと栗林樹生さんは、東北大学大学院情報科学研究科 乾研究室 博士課程に在籍しており、大学院生の視点を活かしてさらなるユニークなサービスの開発を期待します。

AIを活用したサービスではユーザーがインプットしたデータを元に再学習を行い、精度を向上させていることがよくあります。しかし企業サイドとしては、使用された情報を外部保存されることには機密情報の漏洩リスクがあります。そのため、AI GIJIROKUのビジネスプランでは学習されないことになっています。Langsmith Editorのトライアルを除くPremiumとEnterpriseプランでも、入力された文章内容をサーバーに一切残さない設定になっています。サービスを選ぶ際には、サブスクリプションの条件とともにAI独特のセキュリティ問題にも目を向ける必要があります。

高校生の時には電子辞書の便利さに驚き、大学生になるとパソコンの辞書ソフトでさらに驚いていましたが、今ではgoogleで「Tango 英語」で調べれば、意味はもちろんのこと、たくさんの例文も調べることができます。これからもAIを活用したツールは開発され、言語の壁は小さくなると予想されますが、どんなにツールが便利になっても最終判断は人間にあり、ある程度のところまでは人間が理解しなければらないと思います。研究活動においてはツールのアシストを上手に利用して、これからも英語と付き合う必要があるのではないでしょうか。

関連書籍

音声認識・英語校閲に関連するケムスケ過去記事

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 超薄型、曲げられるMPU開発 セイコーエプソン
  2. 秋の褒章2011-化学
  3. 化学系プレプリントサーバ「ChemRxiv」の設立が決定
  4. 呉羽化学に課徴金2億6000万円・価格カルテルで公取委
  5. 新型卓上NMR Spinsolve 90 が販売開始
  6. 観客が分泌する化学物質を測定することで映画のレーティングが可能に…
  7. 2017年の有機ELディスプレイ世界市場は11年比6.6倍の2兆…
  8. デュポン子会社が植物性化学原料の出荷を開始

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. 浜地 格 Itaru Hamachi
  2. 特許取得のための手続き
  3. Reaxys Ph.D Prize2014ファイナリスト45名発表!
  4. マテリアルズ・インフォマティクスに欠かせないデータ整理の進め方とは?
  5. Handbook of Reagents for Organic Synthesis: Reagents for Heteroarene Functionalization
  6. 第28回光学活性化合物シンポジウム
  7. 作った分子もペコペコだけど作ったヤツもペコペコした話 –お椀型分子を利用した強誘電体メモリ–
  8. フラッシュ精製装置「バイオタージSelect」を試してみた
  9. スタニルリチウム調製の新手法
  10. BASFクリエータースペース:議論とチャレンジ

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年8月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

注目情報

最新記事

フローマイクロリアクターを活用した多置換アルケンの効率的な合成

第610回のスポットライトリサーチは、京都大学大学院理学研究科(依光研究室)に在籍されていた江 迤源…

マリンス有機化学(上)-学び手の視点から-

概要親しみやすい会話形式を用いた現代的な教育スタイルで有機化学の重要概念を学べる標準教科書.…

【大正製薬】キャリア採用情報(正社員)

<求める人物像>・自ら考えて行動できる・高い専門性を身につけている・…

国内初のナノボディ®製剤オゾラリズマブ

ナノゾラ®皮下注30mgシリンジ(一般名:オゾラリズマブ(遺伝子組換え))は、A…

大正製薬ってどんな会社?

大正製薬は病気の予防から治療まで、皆さまの健康に寄り添う事業を展開しています。こ…

一致団結ケトンでアレン合成!1,3-エンインのヒドロアルキル化

ケトンと1,3-エンインのヒドロアルキル化反応が開発された。独自の配位子とパラジウム/ホウ素/アミン…

ベテラン研究者 vs マテリアルズ・インフォマティクス!?~ 研究者としてMIとの正しい向き合い方

開催日 2024/04/24 : 申込みはこちら■開催概要近年、少子高齢化、働き手の不足…

第11回 慶應有機化学若手シンポジウム

シンポジウム概要主催:慶應有機化学若手シンポジウム実行委員会共催:慶應義塾大…

薬学部ってどんなところ?

自己紹介Chemstationの新入りスタッフのねこたまと申します。現在は学部の4年生(薬学部)…

光と水で還元的環化反応をリノベーション

第609回のスポットライトリサーチは、北海道大学 大学院薬学研究院(精密合成化学研究室)の中村顕斗 …

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP