[スポンサーリンク]

ケムステニュース

続々と提供される化学に特化したAIサービス

[スポンサーリンク]

オルツは21日、「AI GIJIROKU(AI議事録)」の分野・業種別音声認識機能として、教育向け強化音声認識エンジン「化学GIJIROKU」の提供を開始したと発表した。化学分野に特化学習した、強化音声認識エンジンで、これまでは認識不可能だった専門性の高い用語や言い回しなどに対応し、非常に高い認識精度を実現しているという。(ICT教育ニュース7月27日)

Langsmith株式会社は、2021年4月より英語論文執筆支援システム「Langsmith Editor」の正式版を世界向けに開始いたしましたが、この度、Freeプラン登録時の無料トライアル期間(7日間)にて医学・化学・生物学・機械学習・画像処理・自然言語処理各分野に特化したエンジンをお試しいただけるようになりました.   (PRTIMES 8月2日)

AIを活用したデスクワークをサポートするツールが近年数多く開発されていますが、化学においては化合物の名前や用語が特殊で、汎用のサービスではうまく機能しないことが多々あります。今回は、化学向けのオプションが機能された2つのサービスを紹介します。サービスの紹介だけでなく、実際に使用してみて使い勝手や性能も確かめました。

音声認識を活用したサービスを提供するオルツでは、会議中の発言を自動で文字に起こすサービスAI GIJIROKUを提供していますが、この度、化学分野に特化学習した強化音声認識エンジンを搭載し化学用語に特化したサービスの提供を始めました。

使い方は至って単純で、書き起こしを始めたいタイミング(会議直前など)でStart Recordingを押すと書き起こしが始まります。書き起こすだけであればGoogleやMicrosoftのサービスにも実装されていますが、このAI GIJIROKUでは、発言者を事前に登録しておくことで、誰が発言しているかを認識しLINEのトーク画面のように、誰が発言したのかを後で確認できるように編集してくれます。その場での書き起こしだけでなく、録音した音声ファイルから書き起こしをすることも可能です。スマホでもこのサービスを使用することは可能ですが、例えば突然の話し合いや、インターネット環境がなく録音しかできなかった場合でも後で書き起こすことができます。

AI GIJIROKUのメイン画面、下部の認識エンジンや発音言語下を選択後、Start Recordingで書き起こしがスタートします。書き起こしたデータは中央に保存され、選択すると確認できる。

では本題の化学に特化した音声認識についてですが、これは認識エンジンを化学と選択することで有効になります。化学だけでなく、金融、法律、日本史、世界史、保険、医療、自治体、コロナ対策、国会も選択でき、製薬、建築もリリース予定のようです。性能については、汎用音声認識との比較例が公式ページに掲載されており、化学独特の機器名や化合物名の認識率において化学の認識エンジンの方が高く、結果として高い正答率を示すようです。

では、化学研究の現場で使用されている言葉も認識できるか、ケムステ記事や論文を音読しGoogleの音声認識と比較を行いました。音読したのは「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」と「π-アリルイリジウムに新たな光を」の論文の概要に加えて、英語の題材としてスキンケア・化粧品に含まれる有害物質を巡る騒動で取り上げた「Fluorinated Compounds in North American Cosmetics」のアブストラクトです。音声の品質で差が出ないように一回の同じ音読でどちらの書き起こしも実施し、テキスト比較ツールでオリジナルの文章とどこが異なるかを比較しました。言葉によっては正しく書き起こされているものの、文字としては異なる場合もありますので、ざっと見てそれぞれの相違個所をカウントしました。

書き起こしの確認画面、音声の位置に応じて文字が緑色でハイライトされる。音声やテキストをダウンロードすることも可能

まずスルフィドの記事ですが、日本語の文章ながら化合物の名前など英語読みが多い特徴があります。Googleでもその点を概ねクリアしていますが、AI GIJIROKUでは、トリエチルボランなどもしっかりと認識されています。化学において「脱」や「付加」を物質名の前後に付けることが多々あり、この文章でも脱窒素ということが使われていますが、これに関してもAI GIJIROKUでのみ正しく認識されています。結果、AI GIJIROKUの方が相違箇所が少ない結果となりました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。アルファベットの官能基は、そのまま読んでいます(SF5であれば、エスエフファイヴ)。

次にアリルイリジウムの記事ですが、アリルイリジウムという言葉が多く登場するのが特徴です。こちらに関しては、Googleも負けず劣らず高い認識を示していますが、AI GIJIROKUではエファビレンツ誘導体を正しく書き起こしている点が圧巻です。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。

最後に英語のアブストラクトは、文章の比較だけにとどめましたが、AI GIJIROKUの方が単語の認識能が高く、また文章として成り立つように書き起こされている印象を受けました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。発音やスピードが書き起こしに向いていないのかもしれません。

総じてAI GIJIROKUの化学エンジンが高いパフォーマンスを示しましたが、宮殿性キス歌詞など一般的な言語に引き込まれている箇所もありましたので、今後の学習により精度が上がることを期待します。サービスはサブスクリプション制で、スタンダード(1500円/月、1年一括契約割引あり)とビジネス(29800円/月、1年一括契約割引あり)の2つのコースがあります。スタンダードはリーズナブルな価格で提供されていて個人や小チームでの使用に適しているようです。ビジネスは、スタンダードよりもひと月に書き起こしできる時間が長く、例えば化学を含む高精度/業種別オプションは、1000分まで月に使えます(スタンダードは100分)。スマホの普及で高音質な録音は手軽にできますが、振り返るときには、文字に起こされていたほうが理解しやすく学会の質疑応答の場面や外部との会議で役に立つのではないかと思います。

※多くの学会で対面、オンラインを問わず録音は禁止されており、許可なく録音することは問題になります。

 

次にLangsmith Editorの話題に移りますが、これはLangsmith株式会社が開発したAIで英語論文の執筆をサポートしてくれるツールで、スペルミスの訂正といった基本的な校正機能に加え、様々な言い回しや続きの文章などを提案しより自然な文章の作成をサポートするサービスです。使い方はワードなどと同じで、ブラウザー上のエディタに英文を打ち込んでいくとスペルミスなどが赤色の点線で指摘されます。ここまでは、他のエディタでも実装されていますが、Langsmith Editorでは特定の単語を選択するとAIがその単語が含まれる文章を解析し、言い回しを変えた文章がいくつか提案してくれます。提案された文章にはTypicaltiyのスコアが表示され、どの文章が一般的かを知ることができます。もちろん作成者は、どの文章を変えるかそのままにするかを自由に選択することができ、自分が作成した文章がAI提案に含まれる場合は👍が表示されます。

こちらのサービスも実際に使用してみました。具体的には書き起こしでも題材にした「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」の論文の概要を和訳し、その後Microsoft エディターで文章校正とスペルチェックを行い、その文章をLangsmith Editorにコピペして解析を行いました。

まずMicrosoft エディターでは、過去/現在形や、単数/複雑の修正が入り、またTriedがTiredになっていたのも指摘してくれました。カルボニル化合物の合成が疲れていました。

記事を英訳しMicrosoft エディターの指摘が表示された後の文章、青色の波線が指摘された箇所

次にLangsmith Editorで分析を行いました。Fieldで医学・化学・生物学・機械学習・画像処理・自然言語処理を選択することができます。また文章の使われる場所をSection nameで指定することで、それぞれに適した言い回しが提案されるようです。言い回しの選定は、文章を作りながらの方が適していると思いますが、今回は比較のため作成した文章をコピペしWhere to Rewriteで文章全体を調べました。

分野選択

セクション選択

別の表現が良い文章は、黄色かオレンジ色でハイライトされ、単語を選択すると他の言い回しが提案されます。ハイライトされていない文章もその単語を選択すると別の表現が提案されます。

Where to Rewriteをクリック後の画面

文章を選択し、異なる言い回しが表示されたときの様子

一通り提案を受け入れてみましたが、変更後の方が自然な気がしました。他者が作成した文章をそのまま和訳しそれを自分自身で評価するのは難しいですが、もうちょっと良い書き方があるとも感じました。自分で考えた文章について分析を繰り返すと自然な英文になるかもしれません。

分析と変更を数回繰り返して完成した文章。

他の機能として自動補完があり、文章の途中でtabを押すと続く文章の候補も提示してくれます。また、特定の単語が使われている論文の検索文章の典型度の比較などを行う機能も搭載されています。文章の冠詞や前置詞の置き方は、他の文章を参考して習得するのが一つの方法であるため、文章作成途中で検索や比較ができるのは大変便利だと思います。

文章の比較結果

Langsmith Editorは使用無制限のサブスクリプション制で、化学をはじめとする専門分野に対応するのはPremiumプラン(1800円/月、3か月と1年一括契約割引あり)とEnterpriseプラン(価格お問い合わせ)です。Premiumは個人ユーザーに最適で、Enterpriseでは、Premiumに加えてユーザーの管理と組織に応じた支払方法が可能であるためチームユーザーに最適だそうです。8月より無料トライアルの提供を始めており、専門分野に対応したモデルと文章の比較を7日間試すことができます。論文や学会のアブストラクトを提出する際には、誰もが言い回しにかなり気を付けると思います。気軽にネイティブに相談できる環境であったとしても、自分で考える作業は必要であり、単なる校正としてだけではなく学習目的でこちらのサービスは有用ではないでしょうか。Langsmith株式会社の創業者である伊藤拓海さんと栗林樹生さんは、東北大学大学院情報科学研究科 乾研究室 博士課程に在籍しており、大学院生の視点を活かしてさらなるユニークなサービスの開発を期待します。

AIを活用したサービスではユーザーがインプットしたデータを元に再学習を行い、精度を向上させていることがよくあります。しかし企業サイドとしては、使用された情報を外部保存されることには機密情報の漏洩リスクがあります。そのため、AI GIJIROKUのビジネスプランでは学習されないことになっています。Langsmith Editorのトライアルを除くPremiumとEnterpriseプランでも、入力された文章内容をサーバーに一切残さない設定になっています。サービスを選ぶ際には、サブスクリプションの条件とともにAI独特のセキュリティ問題にも目を向ける必要があります。

高校生の時には電子辞書の便利さに驚き、大学生になるとパソコンの辞書ソフトでさらに驚いていましたが、今ではgoogleで「Tango 英語」で調べれば、意味はもちろんのこと、たくさんの例文も調べることができます。これからもAIを活用したツールは開発され、言語の壁は小さくなると予想されますが、どんなにツールが便利になっても最終判断は人間にあり、ある程度のところまでは人間が理解しなければらないと思います。研究活動においてはツールのアシストを上手に利用して、これからも英語と付き合う必要があるのではないでしょうか。

関連書籍

音声認識・英語校閲に関連するケムスケ過去記事

Zeolinite

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. ねじれがあるアミド
  2. Advanced Real‐Time Process Analy…
  3. 米で処方せん不要の「やせ薬」発売、売り切れ続出
  4. 東レ工場炎上2人重傷 名古屋
  5. 吉岡里帆さん演じる「化学大好きDIC岡里帆(ディーアイシーおか・…
  6. 化学に触れる学びのトレイン“愛称”募集
  7. 梅干し入れると食中毒を起こしにくい?
  8. 化学大手、原油高で原料多様化・ナフサ依存下げる

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. 電子不足トリプトファン誘導体を合成する人工酵素
  2. ケムステが文部科学大臣表彰 科学技術賞を受賞しました
  3. ポルフィリン化学100年の謎を解明:calix[3]pyrroleの合成と反応性
  4. 第58回―「集積構造体を生み出すポリマー合成」Barney Grubbs教授
  5. 文具に凝るといふことを化学者もしてみむとてするなり⑩:メクボール の巻
  6. エーテル系保護基 Ether Protective Group
  7. 徹底比較 特許と論文の違い ~その他編~
  8. 2009年ロレアル・ユネスコ女性科学者 日本奨励賞発表
  9. 水素化ホウ素ナトリウム Sodium Borohydride
  10. クラブトリー触媒 Crabtree’s Catalyst

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年8月
« 7月   9月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

注目情報

注目情報

最新記事

実験手袋をいろいろ試してみたーつかいすてから高級手袋までー

前回は番外編でしたが、試してみたシリーズ本編に戻ります。引き続き実験関係の消耗品…

第164回―「光・熱エネルギーを変換するスマート材料の開発」Panče Naumov教授

第164回の海外化学者インタビューは、パンチェ・ナウモフ教授です。大阪大学大学院工学研究科 生命先端…

SNS予想で盛り上がれ!2021年ノーベル化学賞は誰の手に?

今年もノーベル賞シーズンの到来です!化学賞は日本時間 10月6日(水) 18時4…

カーボンナノチューブ薄膜のSEM画像を生成し、物性を予測するAIが開発される

先端素材高速開発技術研究組合(ADMAT)、日本ゼオンは産業技術総合研究所(AIST)と共同で、NE…

ケムステ版・ノーベル化学賞候補者リスト【2021年版】

各媒体からかき集めた情報を元に、「未来にノーベル化学賞の受賞確率がある、存命化学者」をリストアップし…

ライトケミカル工業2023卒採用情報

当社の技術グループは、20代~30代の若手社員が重要な主要案件を担当しています。広範囲で高レベルな化…

アブラナ科植物の自家不和合性をタンパク質複合体の観点から解明:天然でも希少なSP11タンパク質の立体構造予測を踏まえて

第340回のスポットライトリサーチは、東京大学 大学院農学生命科学研究科の森脇 由隆…

オンライン講演会に参加してみた~学部生の挑戦記録~

hodaです。講演会やシンポジウムのオンライン化によって学部生でもいろいろな講演会にボタンひとつで参…

令和3年度に登録された未来技術遺産が発表 ~フィッシャー・トロプシュ法や記憶媒体に関する資料が登録~

国立科学博物館は、平成20年度から重要科学技術史資料(愛称:未来技術遺産)の登録を実施しています。令…

企業研究者のためのMI入門②:Pythonを学ぶ上でのポイントとおすすめの参考書ご紹介

現在、多くの企業がデジタルトランスフォーメーション(DX)による生産性向上を試みています。特に化学メ…

Chem-Station Twitter

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP