[スポンサーリンク]

ケムステニュース

続々と提供される化学に特化したAIサービス

[スポンサーリンク]

オルツは21日、「AI GIJIROKU(AI議事録)」の分野・業種別音声認識機能として、教育向け強化音声認識エンジン「化学GIJIROKU」の提供を開始したと発表した。化学分野に特化学習した、強化音声認識エンジンで、これまでは認識不可能だった専門性の高い用語や言い回しなどに対応し、非常に高い認識精度を実現しているという。(ICT教育ニュース7月27日)

Langsmith株式会社は、2021年4月より英語論文執筆支援システム「Langsmith Editor」の正式版を世界向けに開始いたしましたが、この度、Freeプラン登録時の無料トライアル期間(7日間)にて医学・化学・生物学・機械学習・画像処理・自然言語処理各分野に特化したエンジンをお試しいただけるようになりました.   (PRTIMES 8月2日)

AIを活用したデスクワークをサポートするツールが近年数多く開発されていますが、化学においては化合物の名前や用語が特殊で、汎用のサービスではうまく機能しないことが多々あります。今回は、化学向けのオプションが機能された2つのサービスを紹介します。サービスの紹介だけでなく、実際に使用してみて使い勝手や性能も確かめました。

音声認識を活用したサービスを提供するオルツでは、会議中の発言を自動で文字に起こすサービスAI GIJIROKUを提供していますが、この度、化学分野に特化学習した強化音声認識エンジンを搭載し化学用語に特化したサービスの提供を始めました。

使い方は至って単純で、書き起こしを始めたいタイミング(会議直前など)でStart Recordingを押すと書き起こしが始まります。書き起こすだけであればGoogleやMicrosoftのサービスにも実装されていますが、このAI GIJIROKUでは、発言者を事前に登録しておくことで、誰が発言しているかを認識しLINEのトーク画面のように、誰が発言したのかを後で確認できるように編集してくれます。その場での書き起こしだけでなく、録音した音声ファイルから書き起こしをすることも可能です。スマホでもこのサービスを使用することは可能ですが、例えば突然の話し合いや、インターネット環境がなく録音しかできなかった場合でも後で書き起こすことができます。

AI GIJIROKUのメイン画面、下部の認識エンジンや発音言語下を選択後、Start Recordingで書き起こしがスタートします。書き起こしたデータは中央に保存され、選択すると確認できる。

では本題の化学に特化した音声認識についてですが、これは認識エンジンを化学と選択することで有効になります。化学だけでなく、金融、法律、日本史、世界史、保険、医療、自治体、コロナ対策、国会も選択でき、製薬、建築もリリース予定のようです。性能については、汎用音声認識との比較例が公式ページに掲載されており、化学独特の機器名や化合物名の認識率において化学の認識エンジンの方が高く、結果として高い正答率を示すようです。

では、化学研究の現場で使用されている言葉も認識できるか、ケムステ記事や論文を音読しGoogleの音声認識と比較を行いました。音読したのは「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」と「π-アリルイリジウムに新たな光を」の論文の概要に加えて、英語の題材としてスキンケア・化粧品に含まれる有害物質を巡る騒動で取り上げた「Fluorinated Compounds in North American Cosmetics」のアブストラクトです。音声の品質で差が出ないように一回の同じ音読でどちらの書き起こしも実施し、テキスト比較ツールでオリジナルの文章とどこが異なるかを比較しました。言葉によっては正しく書き起こされているものの、文字としては異なる場合もありますので、ざっと見てそれぞれの相違個所をカウントしました。

書き起こしの確認画面、音声の位置に応じて文字が緑色でハイライトされる。音声やテキストをダウンロードすることも可能

まずスルフィドの記事ですが、日本語の文章ながら化合物の名前など英語読みが多い特徴があります。Googleでもその点を概ねクリアしていますが、AI GIJIROKUでは、トリエチルボランなどもしっかりと認識されています。化学において「脱」や「付加」を物質名の前後に付けることが多々あり、この文章でも脱窒素ということが使われていますが、これに関してもAI GIJIROKUでのみ正しく認識されています。結果、AI GIJIROKUの方が相違箇所が少ない結果となりました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。アルファベットの官能基は、そのまま読んでいます(SF5であれば、エスエフファイヴ)。

次にアリルイリジウムの記事ですが、アリルイリジウムという言葉が多く登場するのが特徴です。こちらに関しては、Googleも負けず劣らず高い認識を示していますが、AI GIJIROKUではエファビレンツ誘導体を正しく書き起こしている点が圧巻です。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。

最後に英語のアブストラクトは、文章の比較だけにとどめましたが、AI GIJIROKUの方が単語の認識能が高く、また文章として成り立つように書き起こされている印象を受けました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。発音やスピードが書き起こしに向いていないのかもしれません。

総じてAI GIJIROKUの化学エンジンが高いパフォーマンスを示しましたが、宮殿性キス歌詞など一般的な言語に引き込まれている箇所もありましたので、今後の学習により精度が上がることを期待します。サービスはサブスクリプション制で、スタンダード(1500円/月、1年一括契約割引あり)とビジネス(29800円/月、1年一括契約割引あり)の2つのコースがあります。スタンダードはリーズナブルな価格で提供されていて個人や小チームでの使用に適しているようです。ビジネスは、スタンダードよりもひと月に書き起こしできる時間が長く、例えば化学を含む高精度/業種別オプションは、1000分まで月に使えます(スタンダードは100分)。スマホの普及で高音質な録音は手軽にできますが、振り返るときには、文字に起こされていたほうが理解しやすく学会の質疑応答の場面や外部との会議で役に立つのではないかと思います。

※多くの学会で対面、オンラインを問わず録音は禁止されており、許可なく録音することは問題になります。

 

次にLangsmith Editorの話題に移りますが、これはLangsmith株式会社が開発したAIで英語論文の執筆をサポートしてくれるツールで、スペルミスの訂正といった基本的な校正機能に加え、様々な言い回しや続きの文章などを提案しより自然な文章の作成をサポートするサービスです。使い方はワードなどと同じで、ブラウザー上のエディタに英文を打ち込んでいくとスペルミスなどが赤色の点線で指摘されます。ここまでは、他のエディタでも実装されていますが、Langsmith Editorでは特定の単語を選択するとAIがその単語が含まれる文章を解析し、言い回しを変えた文章がいくつか提案してくれます。提案された文章にはTypicaltiyのスコアが表示され、どの文章が一般的かを知ることができます。もちろん作成者は、どの文章を変えるかそのままにするかを自由に選択することができ、自分が作成した文章がAI提案に含まれる場合は👍が表示されます。

こちらのサービスも実際に使用してみました。具体的には書き起こしでも題材にした「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」の論文の概要を和訳し、その後Microsoft エディターで文章校正とスペルチェックを行い、その文章をLangsmith Editorにコピペして解析を行いました。

まずMicrosoft エディターでは、過去/現在形や、単数/複雑の修正が入り、またTriedがTiredになっていたのも指摘してくれました。カルボニル化合物の合成が疲れていました。

記事を英訳しMicrosoft エディターの指摘が表示された後の文章、青色の波線が指摘された箇所

次にLangsmith Editorで分析を行いました。Fieldで医学・化学・生物学・機械学習・画像処理・自然言語処理を選択することができます。また文章の使われる場所をSection nameで指定することで、それぞれに適した言い回しが提案されるようです。言い回しの選定は、文章を作りながらの方が適していると思いますが、今回は比較のため作成した文章をコピペしWhere to Rewriteで文章全体を調べました。

分野選択

セクション選択

別の表現が良い文章は、黄色かオレンジ色でハイライトされ、単語を選択すると他の言い回しが提案されます。ハイライトされていない文章もその単語を選択すると別の表現が提案されます。

Where to Rewriteをクリック後の画面

文章を選択し、異なる言い回しが表示されたときの様子

一通り提案を受け入れてみましたが、変更後の方が自然な気がしました。他者が作成した文章をそのまま和訳しそれを自分自身で評価するのは難しいですが、もうちょっと良い書き方があるとも感じました。自分で考えた文章について分析を繰り返すと自然な英文になるかもしれません。

分析と変更を数回繰り返して完成した文章。

他の機能として自動補完があり、文章の途中でtabを押すと続く文章の候補も提示してくれます。また、特定の単語が使われている論文の検索文章の典型度の比較などを行う機能も搭載されています。文章の冠詞や前置詞の置き方は、他の文章を参考して習得するのが一つの方法であるため、文章作成途中で検索や比較ができるのは大変便利だと思います。

文章の比較結果

Langsmith Editorは使用無制限のサブスクリプション制で、化学をはじめとする専門分野に対応するのはPremiumプラン(1800円/月、3か月と1年一括契約割引あり)とEnterpriseプラン(価格お問い合わせ)です。Premiumは個人ユーザーに最適で、Enterpriseでは、Premiumに加えてユーザーの管理と組織に応じた支払方法が可能であるためチームユーザーに最適だそうです。8月より無料トライアルの提供を始めており、専門分野に対応したモデルと文章の比較を7日間試すことができます。論文や学会のアブストラクトを提出する際には、誰もが言い回しにかなり気を付けると思います。気軽にネイティブに相談できる環境であったとしても、自分で考える作業は必要であり、単なる校正としてだけではなく学習目的でこちらのサービスは有用ではないでしょうか。Langsmith株式会社の創業者である伊藤拓海さんと栗林樹生さんは、東北大学大学院情報科学研究科 乾研究室 博士課程に在籍しており、大学院生の視点を活かしてさらなるユニークなサービスの開発を期待します。

AIを活用したサービスではユーザーがインプットしたデータを元に再学習を行い、精度を向上させていることがよくあります。しかし企業サイドとしては、使用された情報を外部保存されることには機密情報の漏洩リスクがあります。そのため、AI GIJIROKUのビジネスプランでは学習されないことになっています。Langsmith Editorのトライアルを除くPremiumとEnterpriseプランでも、入力された文章内容をサーバーに一切残さない設定になっています。サービスを選ぶ際には、サブスクリプションの条件とともにAI独特のセキュリティ問題にも目を向ける必要があります。

高校生の時には電子辞書の便利さに驚き、大学生になるとパソコンの辞書ソフトでさらに驚いていましたが、今ではgoogleで「Tango 英語」で調べれば、意味はもちろんのこと、たくさんの例文も調べることができます。これからもAIを活用したツールは開発され、言語の壁は小さくなると予想されますが、どんなにツールが便利になっても最終判断は人間にあり、ある程度のところまでは人間が理解しなければらないと思います。研究活動においてはツールのアシストを上手に利用して、これからも英語と付き合う必要があるのではないでしょうか。

関連書籍

音声認識・英語校閲に関連するケムスケ過去記事

Zeolinite

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 高峰譲吉の「アドレナリン」107年目”名誉回復…
  2. 三菱化学、より自然光に近い白色LED用の材料開発
  3. 第15回光学活性シンポジウム
  4. アルツハイマー薬で副作用死
  5. 積水化学と住友化学、サーキュラーエコノミーで協力。ゴミ原料にポリ…
  6. シイタケ由来成分に抗アレルギー効果を確認
  7. 化学大手9月中間 三井化学と旭化成が経常減益
  8. 伯東、高機能高分子材料「デンドリマー」、製造期間10分の1に

コメント、感想はこちらへ

注目情報

ピックアップ記事

  1. グラクソ、抗血栓症薬「アリクストラ」の承認を取得
  2. ネオ元素周期表
  3. 立体規則性および配列を制御した新しい高分子合成法
  4. 今年も出ます!サイエンスアゴラ2014
  5. 研究者よ景色を描け!
  6. ミッドランド還元 Midland Reduction
  7. サミュエル・ダニシェフスキー Samuel J. Danishefsky
  8. 3.11 14:46 ①
  9. ポーソン・カーン反応 Pauson-Khand Reaction
  10. サリンを検出可能な有機化合物

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年8月
« 7月   9月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

注目情報

注目情報

最新記事

【書籍】セルプロセッシング工学 (増補) –抗体医薬から再生医療まで–

今回ご紹介する書籍「セルプロセッシング工学 (増補) –抗体医薬から再生医療まで–」は、20…

芳香環にフッ素を導入しながら変形する: 有機フッ素化合物の新規合成法の開発に成功

第361回のスポットライトリサーチは、早稲田大学大学院先進理工学研究科(山口潤一郎研究室)小松田 雅…

湘南ヘルスイノベーションパークがケムステVプレミアレクチャーに協賛しました

レジェンド化学者もしくは第一人者の長時間講演を完全無料で放映する、ケムステVプレ…

化学企業が相次いで学会や顧客から表彰される

武蔵エナジーソリューションズ株式会社に所属する研究者が、2022年度電気化学会技術賞(棚橋賞)を受賞…

第20回次世代を担う有機化学シンポジウム

第20回記念!今年は若手向けの新企画もやります!「若手研究者が口頭発表する機会や自由闊達にディス…

ビナミジニウム塩 Vinamidinium Salt

概要ビナミジニウム塩(Vinamidinium Salt)は、カルボン酸をヴィルスマイヤー・ハッ…

伝わるデザインの基本 増補改訂3版 よい資料を作るためのレイアウトのルール

(さらに…)…

生体医用イメージングを志向した第二近赤外光(NIR-II)色素:②合成蛍光色素

バイオイメージングにおけるの先端領域の一つである「第二近赤外光(NIR-II)色素」についての総説を…

高分子鎖デザインがもたらすポリマーサイエンスの再創造|オンライン・対面併設|進化する高分子材料 表面・界面制御 Advanced コース

開講期間●令和4年 2月  14日(月)、17日(木):基礎編●       21日(月)、…

ホウ素化反応の常識を覆し分岐型アルケンの製造工程を大幅短縮

第 360回のスポットライトリサーチは、広島大学大学院 先進理工系科学研究科 博士課…

Chem-Station Twitter

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP