[スポンサーリンク]

ケムステニュース

続々と提供される化学に特化したAIサービス

[スポンサーリンク]

オルツは21日、「AI GIJIROKU(AI議事録)」の分野・業種別音声認識機能として、教育向け強化音声認識エンジン「化学GIJIROKU」の提供を開始したと発表した。化学分野に特化学習した、強化音声認識エンジンで、これまでは認識不可能だった専門性の高い用語や言い回しなどに対応し、非常に高い認識精度を実現しているという。(ICT教育ニュース7月27日)

Langsmith株式会社は、2021年4月より英語論文執筆支援システム「Langsmith Editor」の正式版を世界向けに開始いたしましたが、この度、Freeプラン登録時の無料トライアル期間(7日間)にて医学・化学・生物学・機械学習・画像処理・自然言語処理各分野に特化したエンジンをお試しいただけるようになりました.   (PRTIMES 8月2日)

AIを活用したデスクワークをサポートするツールが近年数多く開発されていますが、化学においては化合物の名前や用語が特殊で、汎用のサービスではうまく機能しないことが多々あります。今回は、化学向けのオプションが機能された2つのサービスを紹介します。サービスの紹介だけでなく、実際に使用してみて使い勝手や性能も確かめました。

音声認識を活用したサービスを提供するオルツでは、会議中の発言を自動で文字に起こすサービスAI GIJIROKUを提供していますが、この度、化学分野に特化学習した強化音声認識エンジンを搭載し化学用語に特化したサービスの提供を始めました。

使い方は至って単純で、書き起こしを始めたいタイミング(会議直前など)でStart Recordingを押すと書き起こしが始まります。書き起こすだけであればGoogleやMicrosoftのサービスにも実装されていますが、このAI GIJIROKUでは、発言者を事前に登録しておくことで、誰が発言しているかを認識しLINEのトーク画面のように、誰が発言したのかを後で確認できるように編集してくれます。その場での書き起こしだけでなく、録音した音声ファイルから書き起こしをすることも可能です。スマホでもこのサービスを使用することは可能ですが、例えば突然の話し合いや、インターネット環境がなく録音しかできなかった場合でも後で書き起こすことができます。

AI GIJIROKUのメイン画面、下部の認識エンジンや発音言語下を選択後、Start Recordingで書き起こしがスタートします。書き起こしたデータは中央に保存され、選択すると確認できる。

では本題の化学に特化した音声認識についてですが、これは認識エンジンを化学と選択することで有効になります。化学だけでなく、金融、法律、日本史、世界史、保険、医療、自治体、コロナ対策、国会も選択でき、製薬、建築もリリース予定のようです。性能については、汎用音声認識との比較例が公式ページに掲載されており、化学独特の機器名や化合物名の認識率において化学の認識エンジンの方が高く、結果として高い正答率を示すようです。

では、化学研究の現場で使用されている言葉も認識できるか、ケムステ記事や論文を音読しGoogleの音声認識と比較を行いました。音読したのは「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」と「π-アリルイリジウムに新たな光を」の論文の概要に加えて、英語の題材としてスキンケア・化粧品に含まれる有害物質を巡る騒動で取り上げた「Fluorinated Compounds in North American Cosmetics」のアブストラクトです。音声の品質で差が出ないように一回の同じ音読でどちらの書き起こしも実施し、テキスト比較ツールでオリジナルの文章とどこが異なるかを比較しました。言葉によっては正しく書き起こされているものの、文字としては異なる場合もありますので、ざっと見てそれぞれの相違個所をカウントしました。

書き起こしの確認画面、音声の位置に応じて文字が緑色でハイライトされる。音声やテキストをダウンロードすることも可能

まずスルフィドの記事ですが、日本語の文章ながら化合物の名前など英語読みが多い特徴があります。Googleでもその点を概ねクリアしていますが、AI GIJIROKUでは、トリエチルボランなどもしっかりと認識されています。化学において「脱」や「付加」を物質名の前後に付けることが多々あり、この文章でも脱窒素ということが使われていますが、これに関してもAI GIJIROKUでのみ正しく認識されています。結果、AI GIJIROKUの方が相違箇所が少ない結果となりました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。アルファベットの官能基は、そのまま読んでいます(SF5であれば、エスエフファイヴ)。

次にアリルイリジウムの記事ですが、アリルイリジウムという言葉が多く登場するのが特徴です。こちらに関しては、Googleも負けず劣らず高い認識を示していますが、AI GIJIROKUではエファビレンツ誘導体を正しく書き起こしている点が圧巻です。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。

最後に英語のアブストラクトは、文章の比較だけにとどめましたが、AI GIJIROKUの方が単語の認識能が高く、また文章として成り立つように書き起こされている印象を受けました。

オリジナルの文章(左)とGoogleによる書き起こし(中央)、AI GIJIROKUの化学エンジンを使った書き起こし(右)で緑のハイライトがオリジナルと異なる箇所。発音やスピードが書き起こしに向いていないのかもしれません。

総じてAI GIJIROKUの化学エンジンが高いパフォーマンスを示しましたが、宮殿性キス歌詞など一般的な言語に引き込まれている箇所もありましたので、今後の学習により精度が上がることを期待します。サービスはサブスクリプション制で、スタンダード(1500円/月、1年一括契約割引あり)とビジネス(29800円/月、1年一括契約割引あり)の2つのコースがあります。スタンダードはリーズナブルな価格で提供されていて個人や小チームでの使用に適しているようです。ビジネスは、スタンダードよりもひと月に書き起こしできる時間が長く、例えば化学を含む高精度/業種別オプションは、1000分まで月に使えます(スタンダードは100分)。スマホの普及で高音質な録音は手軽にできますが、振り返るときには、文字に起こされていたほうが理解しやすく学会の質疑応答の場面や外部との会議で役に立つのではないかと思います。

※多くの学会で対面、オンラインを問わず録音は禁止されており、許可なく録音することは問題になります。

 

次にLangsmith Editorの話題に移りますが、これはLangsmith株式会社が開発したAIで英語論文の執筆をサポートしてくれるツールで、スペルミスの訂正といった基本的な校正機能に加え、様々な言い回しや続きの文章などを提案しより自然な文章の作成をサポートするサービスです。使い方はワードなどと同じで、ブラウザー上のエディタに英文を打ち込んでいくとスペルミスなどが赤色の点線で指摘されます。ここまでは、他のエディタでも実装されていますが、Langsmith Editorでは特定の単語を選択するとAIがその単語が含まれる文章を解析し、言い回しを変えた文章がいくつか提案してくれます。提案された文章にはTypicaltiyのスコアが表示され、どの文章が一般的かを知ることができます。もちろん作成者は、どの文章を変えるかそのままにするかを自由に選択することができ、自分が作成した文章がAI提案に含まれる場合は👍が表示されます。

こちらのサービスも実際に使用してみました。具体的には書き起こしでも題材にした「フッフッフッフッフッ(F5)、これからはCF3からSF5にスルフィド(S)」の論文の概要を和訳し、その後Microsoft エディターで文章校正とスペルチェックを行い、その文章をLangsmith Editorにコピペして解析を行いました。

まずMicrosoft エディターでは、過去/現在形や、単数/複雑の修正が入り、またTriedがTiredになっていたのも指摘してくれました。カルボニル化合物の合成が疲れていました。

記事を英訳しMicrosoft エディターの指摘が表示された後の文章、青色の波線が指摘された箇所

次にLangsmith Editorで分析を行いました。Fieldで医学・化学・生物学・機械学習・画像処理・自然言語処理を選択することができます。また文章の使われる場所をSection nameで指定することで、それぞれに適した言い回しが提案されるようです。言い回しの選定は、文章を作りながらの方が適していると思いますが、今回は比較のため作成した文章をコピペしWhere to Rewriteで文章全体を調べました。

分野選択

セクション選択

別の表現が良い文章は、黄色かオレンジ色でハイライトされ、単語を選択すると他の言い回しが提案されます。ハイライトされていない文章もその単語を選択すると別の表現が提案されます。

Where to Rewriteをクリック後の画面

文章を選択し、異なる言い回しが表示されたときの様子

一通り提案を受け入れてみましたが、変更後の方が自然な気がしました。他者が作成した文章をそのまま和訳しそれを自分自身で評価するのは難しいですが、もうちょっと良い書き方があるとも感じました。自分で考えた文章について分析を繰り返すと自然な英文になるかもしれません。

分析と変更を数回繰り返して完成した文章。

他の機能として自動補完があり、文章の途中でtabを押すと続く文章の候補も提示してくれます。また、特定の単語が使われている論文の検索文章の典型度の比較などを行う機能も搭載されています。文章の冠詞や前置詞の置き方は、他の文章を参考して習得するのが一つの方法であるため、文章作成途中で検索や比較ができるのは大変便利だと思います。

文章の比較結果

Langsmith Editorは使用無制限のサブスクリプション制で、化学をはじめとする専門分野に対応するのはPremiumプラン(1800円/月、3か月と1年一括契約割引あり)とEnterpriseプラン(価格お問い合わせ)です。Premiumは個人ユーザーに最適で、Enterpriseでは、Premiumに加えてユーザーの管理と組織に応じた支払方法が可能であるためチームユーザーに最適だそうです。8月より無料トライアルの提供を始めており、専門分野に対応したモデルと文章の比較を7日間試すことができます。論文や学会のアブストラクトを提出する際には、誰もが言い回しにかなり気を付けると思います。気軽にネイティブに相談できる環境であったとしても、自分で考える作業は必要であり、単なる校正としてだけではなく学習目的でこちらのサービスは有用ではないでしょうか。Langsmith株式会社の創業者である伊藤拓海さんと栗林樹生さんは、東北大学大学院情報科学研究科 乾研究室 博士課程に在籍しており、大学院生の視点を活かしてさらなるユニークなサービスの開発を期待します。

AIを活用したサービスではユーザーがインプットしたデータを元に再学習を行い、精度を向上させていることがよくあります。しかし企業サイドとしては、使用された情報を外部保存されることには機密情報の漏洩リスクがあります。そのため、AI GIJIROKUのビジネスプランでは学習されないことになっています。Langsmith Editorのトライアルを除くPremiumとEnterpriseプランでも、入力された文章内容をサーバーに一切残さない設定になっています。サービスを選ぶ際には、サブスクリプションの条件とともにAI独特のセキュリティ問題にも目を向ける必要があります。

高校生の時には電子辞書の便利さに驚き、大学生になるとパソコンの辞書ソフトでさらに驚いていましたが、今ではgoogleで「Tango 英語」で調べれば、意味はもちろんのこと、たくさんの例文も調べることができます。これからもAIを活用したツールは開発され、言語の壁は小さくなると予想されますが、どんなにツールが便利になっても最終判断は人間にあり、ある程度のところまでは人間が理解しなければらないと思います。研究活動においてはツールのアシストを上手に利用して、これからも英語と付き合う必要があるのではないでしょうか。

関連書籍

[amazonjs asin=”4254146752″ locale=”JP” title=”化学英語30講: リーディング・文法・リスニング (やさしい化学30講シリーズ)”] [amazonjs asin=”486312225X” locale=”JP” title=”Basic English for Chemistry―理工系学生のための基礎英語≪化学≫”]

音声認識・英語校閲に関連するケムスケ過去記事

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 武田薬、糖尿病治療剤「アクトス」の効能を追加申請
  2. 光で分子の結合状態を変えることに成功
  3. 信越化学1四半期決算…自動車や電気向け好調で増収増益…
  4. 製薬各社 2010年度決算
  5. 理研:23日に一般公開、「実験ジャー」も登場--和光 /埼玉
  6. 名大・山本名誉教授に 「テトラへドロン賞」 有機化学分野で業績
  7. 第35回構造有機化学討論会
  8. 全薬工業とゼファーマ、外用抗真菌薬「ラノコナゾール」配合の水虫治…

注目情報

ピックアップ記事

  1. カセロネス鉱山
  2. 半導体ナノ結晶に配位した芳香族系有機化合物が可視光線で可逆的に脱離する機構を解明!
  3. カルバメート系保護基 Carbamate Protection
  4. ダン・シングルトン Daniel Singleton
  5. 3色に変化する熱活性化遅延蛍光材料の開発
  6. ウィリアム・キャンベル William C. Campbell
  7. グルタミン酸 / Glutamic Acid
  8. ノーベル賞の合理的予測はなぜ難しくなったのか?
  9. 室内照明で部屋をきれいに 汚れ防ぐ物質「光触媒」を高度化
  10. 有機合成化学協会誌2024年7月号:イミン類縁体・縮環アズレン・C–O結合ホモリシス・ハロカルビン・触媒的バイオマス分解

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年8月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

注目情報

最新記事

小型でも妥協なし!幅広い化合物をサチレーションフリーのELSDで検出

UV吸収のない化合物を精製する際、一定量でフラクションをすべて収集し、TLCで呈色試…

第48回ケムステVシンポ「ペプチド創薬のフロントランナーズ」を開催します!

いよいよ本年もあと僅かとなって参りましたが、皆様いかがお過ごしでしょうか。冬…

3つのラジカルを自由自在!アルケンのアリール–アルキル化反応

アルケンの位置選択的なアリール–アルキル化反応が報告された。ラジカルソーティングを用いた三種類のラジ…

【日産化学 26卒/Zoomウェビナー配信!】START your ChemiSTORY あなたの化学をさがす 研究職限定 キャリアマッチングLIVE

3日間で10領域の研究職社員がプレゼンテーション!日産化学の全研究領域を公開する、研…

ミトコンドリア内タンパク質を分解する標的タンパク質分解技術「mitoTPD」の開発

第 631 回のスポットライトリサーチは、東北大学大学院 生命科学研究科 修士課程2…

永木愛一郎 Aiichiro Nagaki

永木愛一郎(1973年1月23日-)は、日本の化学者である。現在北海道大学大学院理学研究院化学部…

11/16(土)Zoom開催 【10:30~博士課程×女性のキャリア】 【14:00~富士フイルム・レゾナック 女子学生のためのセミナー】

化学系の就職活動を支援する『化学系学生のための就活』からのご案内です。11/16…

KISTEC教育講座『中間水コンセプトによるバイオ・医療材料開発』 ~水・生体環境下で優れた機能を発揮させるための材料・表面・デバイス設計~

 開講期間 令和6年12月10日(火)、11日(水)詳細・お申し込みはこちら2 コースの…

【太陽ホールディングス】新卒採用情報(2026卒)

■■求める人物像■■「大きな志と好奇心を持ちまだ見ぬ価値造像のために前進できる人…

産総研の研究室見学に行ってきました!~採用情報や研究の現場について~

こんにちは,熊葛です.先日,産総研 生命工学領域の開催する研究室見学に行ってきました!本記事では,産…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP