[スポンサーリンク]

化学者のつぶやき

Google翻訳の精度が飛躍的に向上!~その活用法を考える~

先日よりネット上で話題となっているGoogle翻訳。機械学習の導入により、その飛躍的な精度向上が達成されました。今回のアップデートにより、かつて想像すらできなかった用途も見えてきたように思えます。

今回の記事は、「化学者視点から新Google翻訳の活用法を考える」がテーマです。「化学研究ライフハック」シリーズの一つと捉えて頂ければ幸いです。

まずはその精度をご覧あれ!

試しに筆者が最近発表した論文のアブストラクトを、Google翻訳で和訳してみました。Google Chromeなら右クリックメニューで一発ですが、本家サイトにコピペするほうがどことなく精度が高そうに見えます。

google_translate_2

・・・既にほとんど完璧です。明らかな論理的間違いもほぼなく、黄色でハイライトしたところが日本語ネイティブとしては気になる程度です。この部分をちょちょいと手直しすれば、それだけで日本語版要旨が完成してしまいます(下記③)。こりゃあ凄ぇぜ!

③:②を推敲した文章
天然タンパク質の化学修飾は、遺伝子操作に依存する補完的方法によって容易にアクセスできない超自然タンパク質機能の産生を促すことができる。しかしながら、構造の完全性および均質性を維持しながら選択性を正確に制御することは依然として挑戦的課題である。 本論文では、有機ラジカルに基づく、遷移金属を含まず自然な条件下で行えるトリプトファン選択的タンパク質生体共役反応を報告する。(赤字は修正箇所)

ちなみに同じ文章を従来型自動翻訳サービス(エキサイト翻訳)で和訳してみると、間違ってはいない?ものの実用レベルからほど遠い文章が出力されました。読みやすい日本語に直そうとしても大変で、一から書き直す方が楽ちんかも知れません。

google_translate_3

研究・教育面での活用アイデア

これほどのハイクオリティサービスですから、現場の化学者視点からは実用アイデアが幾つも思い浮かびます。例を挙げてみましょう。

教員A:『英文添削を頼む前にGoogle翻訳でチェックして、変な文章じゃないか確認してから持って来てください』

教員側の指導コストを下げつつ、もっとも良質なアウトプットが出せそうな工夫がこれだと思えます。

例えば国際学会発表の要旨を修士学生が書くとします。学生の英語力が不足している場合、教員自らが全てを書き直したりするケースも多々あると思われます。しかし指導側がそもそも得意とするのは英語ではなく研究・科学のはずです。毎度ゼロから英語を書くハメになるのは、多くの場合かなりの負担ではないでしょうか。

しかしこのひと手間を学生に挟んで貰うだけで、添削にかかる労力はだいぶ減るように思えます。

「そんなものに頼っている限り英語力なんて向上しないよ!」とするマッチョ見解の方も当然いらっしゃるかと思います。とはいえ、科学文章にはさほど凝った表現を必要としませんし、フォーマットもほとんどお決まりです。「日本人レベルならもーこれでいいんじゃない?」程度の英文は、この方法で楽に作れるでしょうし、結果的に整った文にできる確率もぐんと上がるように思えます。

もちろん指導側に相応の英語力が必要とされる事実は変わりませんが、添削コストが下がる分、より本質的なサイエンス面・内容面での指導に時間を割けるようになるのは、大きなメリットだと思います。

教員B:『新着論文は毎日読みなさい!・・でも最初のうちはアブストラクトをGoogle翻訳して追えばいいですよ』

学術論文はアブストラクトに言いたいことが余さず書いてあるものなので、アブストラクトをざっと眺めることで読むべき論文を効率良くスクリーニングできます

この目的にはRSSリーダーをお使いの方が多いと思いますが、英語アブストを飛ばしてタイトルとTOCの絵を眺めて終わり、とする方もおそらく多いでしょう(∵有機化学はそれが簡単にできてしまう!)。とはいえアブスト文も参考情報として拾えるなら、それに越したことはありません。

これについてはRSSリーダーをまるごとGoogle和訳してしまうことで、情報処理コストが大幅に下げられます。母国語であれば、アブストラクト数十本/日 程度なら余裕でナナメ読みできるからです。

たとえばFeedlyをGoogle Chromeで丸ごと翻訳したのが下のキャプチャ画像です。Google翻訳はGoogle Scholarも学習の餌にしているせいか、専門用語もかなり適切に訳してくれるのが特徴です。研究論文の読解に慣れない院生はもちろん、異分野の情報を攫わねばならないプロ研究者にとっても、有益なスクリーニング法になってくれるでしょう。

google_translate_5

その一方で、論文丸ごとをGoogle翻訳で読もうとするのはお薦めしません。現行の翻訳精度では論旨を正確に追いづらく、誤った解釈を引き出してしまうリスクがあります。また、PDFから毎度コピペするのも一手間です。

Google翻訳はアブストラクト閲覧だけ、読むべき論文のスクリーニングを高速化するだけ、と割り切っておく姿勢が無難ではないかと思えます。

研究者C:『今書いてる論文は同じようなintroductionなので、Google翻訳で文章を作ってしまおう』

英文をGoogle和訳して手直しし、それを再度Google英訳してみます。すると、文意はほぼ同じながら表現の全く異なる英文が出力されてきます。

google_translate_6さらにここからが重要なのですが、①【原文】と⑤【再英訳文】をコピペチェッカー(CopyDetect)で比較してみたところ、原文一致率が40%程度にまで下がることが分かりました。つまりたったこれだけの作業で、機械側でもコピペの是非判定が怪しくなるのです。使用せざるを得ない専門用語・言い回しが存在するため、一致率低減にも下限があることを考慮に入れると、これは驚くべき結果ではないでしょうか。

google_translate_7

似たようなイントロを沢山書くような分野であれば、このやり方で適当に文章を変えてしまうだけでバリエーションが付けられ、論文書きを圧倒的にスピードアップさせることもできそうです。

さてここで問題です。これは「コピペ」と呼んで良いのでしょうか?大元の文章は、実際には跡形もなくなっています。

科学における剽窃・コピペは概念・アイデアに対してこそのものであるため、文章の使い回しは実のところ大した問題では無い・・・という見解もあってよいかもしれません。しかし自分が書いた文を加工するだけならまだしも、他人の文章をこうしてしまうのは、流石に気が引ける気もします。そもそもAIで出力した文章の著作権自体、激論の渦中にある話です。いずれにせよ既に、研究者ごとの倫理感に大きく依存した話になっていると言えそうです。

学生D:『論文を丸ごと翻訳して短くすれば、抄録集が簡単につくれるじゃん!』

英語論文を和文要約して共有する「抄録会」は、多くのラボで取り組まれていることと思います。それが実施される背景の一つには「英語論文を読み解くことに対するハードル」があります。つまり、英語論文をフォローする作業は日本語の数倍時間がかかってしまうので、独力でやると大変である、ならばラボメンバーで分担するのがよいだろう・・・との考えから取り組まれている面もあるように思われます。

上でも述べましたが精度の問題があるため、論文丸ごとをGoogle翻訳して読もうとすることは、現状お薦めできません。しかし抄録作成であれば、原著論文と照らし合わせつつ文章の推敲が入るため、最終的に問題の少ない文章に仕上がる可能性が高くなります。もとからある日本語を添削・要約する作業は、ゼロベースの和文抄録作成作業に比べて、格段に速く行えるのも当然ながら利点となります。

これを別角度から見ると、「単発で論文を和訳要約するだけの抄録会」は教育効果が薄くなっていく宿命にあるとも捉えられます。Google翻訳を使うだけで誰でも簡単にできてしまうからです。英語に関する負担が下がることをよい機会ととらえ、周辺分野の論文に手を出すようにしてみる、複数の論文をストーリーを持たせながらまとめる、などはあるべき指導方針・改善方針かも知れません。

いずれにせよ、クオリティアップを志向した時間の使い方が可能になることは、好ましい変化だと思います。

おわりに

新Google翻訳は恐るべき精度であり、我が国で行われているグローバル化・早期英語教育などの施策にすら一石を投じうる、凄まじいイノベーションだと思います。

この登場に伴い、科学研究・教育現場では、以下の事項にこそより一層の重きが置かれはじめるだろうと筆者個人は考えます。

  • 英語よりも、日本語を論理的に扱えるスキル
  • 言語・文章よりも、その中身となる革新性・創造性・知的興味深さ
  • どういう背景からその内容が発せられたのかという、互いの文化・背景的差異に関する理解

あまりにも便利すぎるサービスゆえ、Google翻訳の普及を止める術はおそらく誰も持ち得ないでしょう。ならば「英語力が付かないから」と安直に禁止してしまうのではなく、このサービスを上手く使った教育形態・研究形態を模索していく取り組みこそが、合理的選択となるように思われます。

AIが及ばないレベルで自然な文章に推敲するだとか、科学の誤りを判定するだとかまではGoogleにもできないでしょうから、教員側・研究者側に一定以上の文章力・英語力が求められることは、今後とも変わりがありません。ただ以前に比べ、かなり高水準のスキルが求められてしまうことも、間違いないと思われます。先端研究をこなしながらこのレベルを維持できる人材は少ないでしょうから、「ある程度はGoogle翻訳に頼る、それ以上は専門の校閲業者に任せればいい」・・・と割り切りはじめる研究者・技術者も、今後沢山出てくるはずです。とはいえ、トータルで科学の進歩効率が上がるのなら、むしろ歓迎されるべき変化と言ってよいのかも知れません。

未来を生き抜く上で、必要なことは何なのか?必要無くなることは何なのか?――この問いに対する答えは日進月歩で変わりうるものだと、今回改めて思い知らされました。一方で、これほどまでにエキサイティングな時代を生きられることは、素晴らしいことにも思えます。便利なツールを日々取り入れていくことで、良い研究・教育ライフを送っていきたいものです。

関連書籍

関連リンク

The following two tabs change content below.
cosine

cosine

博士(薬学)。Chem-Station副代表。現在国立大学教員として勤務中。専門は有機合成化学、主に触媒開発研究。 関心ある学問領域は三つ。すなわち、世界を創造する化学、世界を拡張させる情報科学、世界を世界たらしめる認知科学。 素晴らしければ何でも良い。どうでも良いことは心底どうでも良い。興味・趣味は様々だが、そのほとんどがメジャー地位を獲得してなさそうなのは仕様。

関連記事

  1. 【PR】Chem-Stationで記事を書いてみませんか?【スタ…
  2. 還元された酸化グラフェン(その1)
  3. Reaxys体験レポート:ログイン~物質検索編
  4. 資金洗浄のススメ~化学的な意味で~
  5. 含ケイ素三重結合化合物(Si≡Mo、Si≡C)
  6. 一流化学者たちの最初の一歩
  7. ルドルフ・クラウジウスのこと① エントロピー150周年を祝って
  8. 細胞表面受容体の機能解析の新手法

コメント

  1. “【原文】と【再英訳文】をコピペチェッカーで比較してみたところ、原文一致率が40%程度にまで下がる。つまりたったこれだけの作業で、機械側でもコピペの是非判定が怪しくなる”

  1. この記事へのトラックバックはありません。

注目情報

ピックアップ記事

  1. 280億円賠償評決 米メルク社治療薬副作用で死亡 テキサス州
  2. シラン Silane
  3. 燃えないカーテン
  4. シーユアン・リュー Shih-Yuan Liu
  5. 炭素ー炭素結合を切る触媒
  6. がん細胞を狙い撃ち 田澤富山医薬大教授ら温熱治療新装置 体内に「鉄」注入、電磁波で加熱
  7. 論文コレクター必見!WindowsでPDFを全文検索する方法
  8. ジェイ・キースリング Jay Keasling
  9. シロアリに強い基礎用断熱材が登場
  10. 酸窒化物合成の最前線:低温合成法の開発

注目記事

関連商品

注目情報

試薬検索:東京化成工業



最新記事

国連番号(UN番号)

危険な化学品を飛行機や船を使って輸送することは、現代では日常的に行われていることである。安全に化学品…

生きた細胞内でケイ素と炭素がはじめて結合!

生物は豊富にあるケイ素を利用しない。このたび、ケイ素と化学結合を形成して体内の生化学経路に取り込むこ…

H-1B ビザの取得が難しくなる!?

先日、米国の博士研究員の最低賃金変更についてお伝えしました。トランプ政権では、専門職に就くために…

高速エバポレーションシステムを使ってみた:バイオタージ「V-10 Touch」

タイトルから何だそれ?と思った方々。正しいです。高速のエバポ?どういうこと?と思うことでしょう。…

最も安価なエネルギー源は太陽光発電に

A transformation is happening in global energy mar…

有機反応を俯瞰する ー挿入的 [1,2] 転位

今回は、Wolff 転位、Curtius 転位あるいは Hofmann 転位といった反応を取り上げま…

Chem-Station Twitter

PAGE TOP