[スポンサーリンク]

化学者のつぶやき

論文コレクター必見!WindowsでPDFを全文検索する方法

 

電子論文が容易かつ大量に入手可能となった現在、その管理は最重要懸念事項です。ケムステでも各種文献管理法(EvernoteMendeleyReadCubeなど)をご紹介してきました。

しかし、専用ソフトを使う方法には一つだけ欠点があります。

「望みの論文を見つけ出すために、わざわざソフトを起動してフォーカスを移さなくてはならない」という一手間がかかるのです。

・・・それぐらいやれよ!という声が聞こえてきそうですが、何度も積み重なるとこれはこれでめんどくさいんで・・・。

筆者はWindowsユーザなのですが、問題の根源は「ダウンロードしたはずの論文を全文検索で見つけ出せないこと」にあると考えます。PDFの中身で検索が出来ないので、わざわざファイル名や保存フォルダに工夫を凝らさなくてはならない・・・こういう作業がが面倒だからこそ、論文管理ソフトの需要が出てくるのですね。

しかし世の中同じことで困っている人は多いはずだ!と思ったのでネットで調べてみたところ、ちゃーんと設定法がありましたよ(嬉)。

というわけでWindowsユーザ向けに、論文管理の一手としての「PDFを全文検索可能にする方法」をご紹介します。

PDFのインデックスを拾う設定に変更する

MacならばSpotlightシステムがあるので、PDFの中身も常時検索対象になります。この点はMacユーザが羨ましいかぎり。しかしWindowsにはなぜかそういう機能がありません。

デフォルトのWindows検索では、なぜPDFの中身を読んでくれないのか?

PDFからインデックス(検索目印となるテキスト情報)をOS側で拾っていないことがその理由です。

ならば、インデックスを拾う設定に変えてしまえばそれで事足りるというわけですね。

これを実現するのが「PDF iFilter」と呼ばれるソフト。

詳しい導入法はこちらのページや、関連リンクのページに書いてありますので参照ください。記事のとおりに設定を行えばOK。インデックスを取得するフォルダを選び(自分が論文をためこんでいる場所の選択を忘れずに!?)、そのあと「詳細設定」でインデックスの再構築を行います。これには少々時間がかかりますので、PCに詳しい人ならインデックス構築を速くする設定をしてみるのも良いでしょう。

Win_search_pdf_2.png再構築を忘れずに

少し待ってから「Win+F」のショートカットキーで検索窓を開き、適当なキーワードを入れると・・・・

なんとタイトルはもちろん、PDFの内容からも見事論文ファイルが引っかかるようになりました!

Win_search_pdf_4.png

これで「あのときダウンロードした論文はどこにいったのだろう・・・?」と頭を悩ませる機会が減りますね。

 

スキャンしたPDFにはOCRをかけておこう

Win_search_pdf_3.png

自炊書籍や古い論文など、画像をスキャンしたままPDFになっているもの(テキスト情報が含まれないPDF)は、そのままでは検索の対象にはなりません。

こういうものには光学文字認識(OCR)処理、つまり画像認識によってテキスト情報を抽出し、PDFを文字検索可能な形に変える処理が必要になります。

しかし日本語対応しつつ無料で認識精度も良い方法となると、さほど選択肢は多くありません。

筆者が試した限りでは、自炊PDF作成ソフト「かんたんPDFダイエット」の透明テキストPDF作成機能を使う方法が、Windows環境での最も簡単な方法だと思います。ファイル数が多いと時間はかかりますし、初期設定も少し手間ですがそこは我慢しましょう。公式ページの手順通りやれば問題ありません。

 

おわりに

いかがでしたか?

こういう設定にしておけば、PCの奥底に潜り込んでしまった論文でも、全文検索で掘り起こせるようになるわけです。

また片っ端からダウンロードした論文も、適当なフォルダに放り込んでおくだけで良くなります。いちいちファイル名を秩序だてて変更することは勿論、Evernoteに放り込む一手間すらもオサラバ!(・・・というか全文検索ぐらいは最初からOS側で実装しておいて欲しいと思うのは自分だけ?)

ともあれ、PDFの検索にお困りのWindowsユーザは是非お試しあれ!

 

関連商品

関連リンク

The following two tabs change content below.
cosine

cosine

博士(薬学)。Chem-Station副代表。現在国立大学教員として勤務中。専門は有機合成化学、主に触媒開発研究。 関心ある学問領域は三つ。すなわち、世界を創造する化学、世界を拡張させる情報科学、世界を世界たらしめる認知科学。 素晴らしければ何でも良い。どうでも良いことは心底どうでも良い。興味・趣味は様々だが、そのほとんどがメジャー地位を獲得してなさそうなのは仕様。

関連記事

  1. ハニートラップに対抗する薬が発見される?
  2. 博士課程の夢:また私はなぜ心配するのを止めて進学を選んだか
  3. みんな大好きBRAINIAC
  4. 光照射によって結晶と液体を行き来する蓄熱分子
  5. 表裏二面性をもつ「ヤヌス型分子」の合成
  6. 付設展示会へ行こう!ーWiley編
  7. スルホニルアミノ酸を含むペプチドフォルダマーの創製
  8. えれめんトランプをやってみた

コメント

  • トラックバックは利用できません。

  • コメント (11)

  1. 論文コレクターでないけど参考になる。「かんたんPDFダイエット」で日本語OCR→「PDF iFilter」でインデックス取得設定

  2. これを実現するのが「PDF iFilter」と呼ばれるソフト。

  3. PDFを全文検索

  4. 「PDF iFilter」:PDFからインデックス(検索目印となるテキスト情報)をOS側で拾う設定に変えるソフト

  5. これはいいかも

  6. 論文コレクター必見!WindowsでPDFを全文検索する方法(Chem-Stationより)「というわけでWindowsユーザ向けに、論文管理の一手としての「PDFを全文検索可能にする方法」をご紹介します」

  7. 後で検討する

  8. 以前はgoogle desktopで結構簡単にできたんだけどなあ。

  9. 良記事。そろそろGoogle Desktopからようやくおさらばできるかな。

  10. 論文コレクター必見!WindowsでPDFを全文検索する方法

  11. 導入必須。

注目情報

ピックアップ記事

  1. 薗頭・萩原クロスカップリング Sonogashira-Hagihara Cross Coupling
  2. 新しい選択的ヨウ素化試薬
  3. 乳化剤の基礎とエマルション状態の評価【終了】
  4. 逆電子要請型DAでレポーター分子を導入する
  5. 実現思いワクワク 夢語る日本の化学者
  6. アルコール依存症患者の救世主現る?
  7. シュワルツ試薬 Schwartz’s Reagent
  8. 独バイエル、世界全体で6100人を削減へ
  9. N,N,N’,N’-テトラメチルエチレンジアミン:N,N,N’,N’-Tetramethylethylenediamine
  10. バイオ触媒によるトリフルオロメチルシクロプロパンの不斉合成

注目記事

関連商品

注目情報

試薬検索:東京化成工業



注目情報

最新記事

バイエルスドルフという会社 ~NIVEA、8×4の生みの親~

Tshozoです。女装とかそういう趣味は無いのですが嫁さん(実在)に付き合って化粧品コーナを回ること…

化学系プレプリントサーバー「ChemRxiv」のβ版が運用開始

2017年8月14日、米国化学会(ACS)は、化学分野のプレプリントサーバー“ChemRxiv”のベ…

光触媒で人工光合成!二酸化炭素を効率的に資源化できる新触媒の開発

第115回のスポットライトリサーチは、東京工業大学 理学院 化学系 博士後期課程2年の栗木 亮さんに…

誰も教えてくれなかった 実験ノートの書き方 (研究を成功させるための秘訣)

概要悪い例とよい例を比較しながら,実験ノートを具体的にどう書けばよいのかを懇切丁寧に説明する…

神経変性疾患関連凝集タンパク質分解誘導剤の開発

第114回のスポットライトリサーチは、東京大学大学院薬学系研究科博士後期課程2年の山下 博子(やまし…

銀イオンクロマトグラフィー

以前、カラムクロマトグラフィーの吸引型手法の一つ、DCVCについてご紹介致しました。前回は操作に…

Chem-Station Twitter

PAGE TOP