人気ブログランキング | 話題のタグを見る

Windows 7 の全文検索の実験

ダウンロードした管理人のプログの記事のキーワードが、Windows 7 の全文検索で検索出来なかったことについて気になったので2,3のテストをしてみた。

まず、漢字コードの違いで検索ができなかった可能性を考えて、Terapad で shift-jis と utf-8 の二種類の漢字コードで検索出来なかったキーワードを含むテキスト文書を作って検索したら、両者とも検索できた。

ところが、検索出来なかったHTML文書のコピーを作成して、検索できたテキスト文書と同じフォルダに置いたら、やはり特定のキーワードが検索出来なかった。そこで、検索出来なかった記事の部分をコピーしてテキスト文書にペーストしたらあっさり検索できた。いろいろ試しているうちに、検索出来なかったHTML文書は、キーワードの種類というより、その中に含まれるある記事全体のインデックスが作成されていないようだった。

この実験でわかったことは、Windows 7 のインデックス機能はなかなか優秀で、shift-jis の文書も、utf-8 の文書も同様に全文検索出来ることだ。検索出来なかった文書については理由を特定できなかったが、HTML 文書がインデックスを作成するときの HTML フィルターと相性が悪かったのではないかと思った。

少なくとも、あまり特殊なHTML文書を書かない限り、Windows 7 の全文検索は、漢字コードの種類に関わらずきちんと検索してくれるのではないだろうか。少なくとも、テキスト文書なら、検索漏れはあまり発生しないように思える。

Windows 7 の全文検索の紹介記事は、Google の検索にもあまりヒットしてこないのでそんなに利用されていないのではないかと思うが、もったいない話だ。
by tnomura9 | 2010-02-11 07:37 | 考えるということ | Comments(0)
<< HTMLでリンクを作る Windows 7 の全文検索... >>