ダウンロードした管理人のプログの記事のキーワードが、Windows 7 の全文検索で検索出来なかったことについて気になったので2,3のテストをしてみた。
まず、漢字コードの違いで検索ができなかった可能性を考えて、Terapad で shift-jis と utf-8 の二種類の漢字コードで検索出来なかったキーワードを含むテキスト文書を作って検索したら、両者とも検索できた。 ところが、検索出来なかったHTML文書のコピーを作成して、検索できたテキスト文書と同じフォルダに置いたら、やはり特定のキーワードが検索出来なかった。そこで、検索出来なかった記事の部分をコピーしてテキスト文書にペーストしたらあっさり検索できた。いろいろ試しているうちに、検索出来なかったHTML文書は、キーワードの種類というより、その中に含まれるある記事全体のインデックスが作成されていないようだった。 この実験でわかったことは、Windows 7 のインデックス機能はなかなか優秀で、shift-jis の文書も、utf-8 の文書も同様に全文検索出来ることだ。検索出来なかった文書については理由を特定できなかったが、HTML 文書がインデックスを作成するときの HTML フィルターと相性が悪かったのではないかと思った。 少なくとも、あまり特殊なHTML文書を書かない限り、Windows 7 の全文検索は、漢字コードの種類に関わらずきちんと検索してくれるのではないだろうか。少なくとも、テキスト文書なら、検索漏れはあまり発生しないように思える。 Windows 7 の全文検索の紹介記事は、Google の検索にもあまりヒットしてこないのでそんなに利用されていないのではないかと思うが、もったいない話だ。
by tnomura9
| 2010-02-11 07:37
| 考えるということ
|
Comments(0)
|
カテゴリ
新型コロナウイルス 主インデックス Haskell 記事リスト 圏論記事リスト 考えるということのリスト 考えるということ ラッセルのパラドックス Haskell Prelude Ocaml ボーカロイド 圏論 jQuery デモ HTML Python ツールボックス XAMPP Ruby ubuntu WordPress 脳の話 話のネタ リンク 幸福論 キリスト教 心の話 メモ 電子カルテ Dojo JavaScript C# NetWalker ed と sed HTML Raspberry Pi C 言語 命題論理 以前の記事
最新のトラックバック
最新のコメント
ファン
記事ランキング
ブログジャンル
画像一覧
|
ファン申請 |
||