和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

昔の検索サイトは完全一致検索が多かったような(うろ覚え)。※別名「絶対検索」対義語「あいまい検索」【日本語とデータ収集】

▼昔は完全一致検索が多かったような

 Webの記事としては見つかりませんでしたが、昔のGoogleの日本語検索は完全一致検索がデフォだった覚えがあります。

 昔は完全一致検索だったというTweetも何件か見かけました。


https://twitter.com/aya_tamanine_/status/1034351706744664065 *1


https://twitter.com/kilynn/status/1302443745447559168 *2

 ワタシの記憶でも、何年前か忘れましたが…
「あれ? Google検索で急に関係ないキーワードの記事がヒットするようになったぞ!」
 という時期がありました。

 その時期以降になってから「あいまい検索」が常にデフォな検索サイトが増えたのかな?
 それこそ、記憶が「あいまい」なので、詳しい方はコメントお願いします。

▼「あいまい検索」が初期設定である問題点

 「完全一致検索」よりも「あいまい検索」が初期設定のほうがいいだろう。
 その意見自体には賛成なのですが、切り替えが面倒くさいのです。

▼「完全一致検索」自体のシステムも変わっている?

 仮に自分で、「" "」で囲んで「完全一致検索」にしたとしても、その仕様自体が変わっているとの話もあります。


https://twitter.com/kuron_npl/status/1280361051729522688 *3

 初期設定が「完全一致検索」でないなら、「" "」で囲んで「完全一致検索」にしようというのが、今のシステムです。
 そのシステムが、「勝手にキーワード除外」などをするという話が出ています。
 「完全一致検索」なのに「完全一致検索ではない」というのは問題ですね。

▽「あいまい検索」での検索結果

「あいまい検索」だと、
・表記ブレも検索される
・助詞の有無どちらも検索される
・キーワードを複数指定時、いくつか無視される

▼「あいまい検索」の問題点

 和語の里のように、表記ブレの調査を行う組織にとっては、あいまい検索は鬱陶しいと思うことが多いです。
 もちろん、完全一致検索・あいまい検索を簡単に切り替えられればいいのですが、現状は2手間・3手間は平気でかかります。

【記事編集用Link】
https://blog.hatena.ne.jp/peaceheart/onbin.hateblo.jp/edit?entry=4207112889968456667

【keyword zone】tng0kannzennittikennsaku2
完全一致検索、かんぜんいっちけんさく、かんせんいつちけんさく、感染位土検索、カンゼンイッチケンサク、kannzennittikennsaku
ぜったいけんさく、zettaikennsaku、せつたいけんさく、絶対検索
あいまいけんさく、アイマイケンサク、aimaikennsaku、あいまい検索、曖昧検索、アイマイ検索

*1:あや on Twitter: "@1119_minami こんにちは、もしご存知だったら申し訳ないのですが、Googleの検索ツール/完全一致 を選択すると結果が変わると思います!昔はこちらが標準でしたよねぇ… https://t.co/C99dBJh6YE" / Twitter

*2:りんく on Twitter: "考えてみたらら我々はgoogleに調教され過ぎているのかも知れない。 昔は完全一致しないと出てこないものは沢山あった筈だ…。" / Twitter

*3:九龍娘々 on Twitter: "最近の日本版Googleまじで検索しづらいよね。昔の完全一致ベースの方がよかった。いまクォーテーション付けても勝手にキーワード除外されたりする。かろうじて生きてる個人サイトなんてあってももう見つけらんない。" / Twitter