和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

あいまい検索。ジャマと思うことも多いが利点もある。対義語「完全一致検索・絶対検索」【日本語とデータ収集】

▼「あいまい検索」での検索結果

「あいまい検索」だと、
・表記ブレも検索される
・助詞の有無どちらも検索される
・キーワードを複数指定時、いくつか無視される
   ↑
 このような仕様なので、検索者の意図しない結果も出ることがあります。
 もちろん、検索者に利点もあります。

デジタル大辞泉「あいまいけんさく【曖昧検索】」
《fuzzy search》サーチエンジンやデータベースの機能またはサービスの一。検索するキーワードと完全に一致していなくても、表記の異なりや同義語も含め、柔軟に解釈して検索すること。ファジー検索。類似検索。

▼「あいまい検索」の利点

・表記ブレも検索される
・助詞の有無どちらも検索される
・キーワードを複数指定時、いくつか無視される
   ↑
 これらは人によって・状況によっては利点になります。

【Q】どんな人に利点がある?
【A】表記について気にしない人
 表記にむとんちゃくだと、一般的に使われる表記で検索しないこともあります。そうなると、みんなが使っている表記で入力しなくなってしまいます。その別表記で入力(表記ゆれ)しても、問題なくなります。

【Q】どんな状況で利点がある?
【A】あるキーワードのせいで、関連記事が極端に減るのを防ぐ。
 

▽件数が極端に変わる例

 たとえば、完全一致検索では15件だったものが、あいまい検索で72万件以上であるというこも起こります。


 20231222にダブルクオーテーションをつけて
【"スマホ" "激安" "SDスロット付き" "USB3.0"】
 と入力し、完全一致検索すると15件しか表示されませんでした。

 そして、ダブルクオーテーションなしで、
スマホ 激安 SDスロット付き USB3.0
 と入力し、あいまい検索すると約 726,000 件も出てきました。

 15件の中で 欲しい商品が見つかることもありますが、さすがに候補として少ないので、他のものと比較したいときもあります。
 そのときに、あいまい検索の中に適する商品があるかもしれません。

▼「あいまい検索」の落とし穴

スマホ 激安 SDスロット付き USB3.0
 と検索して、件数的には72万件以上も見つかっていますが、それらには まったく関係のないページも大量に存在するわけです。

▽微妙に違うからこその危険さ

スマホ
・激安
・SDスロット付き
USB3.0
 これらの要素を満たすものを あいまい検索で 検索すると、見つかるページの中には、スマホの商品ページという部分しか合っていなくて、他の部分が異なるということもあります。

・「激安」というキーワードを そもそも拾ってないページ
・「SDスロット付き」のSDだけ認識して、「SD非対応」という文言にヒット
・「USB3.0」のUSB部分だけに注目して、"USB2.0"のページを拾う
   ↑
 こういった検索も行われる可能性があるというのを頭に入れておかないと、商品を買ったらGoogle検索で入力した条件通りのものではなかったということにも起こりえます。 

Google検索で「あいまい検索」

 Google検索の画面では「すべての結果」という設定名ですが、「すべての結果」は分かりにくいですね。
「なんだよ"すべて"って😓」
 としか思えません。むしろ、今まで「すべて」じゃなかったのかよと思っちゃう人も多そう。


【記事編集用Link】
https://blog.hatena.ne.jp/peaceheart/onbin.hateblo.jp/edit?entry=4207112889968456667

【keyword zone】tng0aimaikennsaku
tng0kannzennittikennsaku,完全一致検索、かんぜんいっちけんさく、かんせんいつちけんさく、感染位土検索、カンゼンイッチケンサク、kannzennittikennsaku
あいまいけんさく、アイマイケンサク、aimaikennsaku、あいまい検索、曖昧検索、アイマイ検索
タイトルで完結、たいとるでかんけつ、たいとるてかんけつ、タイトルて完結、タイトルデカンケツ、taitorudekannketu、タイトルで完結
tng0shoutikubai、shoutikubai、しょうちくばい、しようちくはい、使用地区杯、ショウチクバイ
tng0matutakeume、matutakeume、松竹梅、まつたけうめ、マツタケウメ