和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

クソ変換辞典風 ま行〜わ行「刀で斬る→形名できる・一人用→人利用・ばごと→話ごと」【日本語変換の闇、おかしな第一変換候補】

【入力したい変換のイメージ】
売る側・押し切りを・要調査
   ↓
【変換した結果】
うる側・お仕切りを


 このように、「おかしな変換=クソ変換」をメモとして残しておく記事です。


※「クソ変換」扱いする条件・検証の仕方については、下のリンクから
https://onbin.hateblo.jp/entry/dic0ime0kusohennkann#Link%E3%80%80%E6%9D%A1%E4%BB%B6%E3%83%BB%E6%A4%9C%E8%A8%BC%E3%81%AE%E4%BB%95%E6%96%B9
Link 条件・検証の仕方

https://onbin.hateblo.jp/entry/dic0ime0kusohennkann#Link%E3%80%80%E6%9D%A1%E4%BB%B6%E3%83%BB%E6%A4%9C%E8%A8%BC%E3%81%AE%E4%BB%95%E6%96%B9
※Dataの見方・Tagについては下のリンクから
Link 見方


【あ】https://onbin.hateblo.jp/entry/dic0ime0kuso0aa
【か】https://onbin.hateblo.jp/entry/dic0ime0kuso0ka
【さ】https://onbin.hateblo.jp/entry/dic0ime0kuso0sa
【た】https://onbin.hateblo.jp/entry/dic0ime0kuso0ta
【な】https://onbin.hateblo.jp/entry/dic0ime0kuso0na
【は】https://onbin.hateblo.jp/entry/dic0ime0kuso0ha
【ま】https://onbin.hateblo.jp/entry/dic0ime0kuso0ma
【や】https://onbin.hateblo.jp/entry/dic0ime0kuso0ya
【ら】https://onbin.hateblo.jp/entry/dic0ime0kuso0ra
【わ】https://onbin.hateblo.jp/entry/dic0ime0kuso0wa

▼クソ変換辞典(Data)



【M】

まんぷくかんえれますし;mac imeg;満腹感エレマスし;満腹感得れますし;よくわからない変換の仕様として、「し」をつけずに、「まんぷくかんえれます」を変換したら「満腹感得れます」としっかり変換される。ものすごく限定的な糞変換である。;20221130

みずみずしい;mac;みずみずしい;水々しい・水水しい;;x;;;第一変換候補は「みずみずしい」とひらがな表記。コレ自体はいいが、漢字の変換候補に「瑞々しい」「瑞瑞しい」はあるが、「水々しい」「水水しい」はない。デジタル大辞泉「みずみずしい」の見出しの漢字表記には「×瑞×瑞しい/水水しい」ともにある。;20210912
めいいっぱい;mac;名一杯・迷一杯;;x;;;第一変換候補は「めいいっぱい」とひらがな表記。コレ自体はいいが、なぜか二番目・三番目の候補が「名一杯」と「迷一杯」である。そもそも、「めいっぱい」の誤認識による誤入力で「めいいっぱい」と入力したものであって、入力する人の意識として「目一杯」の意味で入力してる。それを考慮してあげて、「目一杯」というのを候補に出してあげればいいのでは? それを出さないにしても「名一杯」と「迷一杯」は、誤入力・誤認を誘う表記なので優先的に出すべきとは思えない;20210907
めのまえ;;眼の前;目の前;第一変換候補が「眼の前」になってしまっている。一般的なのは「目の前」なのにだ。googleで検索(20220518)しても、件数は"目の前"約 180,000,000 件、"眼の前"約 8,570,000 件であり、1億7100万件も差がある。「Yahoo!リアルタイム検索」でも、目の前645,993件のツイート、眼の前5,348件のツイートと大きく差がついている。比率だけ見たら、Google検索以上に「目の前」の割合が多い。参考「表記ブレの調査【ま行「め」】」

【Mo も】

もうひとり;imeg mac;(第一変換候補)もうひとり・(第2変換候補)猛一人;もう一人・もう1人;特に「もう一人」などの表記が珍しいわけでもないのに変換候補にない。そして、"猛一人"という文言は そもそも意図的に使う文言だろうか?  恐ろしいことに、2009年以前から存在している記事で「猛一人」という誤字が見られるため、長年放置されているクソ変換である。;20231122

もじぶん(〇〇文字分);imegari mac;も自分;文字分;例「5もじぶん」を変換すると「5も自分」となる。20230315
もってこい;hrkn kouho imeg mac;もってこい;持って来い;これは第一変換候補自体に文句言うつもりはない。なぜなら、「旅行するには、もっていこいの天気」などの意味での「もっていこい」は、ひらがなにする傾向もあるからだ。しかし、物を自分のところに持ってこさせる意味での命令形の「持って来い」は、変換候補にすらない。「ものをもってこい」で変換しても「ものをもってこい」が第一変換候補になってしまう。しかし、「もってこい」単独とは異なり「持って来い」が変換候補にある。;20221130
もともこ;imeg mac;元モコ;元も子;「もともこもない→元も子もない」になるが、「もともこ」だと「元モコ」が第一変換候補で、「元も子」という変換候補すらない。もちろん、「元も子」だけの使い方というのは普通しないが、文字のカタマリすべてを入力するというよりも、少しずつ入力して変換するほうが やりやすいという人も多いです。そういうひとからしたら、「もともこもない」と一気に入力せずに、最初に「もともこ」と入力して「元も子」にできたほうが便利である。;20231112

【Y】

【Yo-よ】

よいわるい;imeg mac;善悪;良い悪い・善い悪い;「で」入力し、確定した後に「よいわるい」を変換すると、なぜか「善悪」と変換される。他の条件では、基本的に「良い悪い」と変換されるのに、AIがナゾの学習をしてしまったのか?;20230306
ようかと;hrkn;8日と;ようかと;;x;;;「〜み」「〜し」のあとであれば、「ようかと」が第一変換候補だが、「み」「し」を確定させたあとに、カーソルを動かして「み・し」の後ろに持っていき「ようかと」と入力すると「み8日と・し8日と」という糞変換になる。「ようか」のみなら「8日」が第一変換候補でもいいが、「ようかと」は「ようかと」でいいだろうと思う。;20210823
ようちょうさ;mac imegari;用調査;要調査;;20220319
よびな(このよびな);onk mac imeg;呼名;呼び名;「よびな」単独で変換すれば「呼び名」が第一変換候補になるが、「このよびな」を変換すると、「この呼名」が第一変換候補になってしまう。なぜ、オヌカを優先するのだろうか。;20230805
よみにくさ;imegari mac;読みに草;読みにくさ;「〇〇読みに草」という書き方で「〇〇が面白い」という感想を書く人が多いためか、AIが誤認して学習した結果、「読みにくい」の[名詞形]である「読みにくさ」が「読みに草」と変換される様になってしまったのか。;20230211

【クソ変換で入力されてしまったもの】
https://twitter.com/rahsaanmkt/status/1161844953930035200
apapapa on Twitter: "のんびりと難しい症例の所見を読みやすいように書いてる長くなると読みに草すごいからな" / Twitter

https://twitter.com/tami21677917/status/1315793826892611584
Tami on Twitter: "ことりとかこいぬとかこぐまとかこうさぎとかこぺんぎんとかこかまきりとかこざかなとか、読みに草満載。" / Twitter

【AIが変換学習の際に誤認するTweet例】
https://twitter.com/Gero2525/status/313238622105128961
🤮Gero🤮 on Twitter: "謎の深読みに草生える RT @samansa0612: げろリン恋してる?"@Gero2525: 今、ふと思っただけやけど、常にマイナス思考だったり、ずっと暗い人とは一緒にいたくないよねぇ。こっちまで元気なくなる。 一緒におって楽しくてずっと笑ってて、周りをを元気にさせてくれる" / Twitter
https://twitter.com/utaelnofan/status/1181595654180630528
🎧椎名 舞😸@お風呂🛀順番待ち係 on Twitter: "@kobahiro0824 @2tree_f ほんの少しのサバ読みに草" / Twitter

よんだんらく;iemg mac;四段楽;四段落・4段落;「四段楽」って何だと思い検索したら、誤字とみられる記事、後ろの文とつながって検索されたページしか出てこなかった。つまり、imegは「四段楽」という言葉がないにもかかわらず変換候補にだしたのだ。そして、「第四段落」は変換候補にすらない。もしかして、Google IME開発者さんは「一段落」と書かずに「一段楽」と書くのか? 驚くことに、"一段楽"のGoogle検索件数は「約 16,100 件」だった※20220111。誤字・当て字によって、かなりの件数になっていた。日本セイフティー株式会社・小牧木材株式会社などが、「段差解消スロープ(段楽)」という商品を出しているようで、それらの「段楽」にAIが釣られてクソ変換を設定してしまったのだと考えられる。;20220111

【R】

れんたいけい;win imeg;レン体型;連体形;「の」を入力し、確定をしたあと続け様に「れんたいけい」を入力し変換すると「のレン体型」という意味不明な変換が起こる。;20211115

【W】

わたしたち;;私達;わたしたち・私たち・ワタシたち;「達」を「たち」と読むのは表内読みではない、「友達」で「ともだち」と読ませるのが例外なだけ。ちなみに、「おれたち」は「俺たち」、「きみたち」は「君たち」などは、第一変換候補に「達」を出さない。なぜ、「わたしたち」はそうなったのですか? Googleさん?;20220310」;参考「fineday2019.com/2019/11/07/「私達」と「私たち」、どちらを使えばいいのか/」;20210727以前

【あ】https://onbin.hateblo.jp/entry/dic0ime0kuso0aa
【か】https://onbin.hateblo.jp/entry/dic0ime0kuso0ka
【さ】https://onbin.hateblo.jp/entry/dic0ime0kuso0sa
【た】https://onbin.hateblo.jp/entry/dic0ime0kuso0ta
【な】https://onbin.hateblo.jp/entry/dic0ime0kuso0na
【は】https://onbin.hateblo.jp/entry/dic0ime0kuso0ha
【ま】https://onbin.hateblo.jp/entry/dic0ime0kuso0ma
【や】https://onbin.hateblo.jp/entry/dic0ime0kuso0ya
【ら】https://onbin.hateblo.jp/entry/dic0ime0kuso0ra
【わ】https://onbin.hateblo.jp/entry/dic0ime0kuso0wa


【記事編集用Link】
https://blog.hatena.ne.jp/peaceheart/onbin.hateblo.jp/edit?entry=4207112889941049430

【KEYWORD ZONE】dic0ime0kuso0ma
やぎょう、やきよう、yagyou
ルビの表記ブレ候補として一覧
"じつてんぽ" "じってんぽ""じつてんぽじってんぽ" "じってんぽじつてんぽ""じつてんほ""じってんほ""じってんほ"
くそへんかんまとめ、糞変換まとめ、kusohennkannmatome、kusohenkanmatome
くそへんかんじてん、くそへんかんしてん、糞変換視点、クソヘンカンジテン、糞変換時点、クソ変換辞典、kusohennkannjitenn、kusohenkanjiten、kusohenkanjitenhuu、kusohennkannjitennhuu