和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

クソ変換辞典風 か行「各バル・画面費・記事角な」【日本語変換の闇、おかしな第一変換候補】

【入力したい変換のイメージ】
売る側・押し切りを・要調査
   ↓
【変換した結果】
うる側・お仕切りを


 このように、「おかしな変換=クソ変換」をメモとして残しておく記事です。


※「クソ変換」扱いする条件・検証の仕方については、下のリンクから
https://onbin.hateblo.jp/entry/dic0ime0kusohennkann#Link%E3%80%80%E6%9D%A1%E4%BB%B6%E3%83%BB%E6%A4%9C%E8%A8%BC%E3%81%AE%E4%BB%95%E6%96%B9
Link 条件・検証の仕方

https://onbin.hateblo.jp/entry/dic0ime0kusohennkann#Link%E3%80%80%E6%9D%A1%E4%BB%B6%E3%83%BB%E6%A4%9C%E8%A8%BC%E3%81%AE%E4%BB%95%E6%96%B9
※Dataの見方・Tagについては下のリンクから
Link 見方


【あ】https://onbin.hateblo.jp/entry/dic0ime0kuso0aa
【か】https://onbin.hateblo.jp/entry/dic0ime0kuso0ka
【さ】https://onbin.hateblo.jp/entry/dic0ime0kuso0sa
【た】https://onbin.hateblo.jp/entry/dic0ime0kuso0ta
【な】https://onbin.hateblo.jp/entry/dic0ime0kuso0na
【は】https://onbin.hateblo.jp/entry/dic0ime0kuso0ha
【ま】https://onbin.hateblo.jp/entry/dic0ime0kuso0ma
【や】https://onbin.hateblo.jp/entry/dic0ime0kuso0ya
【ら】https://onbin.hateblo.jp/entry/dic0ime0kuso0ra
【わ】https://onbin.hateblo.jp/entry/dic0ime0kuso0wa

▼クソ変換辞典(Data)

【K Ka か】

〇〇か;〇〇化;〇〇か;x;;;これについては、別で解説。
かきならべ;mac imeg;下記並べ;書き並べ;書き並べるという表現は、そんなにマイナーな表現でもないハズなのに、一発変換できない。それに「かきならべる」のように「終止形」なら「書き並べる」が第一変換候補になる。なぜ、そのようなコトバを認識しているのに、連用形「書き並べ」を第一変換候補にしないのか不思議である。;20230102

https://twitter.com/MaihamaPuroman/status/983036178696814592 *1
かきまちがえる;kng;下記間違える;書き間違える;;x;;;間違えてるのは変換のほうだと言いたい。;20210729
かくにあたり;mac imeg;角煮あたり・角に当たり;書くにあたり;「カドにあたり(角に当たり)」の表記件数だけを見て、その文字「角に当たり」を「かくにあたり」とAIが判断して、件数が多いと勘違いしたのだろう。;20220615
かくばる;mac imeg;各バル;角張る;「各バル」ってなんだよ笑。;20210727
かくひと;mac imeg;各人;書く人;「各人(かくじん)」を「かくひと」を変換して入力する人への配慮なのか? いやないだろ(笑)。そもそも、「かくひと」と入力して「(文書・文字を)書く人」と言い表したい人のほうが多いハズ。;20210727以前
かくぶんか;imeg mac;〇〇と各文化;〇〇と書く文化;たとえば「コトバをと各文化はあるのか?」みたいな文を入力しようとしたら、各文化となってしまうのだ。そして、最悪なことに変換候補に「書く文化」が存在しないのだ。Google IMEは「かく〇〇」の変換候補を「各〇〇」としか変換させたくないのか、困ったものである。;20231026
かたなできる;mac imeg;形名できる・形無できる;刀で斬る・刀で切る;Google IMEの「かたなできる」の変換候補に「刀で斬る・刀で切る」がない。「きる」系の変換は他にもオカシイものがあり、「ほうちょうできる→放鳥できる」と変換されたりする。;20220815

引用:は行
ほうちょうできる;mac imeg;放鳥できる;包丁で切る;Google IMEの「ほうちょうできる」の変換候補に「包丁で切る」がない。「きる」系の変換は他にもオカシイものがあり、「かたなできる→形名できる」と変換されたりする。;20220815

かつには;mac imegari;活には;勝つには;「しょうぶにかつには」をまとめて入力して変換すれば「勝負に勝つには」となるが、何かを入力後に「かつには」とすると「活には」が第一変換候補になってしまう。変換候補の5番目には「勝つには」がある。;20230124
かねむらないか;か眠らないか;金村内科;;x;;胃腸の調子が不安になったので、「😀前に行った病院名が確か金村内科だった気がするから検索しよう!」と思い、「かねむらないか」を入力し変換したらコレ(笑)。;20210727以前
がめんひ;mac imeg;画面費;画面比;「画面の比率」というのは映像関係でよく語られる要素で、それを指すために「画面比」という言葉を使おうとしたら「画面費」と変換された日には怒るのは当然。;20210727以前
からみたら;絡みたら;から見たら;;x;;音便変化「撥音便」の発音での表記でないと基本的に変換しない仕様が世の中のIME。現代では「絡んだ」を「絡みた」と表記も発音も基本はされないのに、わざわざ第一変換候補に出てくるのはなぜ? 「絡み」+〔完了・存続・過去〕の「た」からなる「絡みた」は、「買ひた→買った」「生みた→生んだ」のように「絡みた→絡んだ」と撥音便が起こった形で使われている。
かんで;感で;噛んで;;x;;;せめて「勘で」「韓で」とかなら分かるが、唐突に「感で」を単独で入力することはない。
かんでみる;館で見る・缶で見る;噛んでみる;;x;;;せめて「映画館で見る」「博物館で見る」とかなら分かるが、唐突に「(かん)館で見る」という表現は、「は?」という反応をされるだろう。そもそも「館で見る」は、「やかたでみる」と読ませるならありえるが、「かんでみる(館で見る)」は、そうそうない。ちなみに、「。」のあとだと「館で見る」になり、「、」のあとだと「缶で見る」と変換される謎仕様。;20210727以前
かんれんご;imeg;関連後;関連語;「〇〇関連後処理」などと書かれている記事があるため、「関連後」の文字列自体は問題ないが、「関連後処理」は「かんれんあとしょり」であって、「かんれんごしょり」ではない。「かんれんご」の音では、多くの場合で「関連語」である。もう一つの問題として、「関連後」という候補が出たので別候補を出そうとすると、変換の区切りが「関連」「後」と別れてしまうので、「関連語」と変換するのが面倒くさい。あまりにクソ変換すぎて、言葉に携わる人・団体ですらクソ変換をしている例がある。リンク;20211103
かんたんし;簡単視;感嘆詞;そもそも「かんたんし」を変換した際の区切り方が、「かんたん・し」になってしまう。そのせいで「かんたんし」という1語で認識されない。そもそも「簡単」というコトバの用法に「簡単する・簡単した・簡単して」という用法がない(見たことがない)ので、「かんたん・し」と区切るメリットがないのだ。IME設計者は「かんたんし」を1語としてみなしてもらいたいところだ。Shift+方向キーによる区切りの変更で「かんたんし」をヒトマトマリにしても、第一変換候補は「簡単視」であり、「感嘆詞」は第4変換候補である。;20220930

【K Ki き】

ききたいきょく;mac imeg;機器対局;聞きたい曲・聴きたい曲;「機器対局」ってなんですか? 一応、「きき・たいきょく」が個別に変換されているので「機器対局」というコトバをGoogelが登録しているわけではない。しかし、「聞く・聴く」という動きと「曲」というのは つながりが深いコトバ同士だから、ちゃんと変換してほしかった。;20221130
ききなじみ;;機器馴染み;聞き馴染み;「ききなじみ」のみで変換すれば「聞き馴染み」という変換をしてくれる。しかし、「このなかでききなじみ」をまとめて変換すると、「この中で機器馴染み」という意味不明の変換をする。他にも、「;(セミコロン)」のあとに「ききなじみ」を変換すると「機器馴染み」になるという意味不明な仕様もある。;20211226
きくがわ;mac imeg;菊川・キクガワ・喜久川;聞く側;検索候補にすらない。;20220604
きじかくな;記事角な;記事書くな;x;;;「きじをかくな」なら「記事を書くな」としっかり変換されます。というか、「かくな」単体で変換すれば「書くな」ってなるのに、「記事」の後ろだとなぜ「角な」になるんだろうか。
ぎょうわけ;mac imeg;業訳・行訳;行分け;20230604

【K Ku く】

くらい(時〜);sys;時位;時くらい;;x;;;入力方法によって起こるかどうか変わる。間違いではないが、「ときい(時位)」さんという名字の人や、「じい(時位)」と読めてしまうため、配慮のある人は「時くらい・時ぐらい」のどちらかで書く。「0じくらい」を変換=「0時位」。「0じぐらい」を変換=「0時ぐらい」。数字の入力を確定して、すぐに「0じくらい」を入力して変換=「0時位」。数字の入力を確定したあとカーソルを移動してから「じくらい」を入力して変換=「0時くらい」。;20210731

【K Ke け】

【K Ko こ】

こうしゃにかんしては;imeg mac;校舎に関しては;後者に関しては;「こうしゃに」だけだと、「後者に」も変換候補にある(第2変換候補)。しかし、「こうしゃにかんしては」を変換すると、「校舎に関しては」が第一変換候補なのは まあ いいとして、「後者に関しては」が変換候補にないのだ、まったくもって意味がわからない。;;20230609

こうせいかつ;nazo kng imeg;高生活;構成かつ;だから「高生活」って何よ(笑)? しかも「高生活」がひとまとまりで変換されているので、そういう言葉がGoogleさんの間では使われてるのかと思ってしまう。おそらく、日本語という高何度の言語をBigdataとAIのみで処理した結果だろう。なぜなら、「高生活」という文字列は、「目高生活」のように「目黒高校の学校生活」の略で使われる。これは、他の高校でも同じような使われ方を目にする。例「島高生活(香川県立小豆島中央高等学校)」。また、「東海中・高生活指導部 」のような「中・高」の並びからなる表現によっても「高生活」の文字列が生まれる。ただし、「こうせいかつ」をひとまとまり捉えるのは日本人の言語感覚ではないから、AIのせいだろう。;20211105
こうせつめい;nazo kng;高説明;こう説明;;x;;だから「高説明」って何よ(笑)? しかも「高説明」がひとまとまりで変換されているので、そういう言葉がGoogleさんの間では使われてるのか?;20210727以前
こうみえる;nazo kng mac imeg;光見える;こう見える;なぜIMEGは「こう」を 漢語として判断してしまうのだろうか?;20220609
ごかいぶん;nazo kng imeg mac;誤解分;五回分;「誤解分」ってどういう状況で使うのだろうか? 「誤解分の謝罪をする」とかか? 一般的ではないな。どう考えても「五回分」のほうが使うから、「五回分」が第一変換候補に出るべき。;20210901
ごげんせつ;mac imeg;「ごげんせつ」を変換すると「ご言説」が第一変換候補だ。「語源説」は第2変換候補。"ご言説"約 156 件しかないのに対して、"語源説"約 28,300 件という使用件数の多さと考えれば、語源説を第一変換候補にしてほしいところ。「Yahoo!リアルタイム検索30日分@20231112」※twitter.com(X)での投稿数でも、"語源説"48件"ご言説"1件という結果で、"語源説"のほうが使用数が多い。;20231112
ごじ;imeg mac;5時・語時・五時(ほか);誤字;5時j」と入力したいときならいいが、それ以外で困る。Shift押しながら右移動を押して「変換範囲広げ」を行わないと、「誤字」と変換できない。「ご」「じ」を一度分けて変換が始まったら、「ごじ」をひとまとめで変換しないという頑固者IME
ごぞんじ;2knj atjk ddj ssn;ご存知;ご存じ・御存じ;IMEGは「ごぞんじ」の第一変換候補に「ご存知」を出してしまう。意味は似ているが、「行い」と「行為」くらい別物である。「(ぞんち・ぞんぢ・ぞんじ)存知」は「漢熟語・和製漢熟語」どちらかであり、「ご+漢語+S(Z)」の形からなる「存じ」とは、別物である。日本人の言語出力時には混同しがちだが、脳は無意識に判断している場合が多い。その証拠として「存じます」は普通で「存知ます」に違和感を覚えるだろう。「存じる」は普通で「存知る」に違和感を覚えるだろう。;20211114
ことなる;imeg win;異る;異なる;「ことなる」単独であれば、「異なる」が第一変換候補で問題ナシ。しかし、「おおきくことなる」と入力すると「大きく異る」が第一変換候補として出てくる。「異る」という送り仮名は気持ち悪いのでやめていただきたい。「すこし・わずかに・きわめて・かなり・とても」のあとは正常に「異なる」と変換される。;20211211
ごにん;;五人・後人(ほか);誤認;x;;;「五人」と入力したいときならいいが、それ以外で困る。Shift押しながら右移動を押して「変換範囲広げ」を行わないと、「誤認」と変換できない。「ご」「にん」を一度分けて変換が始まったら、「ごにん」をひとまとめで変換しないという頑固者IME。ちなみに、20210822現在では修正されたようだ。この記事のおかげか!?;20210727以前
これであってる;mac imeg;これ出会ってる;これで合ってる;「これであってる」「これであってるのかな?」を変換すると「これ出会ってる」「これ出会ってるのかな?」になる。;20231119
これであってるのかな;mac imeg;これ出会ってるのかな;これで合ってるのかな;「これであってるのかな?」を変換すると「これ出会ってるのかな?」になる。同じく、「これであってる」も「これ出会ってる」になる。

【あ】https://onbin.hateblo.jp/entry/dic0ime0kuso0aa
【か】https://onbin.hateblo.jp/entry/dic0ime0kuso0ka
【さ】https://onbin.hateblo.jp/entry/dic0ime0kuso0sa
【た】https://onbin.hateblo.jp/entry/dic0ime0kuso0ta
【な】https://onbin.hateblo.jp/entry/dic0ime0kuso0na
【は】https://onbin.hateblo.jp/entry/dic0ime0kuso0ha
【ま】https://onbin.hateblo.jp/entry/dic0ime0kuso0ma
【や】https://onbin.hateblo.jp/entry/dic0ime0kuso0ya
【ら】https://onbin.hateblo.jp/entry/dic0ime0kuso0ra
【わ】https://onbin.hateblo.jp/entry/dic0ime0kuso0wa

【記事編集用Link】
https://blog.hatena.ne.jp/peaceheart/onbin.hateblo.jp/edit?entry=4207112889899141076

【KEYWORD ZONE】
かぎょう、かきよう、下記用、カギョウ、kagyou、家業、か行、カ行
kw:かぎょうか、かきようか、下記用か、下記8日、カギョウカ、kagyouka、カ行下、か行か、カ行カ
kw:かぎょうき、かきようき、下記用き、牡蠣八日、下記8日、カギョウキ、kagyouki、家業機、か行き、カ行キ
kw:かぎょうく、かきようく、下記用く、下記幼駒、カギョウク、kagyouku、家業区、か行く、カ行ク
kw:かぎょうけ、かきようけ、下記用け、書きようけ、カギョウケ、kagyouke、家業家、か行け、カ行ケ
kw:かぎょうこ、かきようこ、下記用こ、書き陽子、カギョウコ、kagyouko、家業子、か行こ、カ行コ
kw:ルビの表記ブレ候補として一覧
"じつてんぽ" "じってんぽ""じつてんぽじってんぽ" "じってんぽじつてんぽ""じつてんほ""じってんほ""じってんほ"
くそへんかんまとめ、糞変換まとめ、kusohennkannmatome、kusohenkanmatome
くそへんかんじてん、くそへんかんしてん、糞変換視点、クソヘンカンジテン、糞変換時点、クソ変換辞典、kusohennkannjitenn、kusohenkanjiten、kusohenkanjitenhuu、kusohennkannjitennhuu

*1:舞ピュー on Twitter: "そのことがどうしても許せなかった俺はTLに回転率等VRアトラクションの悪口を下記並べ、結果技術系のフォロワーさんと喧嘩しクリエイターでも無いお前に言われたくないという正論を投げかけ我に返った訳だけど映像を作ってる側と遊園地側には理解の差があるんだなってその時思った" / Twitter