和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

【見分けつかない文字による錯覚】「市(いち)・「巿(ひざかけ)」 「卜(うら)・ト(と)」

 

f:id:peaceheart:20201119114403j:plain

 この記事では、〝紛らわしい字の組み合わせ〟を、例つきで紹介します。単純なデータとしてのまとめは、別記事に移行中です。

 

 

▼見分けつかねえよ辞典

イチ」;漢字;「ハイフン」;記号;「チョウオン」;記号(長音・伸ばし棒)

例「メンバー一人一人が頑張った。」

例「本タイトル-サブタイトル-


 長音と漢数字「1」がある場合は、表記を別な表記にするなどすることをオススメします。

読みにくい例「グループのメンバー一人一人に意見を伺った」
手直し例A「グループのメンバー1人1人に意見を伺った」
手直し例B「グループのメンバーひとりひとりに意見を伺った」

 

これはねー大事だよ    =「これはね」で区切れて「ー大事(いちだいじ)」という強調表現
これはねー大事だよ    =「これはね〜」のようなセリフ口調のため長音を使用

 

 

なにかのタイトルをつけるにあたって

「本タイトル-サブタイトル-」

 という

 

他にも見出しに長音を使っているのか、漢数字の1なのかわからないものもあります。

一企業としての取り組みは〇〇

一個人としてできるこは〇〇

        ↑

 このような文字列を勘違いしないように、段落付けでは「一」はおすすめしません。間違われにくいのは中黒「・」でしょう。

・企業としての取り組みは〇〇

・個人としてできるこは〇〇

 

ウラ」;漢字;「」;カタカナ

 「水卜 麻美」アナウンサーの名前をはじめて見た人は、深く考えずに無意識で読みを思い浮かべると、「ミト アサミ」って読んでしまうと思います。

※ちなみに、「水卜ミウ」さんは「ミト」と読まれがちなのを、そのまま愛称として「ミトちゃん」とか言われてるみたいです。参考:タレント・著名人のニックネームリスト

 

 

 

カキ」;漢字;「コケラ」;漢字

こちらのサイトでチェックしたら、しっかりとデータ上では区別されています。

・柿=138 96
・杮=129 69

 しかし、違いが分からないというか、明確な違いはあるのか?

 

 

 

クチ」;漢字;「」;カタカナの「ろ」;「シカク」;記号

問題:グループZを参考に、対象A郡から口に入るものを選べ。

グループZ=キャラメル・アメ・砂糖・口

対象A郡=直巻1Mのアメ玉、塩、バナナ

        ↑

ムリヤリ、「クチ」と「シカク」でややこしい問題を作って、こうなると分かりにくいという例をだした。

 「生意気なこと・よけいなこと 言う」という意味の「いけくちたたく」という言葉がある。そこにふくまれる「くち」を漢字で「口」と表記すると、【いけ口たたく】と表記される。「いけろたたく」に見えてしまう。

 また、「いけ」と「たたく」の間に穴埋め問題の「□(しかく)」が入ってるように見える。

 

▽「くちりこう【口利口】」

「くちりこう【口利口】」という「口先がうまいこと。また、そのさま。口じょうず。口巧者 (くちごうしゃ) 。」を表す言葉があるが、漢字表記「口利口」は、かなり錯覚を起こす。※意味:デジタル大辞泉より

口完口
口全口
口勝口
口利口
実は、この「口」は、「クチ」の漢字「口」です。

 

一八パーセントじゅうはちぱーせんと」;漢数字「10」;「一パパーセントぱぱ・せんと」;

※漢数字「十八じゅうはち」を「一八じゅうはち」で表記することで、「イチ」と「パーセント」の長音「ー」が「パパ」を挟む記号みたいになっている。さらに、それ抜きでも漢数字+カタカナで「%」を「パーセント」表記すると、「九八パーセント」「六七パーセント」みたいな、目の錯覚を起こすことがある。

析;漢字「セキ」;折;漢字「お」;

0ゼロ」;半角数字;「ゼロ」;全角数字;「ゼロ」;漢数字;「オー」;ローマ字;「マル」;記号

😁「先生に提出した課題に〝○〟がついてたぞ❗」

 😐「それ、点数ゼロを意味する〝0〟だよ…」

😰「…」

 

 

 

▼クソソン

「ソSo」;カタカナ(そ);「ンN」;カタカナ(ん)

「ソSo」;カタカナ(そ);「リRi」;カタカナ(り)

  ネット上では、ドラゴンボールの「クリリン(くりりん)」というキャラを表すときのネタとして「クリリリ」「クソソソ」「クンンン」「クリリソ」「クソソン」など、似た文字で置き換えて書くというネタがありますね。

 

候;漢字「そうろう」;侯;漢字「コウ」;左側の縦棒が一つ少ない「侯」は、音読み「コウ」、訓読み(常用漢字表外読み)「まと・きみ」である。意味は「まと」「きみ(敬意・偉い人を指す)」。熟語で「侯鵠(コウコク)」「侯王」「諸侯」「侯爵」「王侯(オウコウ)」「君侯(クンコウ)」「射侯(シャコウ)」「諸侯(ショコウ)」「藩侯(ハンコウ)」「封侯(フウコウ)」「列侯(レッコウ)」などがある。※参考 漢字ペディア;skssumi

 

」「いち」;漢字;「巿ホチ」「巿フツ」「巿ひざかけ」;漢字

こちらのサイトでチェックしたら、しっかりとデータ上では区別されています。

・市=142 115
・巿=129 69

 しかし、違いが分からないというか、明確な違いはあるのか?

 

 

「ヌNu」;カタカナ「ぬ」;「ヲWo」;カタカナ「を」;font;

「ヌNu」;カタカナ「ぬ」;「スSu」;カタカナ「す」;font;

 日本人なら普通は見間違いませんが、フォントによって見間違える可能性は出てきそうです。また、語順・文脈から判断できない固有名詞などで紛らわしいフォントだと間違えそうです。 

 

【「Hu」;漢数字「2」;「Ni」;カタカナ「に」】【「はち」;漢字;「HA」;カタカナ】

【A】一二三四五六七八九

【B】一ニ三四五六七ハ九

 

A=123456789

B=1に34567は9

 

匕;漢字;ヒ;カタカナ;漢字「匕」の読み「アイ」。例「匕首(あいくち)」

日;漢字;曰;漢字;漢字「日(ニチ・ひ)」。漢字「曰(いわ)」。例「曰く(いわく)」

人;漢字「ひと」;入;漢字「は・はい」;例「部に入る人(ぶにはいるひと)」

HE」;ひらがな;「HE」;カタカナ

 これにいたっては、「昔の日本人はアホか!」とツッコミ入れたくなります。微妙なラインの鋭さやクネリ具合で「ひらがな・カタカナの区別」しろといっても誤認があるはずです。文字書きには個人差もあります。

カタカナ「ヘ」のつもりでも、ひらがな「へ」のように丸みのある曲線になる人もいるはず。

▼ローママ? いえ「ロ−マ で(場所)」

MA」;カタカナ;「TE」「DE」;ひらがな;「ローマて」という並びはなかなかならないが、「ローマで」という並びはありうるし、実際にわかりにくい例があった。

 

▼yuu

「夕ゆう」;漢字;「タた」;カタカナ

 「スゲー夕立見た」、この文字列は?

X「すげーた」と「立見(たちみ)」

O「スゲー(すごい)」と「夕立(ゆうだち)」と「見た」

 

▼[四匹]の子豚。よんよん? ひきひき?

よん」;漢字;「ひき」;漢字

 「アア柿杮しUへヘ夕タ四匹ー一〇○ソンシツイイ二二」

        ↑

 この気持ち悪い文字のセットは、「アア」「イイ」のセット以外はすべて異なる文字同士です。

 

「ラら」;カタカナ;「うウ・U」;ひらがな;「らラ」;ひらがな

 https://twitter.com/e4bodabus/status/1283715367051726850

 

 https://twitter.com/TE0vAN1/status/1283950632089423872

 

 https://twitter.com/Grey_Sylph/status/1284001273314865152

「るRU」;ひらがな;「ゐWI」;ひらがな「わ行い」

 

😀いかがでしたか♪

 こういった紛らわしい字は、手書きの場合は「受け手が自動で適する文字で受け取る」というのができましたが、「デジタルの場合、〝別の文字〟のままデータがやりとり」されてしまう恐れもあります。

 

 デジタル文書で見分けるために「何かしらのマーク」が付けばいいなあとも思います。

例:ひらがな「へ」の左上の数ドットを塗りつぶす、カタカナ「へ」は真上に数ドット塗りつぶすとか。

 

 もちろん、印刷時・記事表示・電子書籍時には、その塗りつぶしは消えるというふうにすれば、 入力時のデータ上の勘違いだけを減らせるのではと思いました。

 

▽〝別の文字〟のままデータがやりとり

 さきほど、書きました「デジタルの場合、〝別の文字〟のままデータがやりとり」について、説明をしておきます。

 どんなときに起こる問題かというと、「文字認識機能で入力された文章」で起きる問題です。

 

次の例文は、仮に文字認識機能で入力されたものだと考えて読んでください。

 私が洗濯物を千しているときの息子が、おえかき帳で何かを描いていました。終わってから見せてもらうと、シカクマルの形をひたすら描かれているだけでした。しかし、1才の息子にとっては、なにかをイメージした立派な絵なんだなと思います。

    ↑

 実は、この文章はある2つの文字が不自然です。下に『』で囲い、どこが不自然か示しました。

 私が洗濯物を『千』しているときの息子が、おえかき帳で何かを描いていました。終わってから見せてもらうと、『シカク』・マルの形をひたすら描かれているだけでした。しかし、1才の息子にとっては、なにかをイメージした立派な絵なんだなと思います。

 

『千』

=水気を抜くために行う「ほす(干す)」の漢字『カン』ではなく、数の1000の漢字『セン』が書かれています。これだと「洗濯物をセンしている」となってしまいます(笑)。

 

シカク

=四角を表す記号の「□」ではなく、漢字の『クチ』になっています。「くち・マルの形」になってしまいます。単純な記号のようにしか描けないという話なのに「クチの形という複雑な形」を描く息子だったらオカシイですよね(笑)。

 

 このように不自然な文字も、気づかなくてコピペしたら、そのまま「洗濯物をセンしている」「くち・マルの形」の文字で広まってしまいます。

 

 

勝手にTwitterAccountを宣伝「中國の怪レい日本语bot@correctJP「」

https://twitter.com/correctJP

 

kw:似てる字辞典、似てる辞事典、似てるじ時点、にてるじじてん、ニテルジジテン、niterujijitenn、niterujijiten、似てる文字辞典、似てる文字辞典、にてるもじじてん、ニテルモジジテン、niterumojijitenn、niterumojijiten、

kw:みわけつかねえよじてん、見分け付かねえよ辞典、見分けつかねえよ辞典、ミワケツカネエヨジテン、miwaketukaneeyojitenn,miwaketukaneyojitenn,miwaketukaneeyojiten,miwaketukaneyojiten,

kw:くべつつかねえよじてん、区別付かねえよ辞典、区別つかねえよ辞典、クベツツカネエヨジテン、kubetutukaneeyojitenn,kubetutukaneyojitenn,kubetutukaneeyojiten,kubetutukaneyojiten,

kw:くべつできねえよじてん、区別出来ねえよ辞典、区別できねえよ辞典、クベツデキネエヨジテン、kubetudekineeyojitenn,kubetudekineyojitenn,kubetudekineeyojiten,kubetudekineyojiten,

kw:区別つかない文字、くべつつかないもじ、くへつつかないもし、クベツツカナイモジ、kubetutukanaimoji、区別つきにくい文字、区別しにくい文字