和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

🔎【平片漢】表記ブレの調査【方法:表記ゆれ件数データ】

f:id:peaceheart:20201204143417j:plain

🦊 こんにちは 🦊

私が記事や本を出版する上で、「表記ブレのデータ」をとっています。「調査方法・各行へのLINK」を記した記事です。

 

▶【調査方法】

f:id:peaceheart:20210104235237j:plain

 

検索時はすべて「""」でキーワードを囲んで、[Google検索の絶対検索]で行ってます。

 

 

【調査方法 補足】

※まとめデータに「""」アリナシで記載してますが、検索時はすべて「""」で囲んで絶対検索の設定で行ってます。

 できるだけ件数が多い順で並べてます。 秒数は無視してください。件数まとめの下にある特記事項は個人的に気になった点を書いてます。また意味を載せたりしています。

 

キーワードの上の数字は調べた日付です。

※[a]が後ろに付いてる=日付をメモし忘れ、記憶を頼りにおおよその日付を書いたものです。

 

同じ音の言葉は基本的にすべて同じ日に検索」が 基本です。

※あとで思いついた表記ブレは別の日に検索するので、その場合は別な日の単語のみ追加で日付を入れる。

 

Twitter検索数】

言葉によっては、Twitterでも検索数を調べています。その調べる方法は「Yahoo!リアルタイム検索」を用いて行います。 「Yahoo!リアルタイム検索」で「""」で囲んで絶対検索で行います。件数は直近30日分を計測。

Yahoo!リアルタイム検索」で検索した結果は「YRT」の後ろの検索数です。

20210318

"挨拶"・・約 277,000,000 件 YRT500,309件

"あいさつ"約 101,000,000 件 YRT 36,411件

"アイサツ"・・約 121,000 件 YRT1,878件

 

 

▶表記ゆれの件数を見る上での注意!

f:id:peaceheart:20210116173506j:plain

▽ひらがな・漢字は多くなりがち

実は、「ひらがな・漢字は実際の表記より検索結果の件数が多くなりがち」です。その原因をまとめたのが下になります。

 

・辞書の見出しや説明では「ひらがな・漢字」を用いる。

ルビは「ひらがな」表記が多い。

カタカナ変換は「手間」がかかる

 

 

辞書の言葉の載せ方を知るために、辞書が手元にない方は「画像検索」で確認してください。

「広辞苑」の検索結果 - Yahoo!検索(画像)

 

※辞書の見出し見本:日本語

や・く【焼く】

 

※辞書の見出し見本:外来語

ウイナー【winner】

 上の見出し見本を見てわかるように、「決まりごと」のように「ひらがな【漢字】」という並びで見出しが作られています。

 そして、この「辞書の情報を引用」する場合は、この辞書の表記のまま引用するのが基本ですから、「日本語の見出しに使われないカタカナ」は、使用率が下がります。

 

また、辞書の表記を目にした人は

感動詞の「ああ」の見出しも「デジタル大辞泉小学館)」では以下の様になっています。

ああ【嗚=呼/×噫】 の解説

 

どう考えても、日常でこのように漢字表記すべきというものでもないと分かるものですが…見出しはそういったものは気にせずに漢字表記を載せます。

つまり、文化的側面で表記を載せているのではなく「漢字にできる言葉なら漢字を載せているだけ」と考えるべきなのです。

 

 

 ▼和語の里の表記ブレの調査が優れているワケ

f:id:peaceheart:20210104235237j:plain

 まず下の「チューハイ」の表記の件数を見てください。

20220102
"チューハイ"_約 11,000,000 件
"チュウハイ"・約 3,710,000 件
"酎ハイ"・・・約 2,860,000 件
"ちゅーはい"約 89,300 件
"酎はい"・・約 45,000 件
"ちゅうはい"約 11,500 件
"ちゅーハイ"_約 1,160 件

 この結果自体は、おおよその現実的な使用率と変わらないと思います。ただし、特記事項でこう記しました。

特記:
 すべて「 -使い方 -用例 -意味 -辞書 -読み方」でマイナス検索。商品名・商品説明に含まれる文言であるため、ここで言う件数は「人々の漠然としたチューハイを指す表記」の件数ではない。ただし、企業側も商品説明に日本人に馴染みのあると思われる表記を使うことが多いので、相関関係はそれなりにある。大きく件数を変えてしまうのは、この中ではマイナー表記の「ちゅうはい」を商品名の表記にして大人気商品になったら、たくさんの商品ページが作られ件数も増えることとなる。

 今回のチューハイは、たまたま世の書き手と同じくらいの表記の使用率だったと思いますが、

・それが異なることもある

・人気商品が出たらweb上の件数が大きく変わる

などの注意書きも載せています。

 

 ▼表記ブレを深く考える

f:id:peaceheart:20210104235237j:plain

表記とは個性が出るだけでなく、文化的な背景も知ることができます。

 

A:表記複数

B:表記ミス1

C:表記ミスG 

D:表記ブレ

        ↑

これらは別物です。

 

A:表記複数

Aは「いろんな表記が生まれている」という大まかな概念です。※もともと[表記ブレ]と同質のこととしてましたが、別物としました。

 

B:表記ミス1

Bの表記ミスは、「正式名称を誤って表記すること」が主です。

 

C:表記ミスG

Gとは「ガラパゴス」のことで、ある範囲においての独自のルールということを意味します。こちらは正式名称とは別に、「入力する側にルールがあり、そのルールからハミ出るミス」です。ある会社Zのデータ管理においては、「スペースを使わないルール」の場合は、[Go To]表記が「社内ルールにおいてのミス」になります。その場合[GoTo]が「社内ルールにおいての正式名称」になります。

※ただし、データを世間に公開する場合は、スペースアリで公開・注意事項の追加などすべきです。注意事項の例:「正式名称と異なりスペース無しで表記しています。」

 

D:表記ブレ

ここが一番複雑で、

・表記ブレにより、正式名称を間違えたら表記ミスである。ミスの種類も複数あり「スペースの有無・誤字・全角半角・大文字小文字・平片漢英のミス」など

・明確な正式名称が決まっていない場合に、平片漢英など字が異なるものが見受けられる場合はミスではなく、ただブレているという事実のみ。

・意図的な表記ブレ1、読み手に対しての印象を変えるためのもので、「一般的に認識が[平]表記なものを[片]としたり、[漢]表記を[英]表記にしたりする。」

・意図的な表記ブレ2、1との違いのみ記す。「既存の規範となる辞書にある表記をあえて、規範外の当て字をすること」

・意図的な表記ブレ3、ひらがな・漢字の部分の一部〜全体をカタカナ表記することで「ある意味をイメージしやすくする」。

 

 

【意図的な表記ブレ】

 文化的な背景を知る上で一番大きな要素です。表記を変えることで何かしらの意図をもたせたり、そもそも表記が変わることで意味自体を変えたり限定するという使い分けです。

 国として定義しているワケでもないのに、国民の多くは「何気なく使い分け」していたりします。これは経験によるもので無意識にも行うことです。もちろん、意識して表記をするのも普通です。

 

この表記ブレデータ集で、そういう部分へ目を配る意識を持っていただければ幸いです。

 

【た】https://onbin.hateblo.jp/entry/hyouki0ta

【ち】https://onbin.hateblo.jp/entry/hyouki0ti

【つ】https://onbin.hateblo.jp/entry/hyouki0tu

【て】https://onbin.hateblo.jp/entry/hyouki0te

【と】https://onbin.hateblo.jp/entry/hyouki0to


「表記ブレの表記ゆれ」

ひょうきぶれ・ヒョウキブレ・ひょうきゆれ・ヒョウキユレ・表記揺れ・表記ゆれ・表記ユレ・表記ぶれ・表記振れ・表記ブレ・hyoukiyure・hyoukibure、カタカナ日本語、かたかな日本語、片仮名日本語

ぶんしょうのゆらぎ、ふんしようのゆらき、ブンショウノユラギ、bunnshounoyuragi、文章のゆらぎ、文章の揺らぎ、

もじのゆらぎ、もしのゆらき、モジノユラギ、mojinoyuragi、文字のゆらぎ、文字の揺らぎ

ことばのゆらぎ、ことはのゆらき、コトバノユラギ、kotobanoyuragi、言葉のゆらぎ、言葉の揺らぎ

ちからはじまることばのひょうきゆれ、ちからはしまることはのひようきゆれ、tikarahajimarukotobanohyoukiyure、ちから始まる言葉の表記ゆれ、チから始まる言葉の表記ゆれ、力始まる言葉の表記ゆれ