和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

【クソ音声認識 まとめ】Hey Siri、なんだその音声入力は?【随時更新、クソ音声認識辞典風】

f:id:peaceheart:20210729113223j:plain

f:id:peaceheart:20210923160611g:plainあてじ

💻音声認識明智・立石・あて字・安定し」

 

f:id:peaceheart:20210923160611g:plainどうおんいぎご

💻音声認識「どっち子」

        ↑

 このように、「AIが音声認識の入力結果が不完全だと感じたもの」をメモとして残しておく記事です。

 

※メモとして残しておく条件・検証の仕方については、コチラのLinkから。編集者用リンク

 

 

 

▼クソ音声認識Data

f:id:peaceheart:20210821050046j:plain

【A】

【あてじ(当て字)】20210923

Android=

iOS@mac=明智・立石・あて字・安定し

 

【あんどろいど(Android)】20210922

Android=Android(英語のつづり、ローマ字)

iOS@iphone=アンドロイド(カタカナ)

iOS@mac=アンドロイド(カタカナ)

※自社製品の表記と一般名詞の「アンドロイド」とを区別するためにローマ字表記が出てくるのだと思うが、そもそも「アンドロイド」という一般名詞もローマ字表記が正しいのでそれを使い分けとは言わないような気がする。その理論が成立するなら「システム」という名の言葉を固有名詞にしたい会社がローマ字で「System」と表記すれば固有の品名にできるかと言われればそれを認めるのは良くないと思う。なぜなら「着物」と言う一般名詞をローマ字にした「KIMONO」と言う表記で「ブランドなどの商標登録」をしようとした人がいるからだ。それがまかり通ってしまうと、個人や企業が日本文化の権利を奪うことができてしまう。Tag候補:gkg

 

【いきりたおす(イキリ倒す)】20220301

行切り倒す・伊切倒す

 

【いばりあい(いばり合い・威張り合い)】20210929

Android=

iOS@mac=尿愛

※こいつはヒドイ… 趣味は人それぞれで、「尿を愛する人」を否定するつもりはありません。しかし、「この表記を真っ先に入力する音声認識機能=頭がおかしい」と断言する。実はGoogle IMEでは「いばり」と入力すると「尿」が第一変換候補に現れる。「〇〇合い」というよくある連語だと認識するシステム設計を組み込めていないのかと疑われる。

 

【えーぼたん(Aボタン)】20210923

Android=

iOS@mac=英ボタン

※「英ボタン」って人生で一度も言ったことがないんだが、もしかして、CapsLockの下に書かれてる英数のボタンのこと? それを「英ボタン」と呼ぶ界隈があるのか?

 

 

 

【K】

【かんじを-漢字を】20210928

Android=「」

iOS@mac=漢字を・感情

※棒読みがちに「漢字を」と話せば「漢字を」と入力結果を出してくる。しかし、流暢に話そうと思って「漢字を」と話すと「感情」と認識することがかなり多い。

 まあ、[jiwo]と[jou]の違いしかないため、仕方ないとは言えるが「かんじをよみかきする」ですら、「感情を読み書きする」というふざけた音声入力結果になるのはいただけない。

・かんじを kanjiwo

・かんじょう kanjou

 

 

【ぎむきょういくがい-義務教育外】20210929

Android=「」

iOS@mac=金教育会・金強育海

※「ぎむきょういく」の音声認識は、しっかり「義務教育」と入力してくれるのに、続けて「がい(外)」と言うと「義務教育」文字列まで変更されてしまう。そして「金教育会・金強育海」などの意味不明すぎる言葉に変換される。

 

【きょうだい-兄弟】20210923

Android=「」

iOS@mac=兄弟・姉妹、姉妹に

※なぜか、あて字のほうの「姉妹」で音声認識の入力結果を出してくる。とくに「きょうだいに」まで音声入力させると、「高確率で「姉妹に」と言う表記になってしまう。そもそも、Mac音声認識は漢字の認識が間違っている。

x「姉妹」を「きょうだい」と読む

o「きょうだい(兄弟)」という言葉に「姉妹」の字を当てている。

 

 

【くすぶる】20211003

Android=「」

iOS@ipod=9勝9数

 

 

【ごうすう(号数)】20210924

Android=「」

iOS@mac=超す・子子・どっち・工数

※何がどう間違えて「どっち」と認識をしているのかが不明である。何度も何度も何度も何度も繰り返して1回奇跡的に「号数」と入力されたが、頑張ってくれよ音声入力。

 

 

【S】

【さがあります(差があるます)】20220510

ios@ipad=さがあります・左があります

 

【さがでます(差が出ます)】20220510
ios@ipad=さがてます・さが出ますさ

 

 

【じ(字)】202109247

Android=「」

iOS@mac=地の中に・事の中に・人の中に

※「その字の中に含まれている意味」と入力したくて、「その地の中に含まれている意味」となってしまう。それなら、まだあり得るが、「人の中に」と入力されたときは呆れ果てた。「(じん)人の中に」と表現する人はこの世にいるか?

アメリカ人の中に」「日本人の中に」などの入力のためと思われるが、「その」のあとに「じん」と読んで「人」は、ありえない。

 

ぜんひていios ipad1000否定 全否定20220307

【T】

【ただし】20210923

Android=「」

iOS@mac=直・理

※「ただし」を「理」と書く「漢字病・中二病・漢語崇拝・漢字崇拝」の中でも重症患者である人たちのために、そんな音声入力を搭載するな。

※20220522で検証したところ、iOSAndroid不明「ただし」は「正しい・正」と認識された。おそらく「正」一文字で出力されたのは「〇〇 正(ただし)」さんという名前の「ただし」なのだろう。しかし、そんな名前よりも「ただし、この日は忙しい」などの用法が多いのだから「ただし」と出力すべきである。

 

【たちがわるい(タチが悪い)】20211009

Android=「」

iOS@ipad=質が悪い

※「質が悪い」は、「しつ・たち」でブレる読みとして浸透してしまうと、誤解を与える。「たち」を「質」で書かないという習得をすべきではない。

 

【うえにたっちゃいけない(上に立っちゃいけない)】20211009

Android=「」

iOS@ipad=上に断っちゃいけない

※「ひとのうえにたっちゃいけない」を音声入力したら、「人の上に断っちゃいけない」で入力されたときは衝撃だった。アホかと・・・

 


【つきはてます(尽き果てます)】20210923

Android=「」

iOS@mac=月はてます・次はてます・つきはてます

 

 

【どうおんいぎご(同音異義語)】20210922

Android=

iOS=どっち子

※なんで「どっち子」? 何度も「どうおんいぎご」とマイクに向けて言ってみても「どっち子」になった

 

 

【N】

【なぜか】〜20210910

Android=ひらがな「なぜか」

iOS=漢字「何故か」

 


【なぜわたしは】〜20210910

Android=「なぜ私」

iOS=「なぜ私は」

        ↑ 

 【なぜか】【なぜわたしは】の比較の結果、iOSは「なぜか」「なぜわたしは」の「なぜ」を、後に続く言葉によって表記が変わるようだ。

 

 

【にせんにじゅういちねん】20210922

Android=「」

iOS=「2020一年」「2021年」

※なんかいかに一回は「2020一年」という意味不明☆な音声認識をする。

 

 

【H】

【はじめから】20210923

Android=「」

iOS@mac=元から・一から

※何かの条件で「元から」という表記になるようだが、条件は不明。今、検証しても音声認識するごとに変換候補が「元から・一から・初めから」と変わっていく。

 

【はでかむ(歯で噛む)】20211001

Android=「」

iOS@mac=派手噛む・派手噛んで

 

 


【ひときわ(一際)】20211003

Android=「」

iOS@ipod=一樹は

 

【ひとまず(一先ず)】20211003

Android=「」

iOS@ipod=トーマス

 

ひふios ipad肌皮膚20220307

 

【ふけ(フケ)】2021.9~11月頃

Android=「」

iOS@ipad=浮気

※頭皮の状態が悪いときに、ポロポロと頭皮のハガレ、アブラっぽいものが固まったものが髪についたり、そこからポロポロ落ちたりする「フケ」。「ふけ」という音を聞いた99.9%が「頭のフケ」を連想するのに、なぜかiOSの音声入力では「浮気」が高確率で入力される。滋賀県守山市に「浮気町(ふけちょう)」という町があるらしいが、そういう固有名詞を「日常語のフケ」より優先する意味がわからない。「ふけ」を町として言い表したいときは「ふけちょう」と音声入力したときに「浮気町」と表記すればいいだろうと思う。

 

【ぶんのあいだ-文の間】20210928

Android=「」

iOS@mac=雲の間

※おそらく、「雲の間」の読み方を「うんのあいだ」とシステムに組み込んでしまっているのだろう。しかし、「雲の間」を「うんのあいだ」と読む人は「重症漢語崇拝者」しかいないので、そんな読み方は考慮に入れるのはオロカモンだろう。というより、「文の間」を出力しなさい。

 

【M】

【まえについてる-前についてる】2021014

Android=「」

iOS@mac=前についてる・米についてる

※正しい表記になることもあるが、何故か「米についてる」と変換されることがある。はっきりと「ま」「え」と発音しても「ま」「い」からなる「米(まい)」入力されてしまうことがある。

※これの問題点は「玄米」だとか「新米」だとかそういった「〇〇米」と言うときには、「米」を「まい」と読み上げるが、「米」単独の場合は「まい」と読む事は無いしそもそもそのような話し方をしたら通じない。

 

【みぬまに-見ぬ間に】2021014

Android=「」

iOS@mac=見沼に

※期間を表す「3日」などに続けて「みぬまに」と発音しても「3日見沼に」と入力されてしまう。否定の「ぬ」を認識できないと言うのか? しかし、「知らぬ間に」はちゃんと否定の「ぬ」を認識している。

※別に定型表現にしか存在しない用法ではないのに、Appleにとっては現代人の誰もが「否定の意味で[ない]のように[ぬ]を使う」というのがありえないとでも思っているのだろうか?


【みぶんのひと-身分の人】20220921
・OS忘れた=12分の1

 

 

【みんい-民意】20220113

iOS@mac=みんい;新・1人

iOS@mac=みんいの;新野

 

【もんだいぶん-問題文】20210928

Android=「」

iOS@mac=問題文・問題分・問題うん

※問題と雲の間に文の間に

 

 

 

【Y】

【や(助詞)】20210928

Android=「」

iOS@mac=武州家作り・予州家作り・どっち

※だからなぜ、複数・特定多数を指す「や」を「家」と勘違いするんだ? そもそも、名詞と名詞の間に「や」が入る場合は並列・列挙の助詞と認識するのが、日本人の普通の考えである。

 

 

 

【よきもの(良きもの)】20210928

Android=「」

iOS@mac=4着もの
ios@ipad=良きもの

 

【R】

【りゃくす(略す)】20211001

Android=「」

iOS@mac=訳す・リラックス

 

【W】

【を(単独)】20210923

Android=「」

iOS@mac=お・上・生

※何かの単語に生音声入力した後それに続けて「を」と言うと、「を」と入力してくれますか単独だといくら頑張っても「を」が入力されない。

 

【をというと(「を」と言うと)】20210923

Android=「」

iOS@mac=音雄飛

 

 

【を、めにしても】20220510
iOS@ipad=男女にしても

余談

 そもそも、「日本語の音声認識での入力=限界がある」という前提でデジタル入力に臨むべきです。

 「日本で主に使われている文は、平・片・漢・ロの4表記混じった文」ですから。

・平=ひらがな

・片=カタカナ

・漢=漢字

・ロ=ローマ字

 

 

こんな、音声認識あったぞ。

などのコメント、お待ちしております。

 

 

How

【「クソ音声認識」の条件】

音声認識で入力される表記・文言が「クソ」であるものマイルドに言えば「不完全」であるもの。

 

 

▽今回検証するのは「Android」と「iOS

 iOSについてはMacでの音声認識入力も考慮して考える念のためiOSMacどっちちらでも検証結果がある場合はMaciOSを分けて音声認識の結果を書いておく。

 Macでの音声入力の設定は「拡張音声入力を使用しない設定」です。

※「拡張音声入力を使用」と言うチェックボックスをチェックしていない状態の設定です。

 

【Q】GoogleAppleを批判する気ですか?

 【A】いえ、事実をまとめておくための記事です。開発者の目にとまり、改善に役立ててくれればと思い書いています。

 

 

 

kw:

くそんせいにんしきまとめ、糞音声認識まとめ、kusoonnseininnsikimatome、kusoonseininsikinmatome

kusoninnsiki kusoninsiki くそにんしき、クソニンシキ、糞認識、クソ認識、くそ認識

kusoninnsikijitennm,kusoninsikijiten。くそにんしきじてん、くそにんしきしてん。クソニンシキジテン、糞認識辞典、クソ認識辞典、くそ認識辞典、糞認識時点、クソ認識時点、くそ認識時点

 

kw:糞変換、くそへんかん、クソヘンカン、kusohenkann、kusohenkan、くそ変換

変換機能糞すぎ、変換機能糞過ぎ、変換機能糞杉、変換機能くそすぎ、変換機能クソすぎ、変換機能クソ過ぎ、hennkannkinoukusosugim、henkankinoukusosugi

漢字変換機能糞すぎ、漢字変換機能糞過ぎ、漢字変換機能糞杉、漢字変換機能くそすぎ、漢字変換機能クソすぎ、漢字変換機能クソ過ぎ、kanjihennkannkinoukusosugim、kanjihenkankinoukusosugi