和語の里(Wagonosato) - 日本語・データ化・考察 -

やまとことば・和語・日本語に関する情報をデータ化・日本語の問題点解説。語彙力・難読漢字クイズなどによる教養アオリの否定など。

AIの読み上げミス。米兵を「コメヘイ」、新技を「アラワザ」など。一覧・まとめ【日本語とAI・音声読み上げソフト】


 Youtubeで動画を見ていると、文字読み上げ機能で作られた動画を よく見かけます。

 そういった動画の中で「米兵」というテロップと同時に「コメヘイ」という読み上げ音声が流れました。
 動画内容は、アメリカの兵士に関する話だったので、当然「米兵」は「ベイヘイ」です。

 しかし、読み上げ音声を作成するAIが「米兵」を「コメ(米)を使って戦う兵士」かなんかを想像したのか、「こめへい」と読んでしまうことがあるようです。

▼見つけた「AIの読み上げミス」

 これから、「AIの読み上げミス」を見つけたら、それらをここに追加していきます。
 注意点として、音声読み上げ機能はさまざまあり、その機能によって結果は違ってくるということです。
※だから、「私の読み上げソフトでは問題なかったよ。」というコメントは、筋違いです。

▽データ

【K カ行】

外国人参政権(がいこくじんさんせいけん)→AI「がいこくにんじんせいけん」

 海外産のAIが無理して日本語を読み上げようとしたためおきたと思われる。外国人参政権を「外国・人参・政権」と区切ってしまっているため、「人参」部分を「にんじん」と読み上げている。日本語ネイティブなら、「外国人・参政権」で区切る。

語り所(かたりどころ)→AI「かたりしょ」。

このように読みあげるから、「〇〇所」は何でもかんでも「〇〇しょ」と読むかと思いきや、「良い所(よいところ)」と正しく読み上げていた。

下記(かき)→AI「したき」。

AI広告動画にて。

下記(かき)→AI「きもと」。

下を「もと」読みし、レ点でも入ったかのように逆に読んでいる
AI広告動画にて。

〇と〇間(かん)→AI「〇と〇かん」。

 「太郎さんと次郎さん間でイザコザが〜」のテロップで、「間」をアイダと読み上げてしまっている。文脈無視。「たろうさんとじろうさんアイダで」だと変である。ふつうは「たろうさんとじろうさんカンで」と読む。

貴明(たかあき)→AI「きあき」。

 AI広告によるフェイク動画にて。経済評論家の「三橋 貴明」をAIで無断で動かし喋らせている動画。amazon商品ページ「https://amzn.asia/d/alIIv43」の商品「日本をダメにした財務省経団連の欺瞞 単行本 – 2020/7/2 三橋 貴明 (著)」の商品画像を拡大すると「Takaaki Mitsuhashi」の文字が確認できるので、正式には「三橋貴明(みつはしたかあき)」だと分かる。

【S サ行】

新技(しんわざ)→AI「あらわざ」

現代「新技」と書かれている場合は、基本的に「しんわざ」と読むのが普通。
まあ、どちらも訓読みで統一したほうがそれっぽいから、「あらわざ」とAIが誤解したのかもしれない。
新しいことを形容する際に「あら」を使う語は「あらうま【新馬】※1歳の馬」「あらき【新墾】※新しく開墾」「あらくち【新口】」などの例があるが、現代の一般的な用法ではない。
辞書に「新技」は立項されていない。

凄まじい(すさまじい)→AI「せいまじい」

AIが「まじい」を送り仮名と認識できずに、音読みの1文字漢語表現「凄(セイ)」+「まじい」と認識してしまった例。
精選版 日本国語大辞典「せい【凄・淒】」の[初出の実例]では、「凄(セイ)として寒色を帯びざるはなし」(出典:自然と人生(1900)〈徳富蘆花〉湘南雑筆)。のように1文字漢語として使われていて「① さむいこと。つめたいこと。また、そのさま。」の意味を持つ。ただし、漢語に直接「まじい」をつけることは、ふつうしないので、「せいまじい」はミスだろう。

ストーリー等(すとーりーなど)→AI「すとーりーら」

一般的には「ストーリーとう」や「ストーリーなど」と読む。「ら」と読むのは違和感。

〇〇台詞→AI「〇〇ゼリフ」

20250417。私が見た動画では「ありえない台詞」のテロップで「アリエナイゼリフ」と発音していた記憶。

【T タ行】

民度(みんど)→AI「たみど」

機械音声の動画で観測。;20260120

単行本(たんこうぼん)→AI「たんこうほん」

おそらくAIが、「たんこう【単行】」+「ほん【本】」で分けてしまったのだろう。

出典:デジタル大辞泉「たんこう【単行】」
1 単独でおこなうこと。また、単独で行くこと。
2 それだけを独立しておこなうこと。多く他の語と複合して用いる。「—犯」

低リスク(ていりすく)→AI「ひくりすく」。

 日本語ネイティブで低リスクを「低リスク」と読む人は、1000人に1人も存在しない。

https://x.com/eruku333_nu/status/1944588052346892686
えるく@eruku333_nu
最近、実在の著名人を使ったディープフェイク映像で怪しいサイトに誘導する広告がYouTubeでよく流れてくるけど、
「こんにちは。前澤友作(ともさく)です。私が開発した低(ひく)リスクの投資システム……」
みたいな読みがガバいやつでてきておもろい
午前11:41 · 2025年7月14日

デカいはず→AI「でかいわず」

20250417。「これは、きっと、こうであるはず」の「はず」。日本語ネイティブは普通、これを「わず」と発音しない。「はず(Hazu)」と発音する。

手抜いてる(てぬいてる)→AI「てぬきいてる」

これは、【世にあるオヌカのせいで、AIが誤学習】したため起きたと思われる。そのため、「手抜き(てぬき)」と書くべきところをオヌカ「手抜(てぬき)」と書いたためだ。

【N ナ行】

【H ハ行】

は(WA)→AI「HA」。

 「これはおいしい」のようなときの、詞「は」を「WA」と読み上げずに「HA」と読み上げるミス。「これはおいしい→koreHAoisii」。

走力(そうりょく)→AI「はしりりょく」

走力;はしりりょく;そうりょく;20230808

ハズ・筈(はず)→AI「わず」。

 「知っているはず」の「はず」を「わず」と読み上げるAIのミス。助詞「は(WA)」を「HA」と読み上げるミスの逆。

130万人(ひゃくさんじゅうまんにん)→AI「いっぴゃくさんじゅうまんにん」。

AI広告動画にて。
 日本語ネイティブで100を「いっぴゃく」と読む人は、1000人に1人も存在しない。

https://x.com/zhimei_m/status/1944610378723606871 あれぇ@zhimei_M 2025年7月14日
YouTubeに出てくる、前澤友作の生成AIの詐欺広告?
まえざわともさく って自己紹介するし、130万人を「いっぴゃくさんじゅうまんにん」って読むし杜撰すぎる。

187%(ひゃくはちじゅうななぱーせんと)→AI「ひゃくぱずるななぱーせんと」

AI広告動画にて。

福山雅治(ふくやままさはる)→AI「ふくやままさわる」

語中に「は」があれば、すべて「わ」と発音するなどというデマが広まった結果、そのデマで学習したAIが、ほとんどの「は」を「わ」と発音するオバカチャンAIがたまにある。

米兵(べいへい)→AI「こめへい」。
帽子を被らない(ぼうしをかぶらない)→AI「ぼうしをコウムラナイ」。

 帽子はカブるものであるため、この用法であれば、「ぼうしをかぶらない」と読み上げなければいけないが、AIは文脈を無視して「被らない」の部分だけで判断して「こうむらない」と読み上げてしまっている。

【M マ行】

前澤友作(まえざわゆうさく)→AI「まえざわともさく」。

 AI広告によるフェイク動画にて。「前澤友作」をAIで無断で動かし喋らせている動画で、「前澤友作」本人とは無関係。

三橋貴明(みつはしたかあき)→AI「みはしきあき」。

 AI広告によるフェイク動画にて。経済評論家の「三橋 貴明」をAIで無断で動かし喋らせている動画で、「三橋 貴明」本人とは無関係。amazon商品ページ「https://amzn.asia/d/alIIv43」の商品「日本をダメにした財務省経団連の欺瞞 単行本 – 2020/7/2 三橋 貴明 (著)」の商品画像を拡大すると「Takaaki Mitsuhashi」の文字が確認できるので、正式には「三橋貴明(みつはしたかあき)」だと分かる。

観に行く(みに)→AI「かんにいく」。

 「野球観に行く」を読み上げたAIが「野球観(ヤキュウカン)」と読み上げた。

銘柄(めいがら)→AI「メンヘラ」。

 AI広告によるフェイク動画にて。ホリエモンをAIで無断で動かし喋られている動画で、ホリエモン本人とは無関係。投資関連の広告における「銘柄」。

【Y ヤ行】

優待って(ゆうたいって)→AI「ゆうまって」

 AI広告によるフェイク動画にて。有名人をAIで無断で動かし喋らせている動画で、その有名人とは無関係。

【R ラ行】

【W ワ行】

話数(わすう)→AI「はなしすう」


【記事編集用Link】
https://blog.hatena.ne.jp/peaceheart/onbin.hateblo.jp/edit?entry=6802340630910753105

【KEYWORD ZONE】

dic_yomiage_aa。grp_ai。
音声読み上げソフト、おんせいよみあけそふと、おんせいよみあげそふと、onnseiyomiagesohuto。onseiyomiagesohuto。
音声読み上げ機能、おんせいよみあけきのう、おんせいよみあげきのう、onnseiyomiagekinou。onseiyomiagekinou。
AI音声、えーあいおんせい、エーアイ音声、e-aionnsei、e-aionsei、
音声読み上げソフト、おんせいよみあげそふと、おんせいよみあけそふと、onnseiyomiagesohuto、onseiyomiagesohuto。
音声読み上げ機能、おんせいよみあげきのう、おんせいよみあけきのう、onnseiyomiagekinou、onseiyomiagekinou。
自動音声認識、じどうおんせいにんしき、しとうおんせいにんしき、jidouonnseininnsiki。jidouonseininsiki。

AIと日本語、えーあいとにほんご、えーあいとにほんこ、エーアイと日本湖、エーアイトニホンゴ、e-aitnihonngo、エーアイと日本語、AIとにほんご、AIと日本湖、
ことばがり、ことはかり、ことは借り、コトバガリ、kotobagari、言葉狩り、コトバ狩り