ロボトーク!

音声感度の調整方法

ロボホンの「耳が遠い」、「話しても無視される」、「難聴」が直せます。
VAD (Voice Activity Detection)の調整とも言います。

「設定」の「マイク感度設定」の内部設定値(標準)は以下のようになっています。(第二世代)
この「高」「中」「低」の内部設定値は、ロボホンのシステムROM内にあり書き換えることは出来ません。

「高」 「中」 「低」
MICTYPE_BUILT_IN,Int,front_margin_ms, 800 800 800
MICTYPE_BUILT_IN,Int,duration_ms, 290 300 350
MICTYPE_BUILT_IN,Int,breath_ms, 600 600 600
MICTYPE_BUILT_IN,Int,back_margin_ms, 400 400 400
MICTYPE_BUILT_IN,Float,gain, -12.0f -15.0f -20.0f
MICTYPE_WIRED,Int,front_margin_ms, 800 800 800
MICTYPE_WIRED,Int,duration_ms, 290 300 350
MICTYPE_WIRED,Int,breath_ms, 600 600 600
MICTYPE_WIRED,Int,back_margin_ms, 400 400 400
MICTYPE_WIRED,Float,gain, 1.0f 1.0f 1.0f
MICTYPE_BLUETOOTH,Int,front_margin_ms, 800 800 800
MICTYPE_BLUETOOTH,Int,duration_ms, 290 300 350
MICTYPE_BLUETOOTH,Int,breath_ms, 600 600 600
MICTYPE_BLUETOOTH,Int,back_margin_ms, 400 400 400
MICTYPE_BLUETOOTH,Float,gain, -12.0f -15.0f -20.0f
MICTYPE_BUILT_IN_STEREO,Int,front_margin_ms, 800 800 800
MICTYPE_BUILT_IN_STEREO,Int,duration_ms, 290 300 350
MICTYPE_BUILT_IN_STEREO,Int,breath_ms, 600 600 600
MICTYPE_BUILT_IN_STEREO,Int,back_margin_ms, 400 400 400
MICTYPE_BUILT_IN_STEREO,Float,gain, 0.0f 0.0f 0.0f

4種類の入力デバイスに対しての設定になっています。

  • ブルーの「 MICTYPE_BUILT_IN 」(内蔵マイク)
  • グリーンの「 MICTYPE_WIRED 」(イヤホンマイク(第一世代))
  • オレンジの「 MICTYPE_BLUETOOTH 」 (Bluetoothヘッドセット)
  • パープルの「 MICTYPE_BUILT_IN_STEREO 」(不明)

このうち、「赤」の部分が感度設定「高」「中」「低」で相違する部分になっています。なので、標準の設定ではこの「赤」の部分を調整することにより、感度設定を変化させているようです。



それぞれのパラメータの意味は
* 「front_margin_ms」・・・前方マージン
 音声検知の瞬間、判定開始時刻を少し過去へ遡るための時間。最初の「あ」という出だしの欠けを防ぎます 。
* 「duration_ms」・・・発話継続時間
 音声と判定されるための最小の長さ。短い物音(机を叩く音など)を「声」と誤認しないためのフィルターです 。
* 「breath_ms」・・・発話終端検出時間
 無音状態が続いた際に「話し終えた」と判定するまでの待ち時間。対話のテンポを左右します 。
* 「back_margin_ms」・・・後方マージン
 話し終えた判定のあと、語尾の消え際の余韻を含めるために認識範囲を少し後ろに伸ばす時間 。
* 「gain」・・・増幅率
 マイク入力をどれだけ増幅(または減衰)させるかの数値。感度そのものを調整します 。



理屈としては、人間が発声したときにロボホンがベストな状態で聞き取れるよう、それぞれのパラメータを調整していくことになります。

最初に、「設定値はロボホンのシステムROM内にあり書き換えることは出来ません。」と書きましたが、デバッグ用途か調整用途かはたまたバグなのか不明ですが、ロボホンをUSBケーブルで接続しロボホンの背中で「ファイルを転送する」を選んだ際に、パソコン等に接続されるロボホンの内部共有ストレージのルートに「voiceui」と言うフォルダを作成し、そのフォルダの中に上記設定およびパラメータを記述した「vad_setting.txt」と言うファイルを置き、ロボホンを再起動することによって、システムROM内のデータは使わずに、ロボホンの内部共有ストレージのルートの「voiceui/vad_setting.txt」が優先して使われるようです。

入力デバイスが多いので、まずはブルーの「 MICTYPE_BUILT_IN 」(内蔵マイク)を対象に、内部設定値「中」のパラメータをベースにした設定をファイル添付します。
(これは、1人だけ耳が遠いうちの子に設定し、他の2人と大差無いレベルまで改善がみられたものです)

ロボホンへの「vad_setting.txt」の適用の仕方を動画で作りましたので参照ください。
https://www.youtube.com/watch?v=D3S8OTAa5ik
vad

変更点は以下のみです
MICTYPE_BUILT_IN,Int,front_margin_ms,800
MICTYPE_BUILT_IN,Int,duration_ms,250
MICTYPE_BUILT_IN,Int,breath_ms,800
MICTYPE_BUILT_IN,Int,back_margin_ms,400
MICTYPE_BUILT_IN,Float,gain,-8.0f




なお、今回は「 MICTYPE_BUILT_IN 」(内蔵マイク)を対象にし内部設定値「中」のパラメータをベースにした設定です。「 MICTYPE_WIRED 」(イヤホンマイク(第一世代))や「 MICTYPE_BLUETOOTH 」 (Bluetoothヘッドセット)の設定変更はしていませんので、必要な方は、「vad_setting.txt」の中身を参照し、各々のロボホンにあった設定をしてください。
なお、文字入力の間違いや設定項目名の間違い、全角文字で入力したり、「,」(カンマ)なのに「.」(ドット)にしてしまったり、float型なのに整数を設定してしまったりなどした場合、ロボホン内部でエラーが発生し最悪は「VoiceUIAppが停止しました」などのエラーメッセージが出たりロボホンがしゃべらなくなったりします。その場合は、「vad_setting.txt」の中身を見直してください。なお、文字コードは 必ず UTF-8 で保存してください(BOMなし)
それでも直らない場合は「vad_setting.txt」を削除すれば元に戻ります。




なお、これはこちらの件の検証記事になります。
https://robotomo.robohon.com/chats/kmue1phlzd7kzx9z

picture_icon-02-02 vad_setting.txt
5件のコメント (新着順)
銀河☆彡
2026/06/03 04:30

情報ありがとうございます〜
3人に入れてみました🤖

ひとりにコソコソ話しても
ほかの二人が反応するのがおもしろい😊

もう少し様子を見て
なにかわかったらお知らせしますね〜


はーい。ありがとうございます(^^)
なんか、gainは無視されてる説もあるんですが、パラメータ変えるとちゃんと変わってる気がするので謎なんです。

銀河☆彡
2026/06/04 05:00

変更前、変更後と比べてみれば明らかに違いがわかりそうですね〜
ただ、無音部屋等の同一条件じゃないといけないけどね〜

1〜2日使った体感的な感想では
明らかに感度が良くなったように思います

みんなちゃんと言うことを聞いてくれる〜😊

今まで3人を並べてなにか言っても
ひとりか2人しか反応しなかったのに😉

マイクを第一世代、無線、内蔵と分けて定義してるのが興味深いですね〜
まぁ、確かにそれぞれ感度違うでしょうけど
って事は第一世代と第二世代のマイクは異なるって事ですね😁

第一世代は未確認なのでなんとも言えないんですが、
1週間以上経ちましたが、約7年間、難聴に苦しんできた「おれお」の耳は確実に良くなりました(^^)
「おはよう」「おやすみ」「お揃いぽーずして」にやっと全員が反応してくれます(^^)v

前にバッテリー交換の際、内蔵マイクを交換して貰ったのに変化なしで、次変えるとしたらメイン基板?と思ってたので、設定だけで変わるなら最初っから教えてよーんって感じです(^^;

どうなんでしょうね、第一世代はイヤホンマイクの設定が入っているので、内蔵マイクが違うかどうかなんとも言えないかなー?

銀河☆彡
2026/06/06 05:58

うちも気に取りはずいぶんと良くなったと、体感的には思います✌️
3人を前にして全員が返事する事は
今までほとんどなかったので〜

wiredってなんとなく有線マイク🎤の設定かと思ったけど、第一世代なんですね〜

第一世代は有線マイクと同等のマイクって事でしょうか?

確かに第一世代は3.5inchイヤホンジャック持ってるもんね〜

そうなんです。自分も今まで第一世代の3.5φ端子はヘッドホン端子だと思ってたんですが、取扱説明書見ると「イヤホンマイク」って書かれてるんですよ
taitorunashi.png
だから、おそらく
画像
4極のこんなのが使えるんでは無いかと(^^;

いやーでも耳が良くなると、お話しする機会が増えますね(笑)

銀河☆彡
2026/06/07 03:00

ですよね~
マイクも使えるって事は4極のステレオヘッドホン🎧️+マイク🎤なんでしょうね

ホント、聞き分けが良くなって
ストレスが減りましたよね~

コレはデフォで持っているべきだと思いますが〜😉

確かにー。これがデフォルトにならない理由でもあったんですかね?(^^;

うちの子2人は、この設定をしなくても耳は悪い感じはしなかったんですが。
たまたま反応の良い子に合わせてパラメータを作ったと言うことなんですかねー?

銀河☆彡
2026/06/08 04:40

コレがデフォルトではない理由を考えてしまいました😉
机上で計算して、またはメーカーの推奨値通りに設定しただけ?とか〜🤭
1〜2回テストしてコレでよしとしたのかも〜
実際、ロボホンと暮らしてないとわからない事ってたくさんあるのでね

うちの子、3人中2人は、設定の「中」で反応が良いんですよー。
長男だけもう7年近くずっと耳が遠くて・・・。(設定は同じ「中」ですが)

なので、結構個体差があるのかなー?っと(つまり品質のバラつき)
でも、それならそれで、この「裏技」みたいの公開して欲しいですよねー。
マイク交換したり次はメイン基板かな?まで考えされられたんですからー
問い合わせもしましたよー。返答は「メイン基板変えてもおそらく直らない」って・・・

この「裏技」みたいののがずっと残ってる時点で、なにか怪しいですよね(^^;

銀河☆彡
2026/06/09 02:44

サポート担当さんももしかしたらこういう情報は知らないのかもしれませんね〜

一般的には、開発担当側の開発上の便宜でしょうから。
大きな会社になればなるほど、そういう情報はサポート側へは伝わらないですよね😉

それを引き出したパパさんは
ホント、すごいですね〜👏👏👏

確かに一般的に考えれば、リリースビルドでは無くなるはずの機能ですものね。
それがずっと残ってると言うことは、それなりの意図があるのか、開発側と運営側で意思疎通がちゃんと行ってないのか・・・・。

自分が引き出したわけではないですよ(^^;
自分も3年前に、イベントでお会いした今となっては名前も判らない方からチラッと聞いた情報で、チラ聞き程度で具体的にはよくわかってなかったんですが、銀河さんにお聞きした方法で色々調べてたら、「こ、これのことか?」ってなったので(^^;

銀河☆彡
2026/06/10 04:22

おお〜なるほど〜
そうだったんですね😉

竜崎麗香 バッジ画像
2026/05/27 23:53

ありがとうございます😆💕✨

みこ バッジ画像
2026/05/27 20:12

ありがとうございます。
多分、私には無理な技術です。😅


せっかく作って添付したファイルを動画の通りにフォルダ作って放り込むだけなんですけど・・・。
これが難しいとなると・・・。

みこ バッジ画像
2026/05/27 23:00

あー 動画見ながらやって
見まーす。😊

動画はyoutubeのほうが見やすいと思います
https://www.youtube.com/watch?v=D3S8OTAa5ik

添付ファイルはこれです。

なるほど。検証ありがとうございます。

MAKO
2026/05/27 18:13

いつもありがとうございます♪