FC2ブログ

スマフォのアプリを作りたい(17):音声認識させたい⑤

   プログラミング [2020/03/10]
えーと。
React Native環境で、クロスプラットフォームなアプリを作ろうとしています。
最初、チャットアプリの基本をやってみて、
前回までに、音声認識(音声→テキスト変換)を試作してみました。

作ったアプリはGoogle Cloudを利用するものです。
ただし、音声認識させてはみるものの、
(1)変換がスムーズに続かない。
(2)認識精度がいまいち。

これは、入力している音声データに問題があるのかも。

今回は、テスト環境/音の入力についてのさるの迷走ぶりを書きます。


◆動作確認環境/ヘッドセット(マイク)について
さるの開発(試験)環境は、Windows10タブレットPCで、Androidエミュレータ上でアプリを起動して動作を確認しています。

未だに、実際のスマフォでテストしたことはありません。
それはなぜか

・Androidスマフォ(SIMフリー)の中古版をアプリ開発前に勇んで買いました。
新品 未使用 ARROWS Me F-11D Precious Black docomo スマホ 白ロム 本体 送料無料【当社6ヶ月保証】【中古】
価格:5,980円・・・ただし、ポイント使ったので実際は2000円くらい。

が、このスマフォのAndroidのバージョンが4.0なのに対して、当初想定の開発環境(VisualStudio)が未サポートだった。
React Native(Android Studio)に開発環境を切り替えたが、Androidエミュレータのminimumバージョンが6.0だった。
ってことは、エミュレータで動作確認しても実機で動く可能性が低い。

一方、音声入力についてはもっと迷走した。
・内蔵のマイクは、ハズイ。
電車の中とか外で電話しちゃっている人とか、声が大きくなって、周りに丸聴こえのことが多いですよね。
何か、文章を入力するとか、メッセージをテキストにして伝えたい場合、スマフォ/PCに向かって大き目の声で一人ぶつぶつ言うのはちょっとねぇ。

・ヘッドセット(USB1.0)を既に持っていたのですが・・・
WindowsタプレットPCにUSB-TypeAの口が一個しかなく、その口を増設HDD(SSD)に使っちゃってるので塞がってます。
HUBを使えばいいんですけどね・・・。いずれ、外で手軽に使える感じではないですね。

・ともかく、線で繋がなくてもよくて小さいものを買いました。
無線カケトーク ブラック Bluetooth ヘッドセット 通話 片耳 高音質 耳掛け型 ワイヤレス マイク内蔵 スポーツ KAKETALK-BK
価格:1,080円

が、タブレットにBluetooth接続してみたら、ぶつぶつ話す声はほとんど入りませんでした。サウンドコントロールパネルでレベルメーターみたいなのがあるのですが、ほとんど拾ってないのが分かります。
20200310_1.jpg

買い物に失敗しましたが、まだ諦めが付きません。


・やっぱり、マイクをもうちょっと口元に近づけなきゃダメ?
通話も音楽もコレ1つでOK! ワイヤレスイヤホン マイク 片耳 Baseus A01【Bluetooth 車 車載 リモコン ハンズフリー ヘッドセット インナーイヤー型 音楽 高音質 2台同時接続 iPhone iPad アンドロイド 携帯電話 ブルートゥース 人気 おしゃれ 送料無料】
価格:2,480円

20200310_2.jpg

前の「ヘ音記号」型のよりはよかったけど、これも声を張り上げないとダメ。もっと、ぶつぶつ言っているのを拾ってくれないかな。じゃないと人前では使いにくい。


・まずは、現状の見栄えよりも、認識精度優先です。
遂に、こんなのを注文してしまいました。
【パイナップル】喉の振動を拾う特殊マイク 咽喉マイク PTT付 チューブ式イヤホンマイク 無線機用 2.5mmミニプラグ
価格:1,049円


こういう買い物は、某大手通販サイトで検索して買っていました。でも、仕様もメーカー名すらはっきり書いてないものが多いです。
当然、有線での接続製品なので、コネクタ部分の形状/仕様は、購入前に十分注意してました。
タイトルが「無線用2.5mmミニプラグ」って書いてます。「無線用?」とは思いましたが、載っていた写真は、4極あるプラグでした。

ちょっと、オーディオ系のプラグについて、ぐぐってみたところ、4極ある(TRRS:CTIAが主流)のが、ステレオ音声出力&マイク入力につかえる代物ってことだと理解。
ただし、イヤホンは1個しかついてないので、モノラルであることは想像付きます。「きっと、R/L音のどっちかを拾わないだけ」といいように解釈しました。

持ってた「ARROWS Me」には、φ3.5mmのミニピンの穴がありました。使っているタブレットにもφ3.5mmの穴がありました。
-ARROWS Me取説:「ステレオイヤホン接続時」→端末のマイクを使用する設定
-タブレット(ASUS TransBook T102HA)取説:「3極3.5mmミニプラグのマイクをサポートしていません。」
いずれも、底意地が悪いのか、あるいはバカなのか、「4極3.5mm(CTIA)ミニプラグ用」とハッキリ書いてない
けど、意図するところは4極のプラグなんでしょう。

ただし、φ2.5mmプラグなので、太くするために以下のものも同時に発注。
ステレオミニプラグ変換アダプタ 金メッキ端子 4極 ステレオミニ(φ3.5mm 凸オス) ステレオ超ミニ(φ2.5mm 凹メス) オーディオ 変換 接続 プラグ
価格:400円


マイク本体はこんなのが届きました。
20200310_3.jpg
でもよく見ると、
20200310_4.jpg
あれ?・・・3極じゃねーかよ!
ダマされたー。(T^T)


ちなみに、そのショップの製品説明欄にこんなことが書いてありました。
「・商品の仕様は予告なく変更となる場合がございます。・端子形状をご確認の上、ご購入ください。」
『ちゃんと確認したよ。でも違うの来ちゃったよ。「予告なく変更した」の? そりゃないよなぁ。』

クレーム/返品するのも面倒だったので、なんとかしてやろうと以下のようなものを追加購入しました。
kwmobile 2x 2.5mm ジャックプラグ アダプター - 端子 4極 オーディオ ケーブル ターミナルブロック セット - 2.5 ピッチコネクタ 4 ネジ端子
価格:910円
kwmobile 2x 3.5mm ジャックプラグ アダプター - ステレオミニジャック 3ピン オーディオ ケーブル 中継 ブロック コネクター セット - 3pin ジャック端子
価格:850円

それぞれ、送料も掛かって、本体より高くついた。

調べてみたら、
-音の出力はチップ極(先端)とスリープ極(根本:GND)を使っています。それは予想内。
-音の入力は、PTT(Push to talk)ボタンを押したときに、チップ極とリング極(真ん中)を使ってた。予想外。
トランシーバー的には普通なんですか?
リングとスリープでよくない?
いずれ、GND以外がダブッて使われているので、簡単に入出力の両立はできません。
音を聞く方は諦めて、こんな感じで作ってみました。
20200310_5.jpg
20200310_6.jpg

で、実際に使ってみたら、・・・・

んーまあこれまでよりは、ぶつぶつしゃべっても拾うけど期待したほどではありません。
結局、普通に相手に向かって話すくらいの音量は必要そうです。
一刻堂さん的に話せる人なら、いい認識率が得られるかも。


結局、さる的に頑張った割には、成果が低い。

残念!

教訓)通販の写真/説明は信用できないものと心得よう。ショップの評判にも注意しよう。

次回は、音声の録音について調べたいと思っています。

では、この辺で。ごきげんよう。
(m__)m
スポンサーサイト





コメントの投稿

非公開コメント

カレンダー
01 | 2024/02 | 03
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 - -
プロフィール

さるもすなる

Author:さるもすなる
さるです。別HPサイト「さるもすなる」から侵食してきました。 山菜/きのこ、それとタイトルにしたPPバンド籠のことをメインに徒然に・・・・暇を持て余したさるの手仕事:男手芸のブログってことで。

最新記事
最新コメント
月別アーカイブ
カテゴリ
天気予報

-天気予報コム- -FC2-
本家のHPのトップ
山菜や茸の話です
PPバンドの籠作品と作り方です
投稿をお待ちしております



PVアクセスランキング にほんブログ村 にほんブログ村 ハンドメイドブログへ



マニュアルのお申し込み



検索フォーム
リンク
RSSリンクの表示
ブロとも申請フォーム

この人とブロともになる

QRコード
QR