音声認識モジュール:作業手順とアプリケーション

問題を排除するために楽器を試してください





技術の進歩により、キーボードやマウスなどの入力システムを使用せずに、人間の音声コマンドを使用してコンピューター、機械、またはロボットを操作できるようにするインテリジェントなマンマシンインターフェース技術が開発されました。このヒューマンマシンインターフェース(HMI)は、 音声認識 モジュール。この記事では、音声認識モジュールとその作業手順およびアプリケーションについて説明します。

音声モジュール

音声モジュール



音声認識モジュール

音声認識は、自然で便利な技術です ヒューマンマシンインターフェース 音声認識モジュールを使用します。マイクを介してマシンまたはコンピューターに配信された人間の音声機能を抽出して分析します。音声認識技術は、ユーザーの範囲、認識に使用される単語の数、話すことの自然さなど、さまざまな基準に基づいて多くのタイプに分類されます。音声認識レベルが95%を超える場合は、音声認識のみが実際に使用されます。


音声認識モジュールの動作原理

HM2007はシングルチップです CMOS 音声認識モジュール。これは、音声分析、音声認識、および音声認識システム制御プロセスを備えたオンチップのアナログフロントエンド大規模集積回路です。 HM2007は、手動モードとCPU制御モードの2つのモードで操作できます。



HM2007

HM2007ピンダイアグラム

手動操作モードでは、音声認識モジュールHM2007を使用して、キーパッド、8KバイトメモリのSRAM、その他のコンポーネントを接続することにより、簡単な認識システムを構築します。電源がオンの場合、HM2007は初期化プロセスを開始し、WAITピンがLの場合、HM2007は外部メモリ(8KバイトSRAM)をチェックします–完全かどうか。ただし、WAITがHの場合、HM2007はメモリチェックプロセスをスキップします。この初期化プロセスの後、HM2007は認識モードに移行します。認識モードでは、WAITピンがHの場合、HM2007は音声を受け入れる準備ができており、認識プロセスを開始します。 WAITピンがLの場合、HM2007は認識される音声を受け入れません。次に、トレーニングされたパターンをクリアして新しいパターンをトレーニングするのは、ファンクションキーを使用して実行される2つの操作、TRNとCLRです。 HM2007のすべてのパターンは、数字キー99を入力してCLRを押すことでクリアできます。

CPU制御動作モードでは、音声認識モジュールHM2007のRECOG、TRAIN、RESULT、UPLOAD、DOWNLOAD、RESET機能などのいくつかの機能がこのモードで提供されます。手動操作モードと同様に、このモードでも電源オン、認識、トレーニング、結果、アップロード、ダウンロード、およびリセット操作がさまざまな基準に基づいて実行されます。

音声認識モジュールのアプリケーション

音声制御ロボット車両

音声制御ロボット車両プロジェクトキット

音声制御ロボット車両プロジェクトキット

遠距離恋愛認識システムを備えた音声制御ロボット車両は、ロボット車両の遠隔操作のためのヒューマンマシンインターフェースと音声コマンドを使用して制御されるように設計されています。アン 8051マイクロコントローラー は、音声認識モジュールまたは音声認識モジュールとともに使用され、目的の操作を実現します。ロボット車両の動きの方向は、音声コマンドまたはプッシュボタンを使用して制御できます。音声コマンドは、RFによって送信側から受信側に送信されます。したがって、ロボット車両は、受信機が受信したコマンドに基づいて、前方、後方、左、または右の方向に移動します。


音声制御ロボット車両の送信機ブロック図

音声制御ロボット車両の送信機ブロック図

この動きは ロボット車両 特定の方向は、8051シリーズマイクロコントローラーと接続された2つのモーターを使用して制御できます。 RF送信機 ロボット車両からの許容範囲(最大200メートル)の利益のためにエンコードされたデジタルデータに変換されるスイッチを押すか音声コマンドによってコマンドを変換します。受信回路で受信した符号化データは、音声コマンドの復号化データを用いてモータの方向や動きを制御するモータドライバICを用いてDCモータを駆動するために別のマイクロコントローラに送られるように復号されます。

音声制御ロボット車両の受信機ブロック図

音声制御ロボット車両の受信機ブロック図

遠距離音声認識プロジェクトを備えたこの音声制御ロボット車両は、 DTMFテクノロジー これにより、携帯電話を使用したロボット車両の制御が容易になります。このDTMFテクノロジーは、RFテクノロジーと比較して非常に長距離の通信を提供します。したがって、ロボット車両は非常に長い距離からリモートで制御できます。

音声録音および再生回路

4月9301IC

4月9301IC

4月9301IC

APR 9301 ICは、28ピンと不揮発性フラッシュメモリで構成されています。 10万サイクルの記録と約100年間のメモリ保存が容易になります。 APR 9301集積回路の通常の動作動作には、低電圧5Vと25mAの電流のみが必要です。

音声録音および再生回路の動作

APR 9301ICは 音声録音と再生 操作。集積回路の17ピンと18ピンに接続された高品質の(あらゆる種類の)コンデンサーマイクを使用して音声信号を受信することにより、録音操作を実行できます。スイッチS1を閉じると、録音モードを開始して、音声メッセージを20〜30秒間簡単に録音できます。 APR 9301 ICのピン25に接続された記録LEDの表示として、Lピン27が接地されている限り点滅します。

音声録音および再生回路

音声録音および再生回路

最後のメモリで20サイクルが完了すると、APR 9301 ICのピン6と7に接続されている抵抗R1の値を変更することにより、記録プロセスが自動的に終了します。抵抗R1の値をそれぞれ52K、67K、89Kに変更することで、最大記録時間20秒、24秒、30秒を得ることができます。

再生モード中は、入力セクションが自動的にミュートされます。スイッチS2が閉じている場合、メッセージは録音されたメッセージの最初からスピーカーから送信されます。録音または再生機能が完了すると、APR 9301ICはスタンバイモードになります。

この回路は共通のPCBに蓄積することができます。集積回路のピン間で短絡が発生しないように、APR 9301ICベースを慎重にはんだ付けしてください。 PCBに組み立ててから回路を確認し、ICをICベースに接続します。回路に電源を供給する前に、ピンの接続を注意深く確認してください。 5ボルトレギュレータICベースの電源は、回路に電源を供給するために使用されます。クリアなサウンドを得るために、2インチから8オームの高品質スピーカーが使用されています。スイッチS1を押すと録音できます。音声信号(音声または音楽)はマイクによって拾われ、ICに渡され、そこで音声信号がメモリセルに保存されます。スイッチS2を閉じると、再生が始まり、録音したメッセージがスピーカーから聞こえます。

音声認識モジュールは、パイロットの音声コマンドを使用して航空機システムを制御するため、音声起動マルチプロセッサを使用して電動ホイールカーを制御するためなど、多くのアプリケーションで使用できます。あなたがについて知りたい場合 電気および電子プロジェクト 音声認識モジュールに基づいて、下のコメントセクションにコメントを投稿することで私たちにアプローチすることができます。

写真クレジット: