編集履歴一覧に戻る
mongonta555のアイコン画像

mongonta555 が 2021年02月12日22時10分52秒 に編集

コメント無し

記事種類の変更

+

製作品

本文の変更

# このシステムを作った経緯 2018に発売されたGoogleAIYVoiceKitV2。当時はスマートスピーカーを自分で作れると評判でした。しかし、実際に買って使ってみるとベースのラズパイがZeroWHであるため**ウェイクワードの「OK,Google」から起動できない**というスマートスピーカーとは言えない制限がありました。そのため、snowboyというクラウドのホットワード認識システムを利用していた時期もありましたが、精度も悪く使い道を見いだせず埃をかぶっていました。 しかし、時代は進歩して2019にK210というAI向けのRISC-Vチップを搭載したM5StickVが発売され、2020/10に開発プラットフォームのMaixPyに音声認識機能が実装されました。調べてテストしたところ認識の感じも今まで試した方法より良い感じがしました。それで眠っていたGoogleAIYVoiceKitV2にウェイクワードで起動する機能を追加できると思い、3年越しの夢(?)を実現してみました。

+

# 注意(OSのアップグレードはしないでください。) 2021/2にRaspberryPi OSのカーネルが5.4から5.10にアップグレードされるようになりました。VoiceBonnetのドライバがカーネル5.10に対応していないようで音が出なくなります。初期セットアップの下記の画面の時にアップグレードしないように注意してください。(sudo apt upgradeもダメです。) ![キャプションを入力できます](https://camo.elchika.com/ecd9ca166e0f3acaf73b466aa510fe3f9ba1af46/687474703a2f2f73746f726167652e676f6f676c65617069732e636f6d2f656c6368696b612f76312f757365722f65306232306531362d383836332d343335632d613232382d3364306131613637633131662f37383935663364352d613134652d343739632d616135352d326331386637666363663365/)

# 用意するもの ## ハードウェア - GoogleAIYVoiceKitV2 スマートスピーカーの中核です。RaspberryPiZeroWHとmicroSDも含まれています。 - M5StickV(マイク搭載版) 「OK,Google」などのウェイクワードを認識するために使用します。マイクを使うため古いM5StickVでは動かないので注意してください。 - M5Stack ExtIO Unit M5StickVは外部のGPIOがGrove互換ポート(HY-2.0-4P)しかないためGPIOを拡張する目的で使います。 - microSDカード M5StickVのFlashを使えば不要ですが、手順が難しいのでmicroSDカードで説明します。★ M5StickVはmicroSDに相性問題があるので初心者の方はM5StickVとmicroSDカードのセットがおススメです。 - 電源 電源はVoiceKitV2用(microUSB端子5V2A)とM5StickV用(USB Type-C端子5V1A)の2つ必要です。 - USBキーボードとマウス、miniHDMI-HDMIケーブル、microUSBのOTGケーブル ★ SSH経由でヘッドレスセットアップできる方は不要です。[ヘッドレスセットアップで固定IPを設定する。](https://raspberrypi.mongonta.com/f322-howto-setting-static-ipaddress-when-headless-setup/) - PC ファームウェアの書き込みやSSHを使うのにPCが必要です。 ## ソフトウェア 1. [AIY Kits Release 2020-11-20](https://github.com/google/aiyprojects-raspbian/releases) 恐らく付属のmicroSDに書き込まれているOSは古いので、最新版のaiyprojects-2020-11-20.img.xzをダウンロードします。 1. [Raspberry Pi Imager](https://www.raspberrypi.org/software/) 1でダウンロードしたxzファイルをmicroSDカードに書き込むために利用します。 1. [kflash_gui](https://github.com/sipeed/kflash_gui/releases) M5StickVのファームウェアを書き込むために利用します。 1. ソースとM5StickVのファームウェア一式 ソースとファームウェアは[GitHub](https://github.com/mongonta0716/AiyvoiceV2-with-M5StickV)で公開しています。 # 機器の準備(接続した後でも可能) ## GoogleAIYVoiceKitV2 ### GoogleAIYVoiceKitV2の組み立て 下記のHPが分かりやすいです。 - [Google公式(英語)](https://aiyprojects.withgoogle.com/voice/) - [GoogleAIYVoiceKitV2を組み立てる。(日本語)| ラズパイ好きの日記](https://raspberrypi.mongonta.com/howtomakegoogleaiyvoicekitv2/) ### GoogleAIY OSのセットアップとGoogleCloudPlatformへの登録 下記のHPに解説がありますので、OSのセットアップとGoogleCloudPlatformへの登録作業を行います。クレジットカードが必要ですが、GoogleAssistantAPIだけ使う場合には課金されません。 - [Google公式(英語)](https://aiyprojects.withgoogle.com/voice/#google-assistant) - [自分だけの Google Home を作ってみた〜Voice Kit で Google Assistant APIを使って(日本語)](https://www.apps-gcp.com/mygooglehome-voicekit-googleassistant/) ボタンを押してGoogleアシスタントが起動するまで完了してください。 ### M5StickVと連携するためのソースを置く GitHubに公開している「assistant_demo_with_m5stick_extio.py」をダウンロードしてコピーします。sshや端末から下記のようにコマンドを実行してください。 ``` cd ~ git clone https://github.com/mongonta0716/AiyvoiceV2-with-M5StickV.git cp ./aiyvoicev2-with-m5stickv/aiy/assistant_demo_with_m5stickv_extio.py ./AIY-projects-python/src/examples/voice/ ``` ## M5StickV ### 1.ファームウェアの書き込み(kflash_guiを利用) GitHubからファームウェアをダウンロードしてbinファイルを書き込みます。 ![キャプションを入力できます](https://camo.elchika.com/9b3bcfc683e63c95bb5afa306e18e082a79ed29b/687474703a2f2f73746f726167652e676f6f676c65617069732e636f6d2f656c6368696b612f76312f757365722f65306232306531362d383836332d343335632d613232382d3364306131613637633131662f39616539356438652d363762302d343137322d386139612d636632383930303662646239/) ### 2. microSDカードにソースを入れる。 boot.pyとpca9554.pyの2つのソースをmicroSDカードのルートにコピーします。 ### 3.Ext.IOと接続 GroveケーブルでExt.IOを接続します。 ### 4.音声データの録音と認識 1秒以上の言葉を3つ用意します。(なんでも構いません。動画では「コマンド1」「コマンド2」「コマンド3」の三種類です。)ここで登録した言葉を認識するとそれぞれ1,2,3という数字でGoogleAIYVoiceKitV2に送られる仕組みです。 **注意、録音は静かな部屋で行ってください。ボタンを押した音にも反応するので静かに押しましょう。** @[youtube](https://youtu.be/FL-W5lDUaqs) # 機器の接続 ## M5StickVとExtIO UnitはGroveケーブルを使用 | M5StickV | ExtIO Grove | |:---:|:---:| | GND | GND | | 5V | 5V | | 35 | SDA | | 34 | SCL | ## ExtIO UnitとVoiceKitV2はジャンパーワイヤー(メスーメス)を使用 | ExtIO GPIO | VoiceBonnnet GPIO(向かって左から) | |:---:|:---:| | GND | GND | | 3 | PIN_D | | 2 | PIN_C | | 1 | PIN_B | | 0 | PIN_A | | 接続なし | 5V | ![VoiceKit](https://camo.elchika.com/36e1a725366c1739affb4b8ce113b6a7c20ddcae/687474703a2f2f73746f726167652e676f6f676c65617069732e636f6d2f656c6368696b612f76312f757365722f65306232306531362d383836332d343335632d613232382d3364306131613637633131662f32373663373533662d353733392d346665622d623233342d663961613831656165396666/) ## 接続するとこのようになります。 ![キャプションを入力できます](https://camo.elchika.com/2f556cc78bb2880983cebe84d2eb22b3c2743d5e/687474703a2f2f73746f726167652e676f6f676c65617069732e636f6d2f656c6368696b612f76312f757365722f65306232306531362d383836332d343335632d613232382d3364306131613637633131662f61396534666236662d376564382d343862362d393939392d343561333031663164316437/) # 動かしてみる GoogleAIYVoicekitV2上でにsshか端末から下記のコマンドを実行します。 ``` AIY-projects-shell.sh src/examples/voice/assistant_demo_with_m5stickv_extio.py ``` assistant_demo_with_m5stickv_extio.pyのデフォルトでは下記のようになっています。 1. Googleアシスタントの起動 2. ボタンLEDを赤くする 3. ボタンLEDを青くする @[youtube](https://youtu.be/g6TkWlylR1Y) # カスタマイズ ## 誤動作の対策 誤動作はスマートスピーカーと比べると多いです。その点は言葉やboot.pyのパラメータを変えて調整してみてください。 ## 登録できる言葉は最大15個 boot.pyのwords配列を増やすと認識できる言葉の数を増やせます。ただし、VoiceBonnet側のGPIOが4本しかないので、1~15までしか受信できません。 ### もっと多くの連携をしたい場合 VoiceBonnetにピンヘッダを半田付けしてGPIOを取り出せば使えます。詳しくは下記のリンクを見てください。 [【GoogleAIYVoiceKitV2】GPIOを取り出す。【上級者向け】| ラズパイ好きの日記](https://raspberrypi.mongonta.com/f389-howto-connect-gpio-to-the-outside/) ## AIYVoiceKitの方はラズパイができる範囲で何でも可能 assistant_demo_with_m5stickv_extio.pyを改変すればラズパイでできる範囲で何でも実行できます。(subprocessを使えば「sudo reboot」や「sudo shutdown -h now」も実行可能です。) 下記で制限されている機能もローカルフォルダにある音楽を再生というのは可能だと思います。 ### GoogleAIYVoiceKitの制限 GoogleAIYVoiceKitではデバイスの制限で音楽やラジオを聴いたり、タイマー・アラーム・リマインダー機能も使えません。 | 機能 | AIYVoiceKit | GoogleHome | |:---:|:---:|:---:| | 「OK,Google」で起動 |×| 〇| |音楽配信サービス|×|〇| |ニュースの読み上げ|×|〇| |スマートホーム連携|〇|〇| |タイマー・アラーム|×|〇| |天気予報|〇|〇| |検索機能|〇|〇| |ショッピングリスト|〇|〇| |音量の調整|〇|〇| # おわりに 技術や製品の進歩により、3年前は諦めていたことが実現できてうれしくなってしまいました。GoogleAIYVoiceKitV2が眠っている方は是非挑戦してみてください。