音声入力でプログラミングがしたいわけではないけど、検索したらおもしろかったので情報をまとめることにした。もっというとデータベース作成を自動化したいわけではなくて、本当のところはデータベースへのデータ登録を音声入力でおこないたかった。今のご時世できないわけがないとは思うけど、出落ちしてしまった。
そもそもマイクもってないし!
入力 手以外
目で入力すると謡うもの。↓の動画じゃなくて、ほんとに目だけでキーボード入力してる廃人みたいな人の動画があってそれが衝撃的だったが、もうどうやってその動画にたどりついたか忘れてしまった。
2013年のpythonカンファレンスでの実演らしい。↓
Windows Vistaの音声認識でPerl書こうとする動画.
Talonアイトラッキング
Talon Python Demo
Windowsの音声認識でスクラッチのプログラミングをする(子供向け?)の動画
htmlタグの入力をMacの音声入力をつかって試みる動画
興味深い文面リスト
- ボイスコーディングを実現するためには、「音声認識エンジン」と「音声でコーディングするためのプラットフォーム」の両方が必要です
- 海外には肩と背筋を痛めてしまいタイピングができなくなったため、音声入力でプログラミングをする人がいます。
- 音声認識パーツとして使うラズパイゼロ、声でプログラミングするIchigoJam コンパクト版
- 「音声認識」そのものは素人には敷居が高いテーマですが,肝心の「認識」の部分については マイクロソフトから音声認識用のSDKが無償で提供されていますので, 「音声認識をしてなにかするソフト」を作ること自体はそう難しいことではありません.
- 2018年7月現在でリアルタイム認識ができるのはGoogleとMicrosoftのみです。
Amazonに至っては日本語対応してません
音声入力プラットフォーム
AI系?のサービス
- Wit.ai: コンピュータに話しかけたり、文章を送る事で何らかのアクションを起こすAIが作れるらしい。
- Dialogflow: Wit.aiと同様のサービスらしけど「ドメイン」という概念でつくっていくらしい
- Jasper: ラズパイを使って音声認識できるAIが作れるPython製のオープンソースプラットフォームとのこと
音声認識サービス
- Google Cloud Speech-to-Text API
- IBM Watson Speech to Text – Japan
- Bing Speech API: 現在はAPI提供終了
- 音声認識ソフト AmiVoice SP2: 現在は販売終了
- 音声認識エンジンVoiceRex ⇀ NTTが開発
- Hmcomm株式会社 – VBox: 日本のベンチャー企業らしい
- Dragon – 世界で最も売れている音声認識ソフトウェア | Nuance
- AI音声解析サービス | 音声データをテキスト化 | OPTiM Cloud IoT OS
雑感
音声(はっした言葉)をデータベースに登録するには、実際は2ステップになると思う。
- 音声を認識させテキストにする
- テキストをデータベースに登録する
書いてみると簡単そうだがそのためになにが必要かいまいちよくわからないというか、なにも思いつかない。ひらめかない。音声系の話は奥がめちゃくちゃ深い感じでなんだか怖い。あと人口知能と言われてもよくわからんのでそれを謳い文句にするのはやめていただきたい・・・ 。
うーん・・・。もう少し情報をさがせばできそうなところ。気長にやっていく方針で。というかインタラクティブシェルで本当にコンピューターとインタラクティブに対話するような感じが理想なのだが。
コメント