音声入力でプログラミングする – ボイスコーディング

音声入力でプログラミングがしたいわけではないけど、検索したらおもしろかったので情報をまとめることにした。もっというとデータベース作成を自動化したいわけではなくて、本当のところはデータベースへのデータ登録を音声入力でおこないたかった。今のご時世できないわけがないとは思うけど、出落ちしてしまった。

そもそもマイクもってないし!

入力 手以外

目で入力すると謡うもの。↓の動画じゃなくて、ほんとに目だけでキーボード入力してる廃人みたいな人の動画があってそれが衝撃的だったが、もうどうやってその動画にたどりついたか忘れてしまった。

2013年のpythonカンファレンスでの実演らしい。↓

Windows Vistaの音声認識でPerl書こうとする動画.

Talonアイトラッキング

Talon Python Demo

Windowsの音声認識でスクラッチのプログラミングをする(子供向け?)の動画

htmlタグの入力をMacの音声入力をつかって試みる動画

興味深い文面リスト

  • ボイスコーディングを実現するためには、「音声認識エンジン」と「音声でコーディングするためのプラットフォーム」の両方が必要です
  • 海外には肩と背筋を痛めてしまいタイピングができなくなったため、音声入力でプログラミングをする人がいます。
  • 音声認識パーツとして使うラズパイゼロ、声でプログラミングするIchigoJam コンパクト版
  • 「音声認識」そのものは素人には敷居が高いテーマですが,肝心の「認識」の部分については マイクロソフトから音声認識用のSDKが無償で提供されていますので, 「音声認識をしてなにかするソフト」を作ること自体はそう難しいことではありません.
  • 2018年7月現在でリアルタイム認識ができるのはGoogleとMicrosoftのみです。
    Amazonに至っては日本語対応してません

音声入力プラットフォーム

  • VoiceCode: mac向け dragonを別途購入する必要がある
  • Talon: mac向け アイトラッキングもできるっぽい
  • Caster
  • Aenea

AI系?のサービス

  • Wit.ai: コンピュータに話しかけたり、文章を送る事で何らかのアクションを起こすAIが作れるらしい。
  • Dialogflow: Wit.aiと同様のサービスらしけど「ドメイン」という概念でつくっていくらしい
  • Jasper: ラズパイを使って音声認識できるAIが作れるPython製のオープンソースプラットフォームとのこと

音声認識サービス

雑感

音声(はっした言葉)をデータベースに登録するには、実際は2ステップになると思う。

  1. 音声を認識させテキストにする
  2. テキストをデータベースに登録する

書いてみると簡単そうだがそのためになにが必要かいまいちよくわからないというか、なにも思いつかない。ひらめかない。音声系の話は奥がめちゃくちゃ深い感じでなんだか怖い。あと人口知能と言われてもよくわからんのでそれを謳い文句にするのはやめていただきたい・・・ 。

うーん・・・。もう少し情報をさがせばできそうなところ。気長にやっていく方針で。というかインタラクティブシェルで本当にコンピューターとインタラクティブに対話するような感じが理想なのだが。


Warning: Undefined array key "thumbnail_url" in /home/users/1/boy.jp-rolpop/web/skc/wp-content/themes/godios/inc/schema-org.php on line 49

Warning: Undefined array key "thumbnail_url" in /home/users/1/boy.jp-rolpop/web/skc/wp-content/themes/godios/inc/schema-org.php on line 78