iOS SDK用音声認識機能ライブラリVocalKitの使い方
2010年12月4日に行われたyidev(横浜iPhone開発者勉強会)第七回で話した際の資料です。
iPhone SDKで利用できる音声認識ライブラリ(Pocket Sphinxのラッパー)VocalKitについて紹介しています。
(内容)
- 『勇気をください』
- 「勇気をください」と言うと、勇気の出るエピソードが表示される
- VocalKitとは?
- オープンソースの音声認識エンジン、Pocket Sphinxのラッパー
- https://github.com/KingOfBrian/VocalKit
- 使い方
- 録音を開始する
[vk startListening];
-
- 認識を開始する
[vk postNotificationOfRecognizedText];
-
- 認識結果を受け取る
- (NSNotificationが飛んでくる)
- 認識結果を受け取る
- 単語辞書
- 単語名 音素1 音素2 音素3...
- 同じ単語を複数の発音で定義したい場合は(2)とか(3)とかつける
- 単語名は何でもいいわけじゃないらしい
me M IY
encourage EH N K ER IH JH
encourage(2) IH N K ER AH JH
- 認識結果
- NSNotificationのUserInfoプロパティ
NSDictionary *dict = [notification userInfo]; NSString *phrase = [dict objectForKey:VKRecognizedPhraseNotificationTextKey]; NSNumber *score = [dict objectForKey:VKRecognizedPhraseNotificationScoreKey];
- 辞書作成のコツ
- 単語数が多いと、処理も重いし認識率も悪い
- まず標準の辞書で、認識結果をためしてみる(sayコマンド便利)
- 出てきた単語だけで辞書を再構成する
※『勇気をください』は、音声認識を使った、勇気をくれるアプリです。
(AppBank)
http://www.appbank.net/2010/11/06/iphone-application/182987.php
(AppStore)
http://itunes.apple.com/jp/app/id395958856?mt=8