その後のその後

iOSエンジニア 堤 修一のブログ github.com/shu223

iOS SDK用音声認識機能ライブラリVocalKitの使い方


2010年12月4日に行われたyidev(横浜iPhone開発者勉強会)第七回で話した際の資料です。



iPhone SDKで利用できる音声認識ライブラリ(Pocket Sphinxのラッパー)VocalKitについて紹介しています。


(内容)

[vk startListening];
    • 認識を開始する
[vk postNotificationOfRecognizedText];
    • 認識結果を受け取る
      • (NSNotificationが飛んでくる)
  • 単語辞書
    • 単語名 音素1 音素2 音素3...
    • 同じ単語を複数の発音で定義したい場合は(2)とか(3)とかつける
    • 単語名は何でもいいわけじゃないらしい

me M IY
encourage EH N K ER IH JH
encourage(2) IH N K ER AH JH

  • 認識結果
    • NSNotificationのUserInfoプロパティ
NSDictionary *dict = [notification userInfo];	
NSString *phrase = [dict objectForKey:VKRecognizedPhraseNotificationTextKey];
NSNumber *score  = [dict objectForKey:VKRecognizedPhraseNotificationScoreKey];	
  • 辞書作成のコツ
    • 単語数が多いと、処理も重いし認識率も悪い
    1. まず標準の辞書で、認識結果をためしてみる(sayコマンド便利)
    2. 出てきた単語だけで辞書を再構成する


※『勇気をください』は、音声認識を使った、勇気をくれるアプリです。


(AppBank)
http://www.appbank.net/2010/11/06/iphone-application/182987.php


(AppStore)
http://itunes.apple.com/jp/app/id395958856?mt=8