切り出しのところのプログラムを書きました。音量で判定して切り出してるんだけど、どうも調子が悪い。外野の雑音がよくないのかも。もちっと研究の余地あり。
だんだん形になってきてるけど、使いにくい。使いやすくするためのツールが使いにくくちゃしょうがない。使い勝手の検討をしなければ。。。

サンプルプログラムとにらめっこしながら、プログラムをちまちま書く。録音はできるようになった。かーんたん!。いやぁ、DirectSoundよーできてるわ。これから、都合のいいところだけを切り出すプログラムを作成しなければ。。。どっちかというとこっちの方が面倒だな。いまだにデザインの方針が決まらない。うだうだしてます。
一応数字とABCは読めるようにしました。数字は馬鹿読みです文字としてしか読んでいません。うーん。どないしよ。
「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。と書きましたが、途中で飽きました。最初は面白かったんだけど、途中からだめでした。ポイントは共感できるんですが。。。るすぢに入れてあげたい機能を考えるアイデアの一つにはなりそう。。。

音の設定ツールには録音機能が必要。んで、録音用のサンプルプログラムの調達。せっかくなので、Managed Direct Soundでも使ってみるか。さらっとサンプルプログラムを読んだが、よーできてるわ。こうやっておらみたいなプログラマは駆逐されていくのね。

ゆーきのマシンで、音声発声エンジンの試験。一発で動いた。
他人のマシンで試験するのはいつも緊張する。まぁとりあえず、動いたので一安心。
次は声の設定用ツールの作成だな。現在、方針やら、デザインやらを検討中。なぜか、「これぞ!」ってのが思いつかない。こうゆうときは、ゆっくり考えよう。

–音声発声エンジンの開発 第1フェーズ終了
おらの声でパソコンがしゃべってます。おなか痛いです。笑いすぎました。しばらく遊んでたら、気色悪く感じてきました。おらが死んでもこいつは話すのねと。。。
留守番とーかーに使ってみましたが、気色悪くてあきません。公開しようかな。どうしようかな。せっかくだから自分の声を登録できるようなツールが完成してから公開した方が楽しいだろうな。といろいろ考えています。
今までにわかっている問題
長い文章を一度に話させようとすると、話しません。漢字からひらがなに変換するところがあほだからです。
数字が読めません。数字って難しい。4匹、4人、4つ、432 さて、4と言う数字はなんと読みましたか?みんなばらばら、こんな面倒なことやってられないな。とりあえず単純のでもいいから読めるようにしなきゃ。
記号は一切読めません。でも一応、「あー」みたいな長音記号はサポートしました。
「っ」は面倒なので空白
「ゃゅょ」も面倒なのでそのまま「やゆよ」と読みます。だから、「今日」は「キョウ」じゃなくて「キヨウ」と読みます。
助詞の「は」(今日は、の「は」)は、「わ」と発音しません。文字どおり「は」と発音します。(実は実装したんだけど、「では」とか、バリエーションがいっぱいあるのに気が付いて、途中でやめた。)
イントネーションやら、アクセントやら一切ありません。完全棒読みです。(まぁこの棒読みが留守番ロボットぽくていいかもとか思ってるが。)
「道路」のように「う」を「お」と発音するやつとか、鼻濁音とか、前のやつに連動して発音が変わるようなやつとか、まどろっこしいのは一切抜きです。
SAPI5.1に対応してるのでOfficeとかでも使えちゃったりするんですが、どうも完全対応じゃないみたいでなんかおかしいです。何が足らんのかはよくわかりません。
ピッチやら速度やらも変更できません。
というか。。。。誰か、論文なり本なりを紹介してくれ。こりゃ、音声合成の勉強がまったくもって足らん。
でも結構簡単にできちゃった。なんでみんな作らないんだろう。
まぁこのエンジンはフリーで公開だな。。。エンジンだけ持っててもしゃあないから。
あとは、ツールをどう整備するかだな。。。

今、読んでる本。「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。留守番君の開発に非常に役立つと思われる。読み終わったら詳細をコメントします。
–音声発声エンジンの開発
結局VC6で途中まで書いて、VS.NETに移行する方法。
ブレークってかからないのね。やむなく、ファイルダンプでのデバッグ。変数をがりがりファイルに書き出すところを勉強。SAPIにはロギング用のマクロが用意されているのだ。読み上げなければならない文字列の取得に成功。その他もろもろのパラメータも取れているみたい。なんだかよくわからないパラメータもちらほら。まだまだお勉強が必要です。

一応、3ヶ月ごとにファイルを分割することにしているので、開発日記を分割。
独立記念日が金曜日なので3連休。お休みを堪能しました。
7月4日独立記念日当日。昼間は友達数人を呼んで、バーベキュー。まぁお昼ごはんなので韓国風バーベキューでさらっと。。。でも食いすぎた。
夜はSF フィルの野外コンサート。SGIの隣にこんな野外コンサート会場があったのね。クラッシクのコンサートだけど、独立記念日にあわせて、カントリー調の曲が満載。最後には、独立記念日につき物の花火が音楽にあわせて打ちあがって、とっても感動的でした。まぁちとナショナリズムが強い気もするけどね。
7月5 日。ようやく、我が家にも米国版DVDプレーヤーが購入されました。今まで、日本版PlayStation2しか持ってなかったので、日本のDVDしか見れなかったのよ。とりあえず、古いほうのMatrixを調達して、映画に備えて学習。俺、古いほうのMatrixって見てなかったのよ。
7月6 日。SonyのMetreonでMatrix Reloadedをみる。IMAXのでかいスクリーンでやってるということなので、割り増し料金を払って、IMAXでみる。うーん画面がでかくて、酔います。映画自体は。。。英語がわからん。難しすぎるわ。。。。アクションは、CGが目立ちすぎ。まぁIMAXでみてるから余計かな。。。
さて、開発ですが。
— ひなのところの問題について
WindowHandle をとっ捕まえてくるところ、方法を変えました。まぁやり方は何通りかあるので、どれが一番適切かよくわからんけど、前のやつよりもコードが長い分、厳密に調べてる。結局、今まで動いてたのも、さくらのところで動いてたのも、運がよかっただけと言うことになりそうだ。Handleを取ってくるところ、ごそっと書き直し。でも苦労のかいがあって、ひなちゃんのところで、動いた。いぇ~い! とりあえず、XP系での動かない環境は現状では無くなった。ターゲットは、98&ME系に絞られる。XP系で動かない人がいたら教えてください。
んでも、やっぱり自信のないところって、最後までだめなのね。自信の無いところに問題が集中する。。。
— 音声発生エンジンの開発
.NET2003 でC++を使って、COMを書くのがうまくいかない。コンパイルは通ってるんだけど、ちゃんと起動されない。というか、開発環境が.NETになって、 IDLがなくなって、ヘッダに埋まるようになったんだけど、これがどんな構文なのかよくわからん。これが怪しい。また、SpeechSDKがMSDevを想定して書かれてるので、これに輪をかけてややこしくしてる。なんで、SDKを移植せねばならんのだ。IDLが自分の思うように書けないよぉ。古い環境で土台だけ作って、.NETに動かすとするか。MSDevが長かったので、IDLに慣れちゃってるんだよな。まぁSpeechSDKも古いししゃあないか。
日本語の 50音を自分の声で録音。ノイズやら無音部分を編集して、あいうえおの音素ごとに別ファイルに保存。こいつをつなぎ合わせて、文章を作ってみると。。。まぁ聞けるが当然、イントネーションおかしい。かつれつの無性に良いコンピュータが話している感じ。ただ、これはこれで、留守番の声だと言えば、留守番の声かもしれない。やっぱりイントネーションの処理を入れないとだめなのねぇ。そんな辞書どっかに落ちてないかな。単語と発音とイントネーションを書いた辞書。。。結局これも辞書しだいなんだよなぁ。こればっかりは、コーパスで学習ってのはしんどいぞ。。。まぁ何はともあれ、イントネーション無しで開発を進めるとする。
夜中に「あ、い、う、え、お」とか言って録音してたら彼女に、「あいうえおじさんという妖怪が昨晩家に出たらしい。」とからかわれた。まぁ確かに、夜中に、「あいうえお」とかゆーてたら怪しいわな。
.NET SpeechSDK Beta2が何故かWebからダウンロードできたので、ダウンロード。TTSには関係無い。つまらん。でっかいファイルで落とすの大変だったのに。圧縮を展開した時点でつまらんことが発覚して、インストールせず。。。インストールは、正式版が出たら考えます。なんか英語版の開発環境じゃないとうごかんみたいなこと書いてあるし。。
ふと気が付いたが、「留守番とーかー」って一発芸だよな。一発芸にここまで本気になって大丈夫なのだろうか。。。
— 98&ME対応
開発環境を調達するべく調査。仮想マシンのソフトを入れて、開発環境をスイッチできるようにするのが一番簡単かなと考えてみる。だって、98&ME系で. NET2003って動かないんだもん。デバッグの方法がリモートになっちゃう。ConnectixはMicrosoftに買収されてからどうにもWebサイトのやる気がみられないので、他のソフトをみる。やっぱりVMWareかな。んでも5万円か。毎度のことながら、Amazon.co.jpはこっちにソフトを配送してくれないし、Users-sideでは取り扱って無い模様。取り寄せ注文か。それにしても、5万円か。高いな。まぁパソコン買うことを思えば安いが、やっぱり高い。うーん。ちょっと悩ませてくれ。

一応さくらもちのところで動くバージョンをアップしました。
WindowHandleをとっ捕まえてくるところ、やっぱりなんか変。根本的にちゃんと作らないとだめかも。
ひなのところで、動くかと思ったけど、やっぱり状況は変わらず。
亀のところでも一緒。やっぱりだめ。
MSNエクスプローラを使ってサインインしたときに奇妙なことがおこる症状が発覚。これはちと運用で逃げてもらった。
うーん。奥が深い。
こんなんでは、とてもオンラインソフトとして公開なんてできないぞ。もっときっちりテストできる環境を整えなければ。。。

最新版アップしました。変更点は、
~をなみだっしゅと読んでいたが、それをーに変更しました。
ってなくらいです。
音声発声エンジンはちびっとちびっと書いてます。
さくらもちのところで、ちとリモートでいろいろ調査させてもらいました。うーん。すんげぇ助かる。やっぱりリモートで調査するのが一番早いな。
結局、Windowハンドルをとっ捕まえてくるところに問題があることが発覚。ひなのところも多分おんなじ問題だと思われる。違うかな?
今晩修正する予定。もしかしたら、週末かな?
また亀ちゃんの人柱が活躍しそう。。。よろしゅうね(ハート)

昨日日本から帰って来ました。無事OFF会は終了しました。えがった、えがった。
さぁ、これからですわ。このお部屋をどうゆうふうにしていくかってのは。ゆーきのドメインもあることだし、ちょっと気合入れてページ書きでもしましょうかねぇ。
専用のサーバー調達しようかな。うーん、迷うところだ。
配布CDがしーのの手に渡ってないことが発覚。ありゃ。アップデートしなきゃ。
ToDo
最新版のアップ
ひなとさくらもちのところで動かない問題の調査
音声発声エンジンの作成