「RusuDi」カテゴリーアーカイブ

特大スランプからの回復の兆しが見えてきました。ちょっと時間がかかったけど、復活しつつある今日この頃。
前回の更新から1ヶ月もたってしまったので、いろんな出来事がありました。
独自ドメイン取りました。自宅サーバーです。
現在、MailとWebが動いています。
MailはHotmailのようにWebからもアクセスできるようになっています。
今、 Webのお勉強中。aspとか、.NETとかをちまちま勉強しております。asp、無茶無茶よーできてる。aspx神様です。マイクロソフトかっこよすぎです。こりゃ、セキュリティに問題がでるのもしゃあないです。機能満載ですもん。作るほうの立場にしたらかわいそうですわ。使うほうは文句言ってりゃええですけどね。
blog なんてキーワードもお勉強中。
まだ、ホームページはなんもありません。からっぽです。
現在、構想中。
とりあえず、
日記のページ。掲示板。くらいは作ろうかと。。。自宅サーバー構築記なんてのもありかな。気が付いたのは、俺って、絵のセンスねぇ。デザインのセンスねぇ。
Webページを作るときって、背景とかロゴとかバナーとかボタンとかいろいろ絵をかかにゃあかんのですが、これが、ぜんぜんだめだめです。かっこ悪いです。
まぁネットワークしょぼしょぼ、パソコンおそおそなので、細々とやっていきます。
ある程度、Webができたら、アドレスを公開します。
多分、そのときには、開発日記はそっちに移動するんでしょうね。2つも更新できませんから。
インターネットのサーバー技術に関することは本で読んだ程度で実際に作業したことがこれが初めてです。クライアントは使ってたんだけどね。メールサーバー、DNS、HTTPサーバー、セキュリティ、ファイアーウォール。いろいろ勉強せねば。。
ビデオチューナーカードを買いました。
これで、テレビの録画ができます。
なんで、こんなもんを買ったかというと、とある友人が、
日本の実家にサーバーをセットしてきた。これで、日本のテレビ番組が録画できる。あとはダウンロードすればアメリカでも見れる。
というのを聞きまして、おらもみたーい。やりたーい。
ゆーきちゃんが、おらのパソコンにWebでアクセスして、アメリカのテレビの録画設定。ダウンロード。
逆におらがゆーきちゃんのパソコンにアクセスして。。。
現在、MediaSDKをダウンロードして研究中。MediaSDKめちゃめちゃよーできてますわ。
これは、一般に公開できる機能ではないので、あくまでも内輪のみです。だって、一般に公開したら、著作権法違反だもん。再放送の禁止に当たります。
まぁドメインとって自宅サーバーを作り始めたのはこれがやりたかったからなんだけどね。
何故か、パチンコシミュレータを書きました。非公開です。
デジパチのコンピュータの部分のシミュレータはいっぱいあるけど、玉の動きをシミュレートするソフトが見当たらなかったので、書いてました。とちゅうやりですが、既に飽きつつあります。というのは、実物のパチンコのCADデータが手に入らないからです。デジカメで取ったでっかい写真募集中。メールください。まぁ2 次元の玉の動きしか考えなかったので3次元的な動きはだめということに気が付いた時点でかなりやる気がうせています。
留守番とーかー発声エンジンは進捗がありません。
ごめんなさい。ぜんぜん進んで無いです。GUIが使いにくいわかりにくいということで、なんか手を考えねばと思いつつ、現在に至ります。これは、お休みということではなくて、僕としてはなんとしても完成させたいので、ちょっとづつ進めるよう努力します。
チャットが有料化されるそうです。
このコミュニティはチャットから派生して出来上がってきました。そうゆういみではちょっと感慨深いです。
コミュだっていつまで無料かわからんな。まぁ無料の間は続けるつもりですのでご安心を。
最悪、我が家のサーバーに避難っていう手もあるし。。。(新規顧客がこんちゅーに)。MSNがクラッシュしたときのために、バックアップは取りたいなと思っていたので、いずれミラーはしたいと思います。

特大スランプ中です。モチベーションが下がっています。以前、燃え尽き症候群に似た症状になったんだけど、それにかなり近い状況です。ということで、休憩中。。。
休憩には読書ってなことで、
あれ?一冊タイトル忘れちゃった。日本のいわゆるベンチャーでIPOに行った社長、失敗した社長その他もろもろのインタビューの本。
これは「うーん」読み物としては面白かった。が、どーってことは無い。
今読んでいるのは、
ITビジネス起業バイブル シリコンバレー 勝者のセオリー
ちと高いし、ちと古い内容ですが、これは面白いです。どんな気持ちで会社を興して、どんなことを考えて運営していくのか。投資家はどんなことを考えてお金を入れるのか。法律から仕組みから考え方まで網羅してあって、今俺がいる会社と対比しながら読んでいます。ただ、訳がおかしい。何言ってるかわからんところが既に何ヶ所か見つかった。日本語から英文を想像して、その英文から意味を想像してってな感じで読み進めています。元の英文と対比しながら読みたいなと思ったし、今の内容にあわせて書き直してあったらもっと面白いかも。。
最近のスランプの原因なんですが、ちと考えてることがありまして。
今まで、会社の社長ってなもんは、社員をこき使って、自分はふんぞり返って上がりをせしめる役。くらいにしか考えてなかったんです。社長がちまちま働いてるのは、ふんぞり返って上がりをせしめる為の仕組みをうまく作り上げていないからだと。または、その仕組みを作っている最中だからだと。一旦そのような仕組みを作ってしまえば、社長はほっといても金持ちになれるんだと。金持ちになるためには、ふんぞり返って上がりをせしめるために、会社を作って社長になって死ぬほど働いて儲かる仕組みを作り上げて、IPO行って、どかーっとお金をせしめて。とか考えてました。
ここんところ、いろいろ考えているんですが、どうもこれは違うなと。。
エンジニアが会社を興して儲かる会社になったとしても、エンジニアはその会社の一部になってしまうので、儲かれば儲かっただけ、そのエンジニアは忙しくなる。もちろん部下に指示を出して、部下に働かせてその成果を取りまとめると言う方向に進むのもありなんだけど、どっちにしても、稼ぐ本人になってしまっている。そうすると必然的に稼げる上限というのが見えてきてしまう。
金だけを考えた場合、社長はあんまり得ではないかも、と考える今日この頃です。
楽して稼ぐのはやっぱり投資する側にいる人間なんだなぁ。と思います。だから、投資する本人と社長が一致している場合は、その社長はお金持ちになりますが、社長が会社を興して、どっかから投資を受けて会社を運営した場合、社長の取り分は労働に
見合っているのか、見合っていないのか。
もちろん労働力を投資しているという考え方もあるし、自分のやりたいことをやれるという時間とお金を調達するというのは意味のあることですし。。
その点、お金が働いて稼ぐという考えはとっても僕にとってはインパクトがあって、、
うーん。まだ考えがうまくまとまって無いです。
だからスランプなのか。というかそんな本ばっかり読んでるからスランプなのかも。
考えがまとまったらまた書きます。

久々の書き込み。とは言っても大して進捗は無い。
音素と音素をつなぐところをぷちっと繋ぐのではなくて、合成してみたりした。だめだめでした。
ノイズのりまくり。ちゃんと信号処理をしなければならないようだ。うーん。お勉強が足りません。
最近読んでいる本
金持ち父さんの若くして豊かに引退する方法
これはおもろかった。結局、毎日勉強しないとだめってことですね。

切り出しのところのプログラムを書きました。音量で判定して切り出してるんだけど、どうも調子が悪い。外野の雑音がよくないのかも。もちっと研究の余地あり。
だんだん形になってきてるけど、使いにくい。使いやすくするためのツールが使いにくくちゃしょうがない。使い勝手の検討をしなければ。。。

サンプルプログラムとにらめっこしながら、プログラムをちまちま書く。録音はできるようになった。かーんたん!。いやぁ、DirectSoundよーできてるわ。これから、都合のいいところだけを切り出すプログラムを作成しなければ。。。どっちかというとこっちの方が面倒だな。いまだにデザインの方針が決まらない。うだうだしてます。
一応数字とABCは読めるようにしました。数字は馬鹿読みです文字としてしか読んでいません。うーん。どないしよ。
「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。と書きましたが、途中で飽きました。最初は面白かったんだけど、途中からだめでした。ポイントは共感できるんですが。。。るすぢに入れてあげたい機能を考えるアイデアの一つにはなりそう。。。

音の設定ツールには録音機能が必要。んで、録音用のサンプルプログラムの調達。せっかくなので、Managed Direct Soundでも使ってみるか。さらっとサンプルプログラムを読んだが、よーできてるわ。こうやっておらみたいなプログラマは駆逐されていくのね。

ゆーきのマシンで、音声発声エンジンの試験。一発で動いた。
他人のマシンで試験するのはいつも緊張する。まぁとりあえず、動いたので一安心。
次は声の設定用ツールの作成だな。現在、方針やら、デザインやらを検討中。なぜか、「これぞ!」ってのが思いつかない。こうゆうときは、ゆっくり考えよう。

–音声発声エンジンの開発 第1フェーズ終了
おらの声でパソコンがしゃべってます。おなか痛いです。笑いすぎました。しばらく遊んでたら、気色悪く感じてきました。おらが死んでもこいつは話すのねと。。。
留守番とーかーに使ってみましたが、気色悪くてあきません。公開しようかな。どうしようかな。せっかくだから自分の声を登録できるようなツールが完成してから公開した方が楽しいだろうな。といろいろ考えています。
今までにわかっている問題
長い文章を一度に話させようとすると、話しません。漢字からひらがなに変換するところがあほだからです。
数字が読めません。数字って難しい。4匹、4人、4つ、432 さて、4と言う数字はなんと読みましたか?みんなばらばら、こんな面倒なことやってられないな。とりあえず単純のでもいいから読めるようにしなきゃ。
記号は一切読めません。でも一応、「あー」みたいな長音記号はサポートしました。
「っ」は面倒なので空白
「ゃゅょ」も面倒なのでそのまま「やゆよ」と読みます。だから、「今日」は「キョウ」じゃなくて「キヨウ」と読みます。
助詞の「は」(今日は、の「は」)は、「わ」と発音しません。文字どおり「は」と発音します。(実は実装したんだけど、「では」とか、バリエーションがいっぱいあるのに気が付いて、途中でやめた。)
イントネーションやら、アクセントやら一切ありません。完全棒読みです。(まぁこの棒読みが留守番ロボットぽくていいかもとか思ってるが。)
「道路」のように「う」を「お」と発音するやつとか、鼻濁音とか、前のやつに連動して発音が変わるようなやつとか、まどろっこしいのは一切抜きです。
SAPI5.1に対応してるのでOfficeとかでも使えちゃったりするんですが、どうも完全対応じゃないみたいでなんかおかしいです。何が足らんのかはよくわかりません。
ピッチやら速度やらも変更できません。
というか。。。。誰か、論文なり本なりを紹介してくれ。こりゃ、音声合成の勉強がまったくもって足らん。
でも結構簡単にできちゃった。なんでみんな作らないんだろう。
まぁこのエンジンはフリーで公開だな。。。エンジンだけ持っててもしゃあないから。
あとは、ツールをどう整備するかだな。。。

今、読んでる本。「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。留守番君の開発に非常に役立つと思われる。読み終わったら詳細をコメントします。
–音声発声エンジンの開発
結局VC6で途中まで書いて、VS.NETに移行する方法。
ブレークってかからないのね。やむなく、ファイルダンプでのデバッグ。変数をがりがりファイルに書き出すところを勉強。SAPIにはロギング用のマクロが用意されているのだ。読み上げなければならない文字列の取得に成功。その他もろもろのパラメータも取れているみたい。なんだかよくわからないパラメータもちらほら。まだまだお勉強が必要です。

一応、3ヶ月ごとにファイルを分割することにしているので、開発日記を分割。
独立記念日が金曜日なので3連休。お休みを堪能しました。
7月4日独立記念日当日。昼間は友達数人を呼んで、バーベキュー。まぁお昼ごはんなので韓国風バーベキューでさらっと。。。でも食いすぎた。
夜はSF フィルの野外コンサート。SGIの隣にこんな野外コンサート会場があったのね。クラッシクのコンサートだけど、独立記念日にあわせて、カントリー調の曲が満載。最後には、独立記念日につき物の花火が音楽にあわせて打ちあがって、とっても感動的でした。まぁちとナショナリズムが強い気もするけどね。
7月5 日。ようやく、我が家にも米国版DVDプレーヤーが購入されました。今まで、日本版PlayStation2しか持ってなかったので、日本のDVDしか見れなかったのよ。とりあえず、古いほうのMatrixを調達して、映画に備えて学習。俺、古いほうのMatrixって見てなかったのよ。
7月6 日。SonyのMetreonでMatrix Reloadedをみる。IMAXのでかいスクリーンでやってるということなので、割り増し料金を払って、IMAXでみる。うーん画面がでかくて、酔います。映画自体は。。。英語がわからん。難しすぎるわ。。。。アクションは、CGが目立ちすぎ。まぁIMAXでみてるから余計かな。。。
さて、開発ですが。
— ひなのところの問題について
WindowHandle をとっ捕まえてくるところ、方法を変えました。まぁやり方は何通りかあるので、どれが一番適切かよくわからんけど、前のやつよりもコードが長い分、厳密に調べてる。結局、今まで動いてたのも、さくらのところで動いてたのも、運がよかっただけと言うことになりそうだ。Handleを取ってくるところ、ごそっと書き直し。でも苦労のかいがあって、ひなちゃんのところで、動いた。いぇ~い! とりあえず、XP系での動かない環境は現状では無くなった。ターゲットは、98&ME系に絞られる。XP系で動かない人がいたら教えてください。
んでも、やっぱり自信のないところって、最後までだめなのね。自信の無いところに問題が集中する。。。
— 音声発生エンジンの開発
.NET2003 でC++を使って、COMを書くのがうまくいかない。コンパイルは通ってるんだけど、ちゃんと起動されない。というか、開発環境が.NETになって、 IDLがなくなって、ヘッダに埋まるようになったんだけど、これがどんな構文なのかよくわからん。これが怪しい。また、SpeechSDKがMSDevを想定して書かれてるので、これに輪をかけてややこしくしてる。なんで、SDKを移植せねばならんのだ。IDLが自分の思うように書けないよぉ。古い環境で土台だけ作って、.NETに動かすとするか。MSDevが長かったので、IDLに慣れちゃってるんだよな。まぁSpeechSDKも古いししゃあないか。
日本語の 50音を自分の声で録音。ノイズやら無音部分を編集して、あいうえおの音素ごとに別ファイルに保存。こいつをつなぎ合わせて、文章を作ってみると。。。まぁ聞けるが当然、イントネーションおかしい。かつれつの無性に良いコンピュータが話している感じ。ただ、これはこれで、留守番の声だと言えば、留守番の声かもしれない。やっぱりイントネーションの処理を入れないとだめなのねぇ。そんな辞書どっかに落ちてないかな。単語と発音とイントネーションを書いた辞書。。。結局これも辞書しだいなんだよなぁ。こればっかりは、コーパスで学習ってのはしんどいぞ。。。まぁ何はともあれ、イントネーション無しで開発を進めるとする。
夜中に「あ、い、う、え、お」とか言って録音してたら彼女に、「あいうえおじさんという妖怪が昨晩家に出たらしい。」とからかわれた。まぁ確かに、夜中に、「あいうえお」とかゆーてたら怪しいわな。
.NET SpeechSDK Beta2が何故かWebからダウンロードできたので、ダウンロード。TTSには関係無い。つまらん。でっかいファイルで落とすの大変だったのに。圧縮を展開した時点でつまらんことが発覚して、インストールせず。。。インストールは、正式版が出たら考えます。なんか英語版の開発環境じゃないとうごかんみたいなこと書いてあるし。。
ふと気が付いたが、「留守番とーかー」って一発芸だよな。一発芸にここまで本気になって大丈夫なのだろうか。。。
— 98&ME対応
開発環境を調達するべく調査。仮想マシンのソフトを入れて、開発環境をスイッチできるようにするのが一番簡単かなと考えてみる。だって、98&ME系で. NET2003って動かないんだもん。デバッグの方法がリモートになっちゃう。ConnectixはMicrosoftに買収されてからどうにもWebサイトのやる気がみられないので、他のソフトをみる。やっぱりVMWareかな。んでも5万円か。毎度のことながら、Amazon.co.jpはこっちにソフトを配送してくれないし、Users-sideでは取り扱って無い模様。取り寄せ注文か。それにしても、5万円か。高いな。まぁパソコン買うことを思えば安いが、やっぱり高い。うーん。ちょっと悩ませてくれ。