留守番ぢ

| コメント(0) | トラックバック(0)
RusuDi

特大スランプからの回復の兆しが見えてきました。ちょっと時間がかかったけど、復活しつつある今日この頃。

前回の更新から1ヶ月もたってしまったので、いろんな出来事がありました。

独自ドメイン取りました。自宅サーバーです。
現在、MailとWebが動いています。
MailはHotmailのようにWebからもアクセスできるようになっています。
今、 Webのお勉強中。aspとか、.NETとかをちまちま勉強しております。asp、無茶無茶よーできてる。aspx神様です。マイクロソフトかっこよすぎです。こりゃ、セキュリティに問題がでるのもしゃあないです。機能満載ですもん。作るほうの立場にしたらかわいそうですわ。使うほうは文句言ってりゃええですけどね。
blog なんてキーワードもお勉強中。
まだ、ホームページはなんもありません。からっぽです。
現在、構想中。
とりあえず、
日記のページ。掲示板。くらいは作ろうかと。。。自宅サーバー構築記なんてのもありかな。気が付いたのは、俺って、絵のセンスねぇ。デザインのセンスねぇ。
Webページを作るときって、背景とかロゴとかバナーとかボタンとかいろいろ絵をかかにゃあかんのですが、これが、ぜんぜんだめだめです。かっこ悪いです。
まぁネットワークしょぼしょぼ、パソコンおそおそなので、細々とやっていきます。
ある程度、Webができたら、アドレスを公開します。
多分、そのときには、開発日記はそっちに移動するんでしょうね。2つも更新できませんから。
インターネットのサーバー技術に関することは本で読んだ程度で実際に作業したことがこれが初めてです。クライアントは使ってたんだけどね。メールサーバー、DNS、HTTPサーバー、セキュリティ、ファイアーウォール。いろいろ勉強せねば。。

ビデオチューナーカードを買いました。
これで、テレビの録画ができます。
なんで、こんなもんを買ったかというと、とある友人が、
日本の実家にサーバーをセットしてきた。これで、日本のテレビ番組が録画できる。あとはダウンロードすればアメリカでも見れる。
というのを聞きまして、おらもみたーい。やりたーい。
ゆーきちゃんが、おらのパソコンにWebでアクセスして、アメリカのテレビの録画設定。ダウンロード。
逆におらがゆーきちゃんのパソコンにアクセスして。。。
現在、MediaSDKをダウンロードして研究中。MediaSDKめちゃめちゃよーできてますわ。
これは、一般に公開できる機能ではないので、あくまでも内輪のみです。だって、一般に公開したら、著作権法違反だもん。再放送の禁止に当たります。
まぁドメインとって自宅サーバーを作り始めたのはこれがやりたかったからなんだけどね。

何故か、パチンコシミュレータを書きました。非公開です。
デジパチのコンピュータの部分のシミュレータはいっぱいあるけど、玉の動きをシミュレートするソフトが見当たらなかったので、書いてました。とちゅうやりですが、既に飽きつつあります。というのは、実物のパチンコのCADデータが手に入らないからです。デジカメで取ったでっかい写真募集中。メールください。まぁ2 次元の玉の動きしか考えなかったので3次元的な動きはだめということに気が付いた時点でかなりやる気がうせています。

留守番とーかー発声エンジンは進捗がありません。
ごめんなさい。ぜんぜん進んで無いです。GUIが使いにくいわかりにくいということで、なんか手を考えねばと思いつつ、現在に至ります。これは、お休みということではなくて、僕としてはなんとしても完成させたいので、ちょっとづつ進めるよう努力します。

チャットが有料化されるそうです。
このコミュニティはチャットから派生して出来上がってきました。そうゆういみではちょっと感慨深いです。
コミュだっていつまで無料かわからんな。まぁ無料の間は続けるつもりですのでご安心を。
最悪、我が家のサーバーに避難っていう手もあるし。。。(新規顧客がこんちゅーに)。MSNがクラッシュしたときのために、バックアップは取りたいなと思っていたので、いずれミラーはしたいと思います。

| コメント(0) | トラックバック(0)
RusuDi

特大スランプ中です。モチベーションが下がっています。以前、燃え尽き症候群に似た症状になったんだけど、それにかなり近い状況です。ということで、休憩中。。。

休憩には読書ってなことで、
あれ?一冊タイトル忘れちゃった。日本のいわゆるベンチャーでIPOに行った社長、失敗した社長その他もろもろのインタビューの本。
これは「うーん」読み物としては面白かった。が、どーってことは無い。

今読んでいるのは、
ITビジネス起業バイブル シリコンバレー 勝者のセオリー
ちと高いし、ちと古い内容ですが、これは面白いです。どんな気持ちで会社を興して、どんなことを考えて運営していくのか。投資家はどんなことを考えてお金を入れるのか。法律から仕組みから考え方まで網羅してあって、今俺がいる会社と対比しながら読んでいます。ただ、訳がおかしい。何言ってるかわからんところが既に何ヶ所か見つかった。日本語から英文を想像して、その英文から意味を想像してってな感じで読み進めています。元の英文と対比しながら読みたいなと思ったし、今の内容にあわせて書き直してあったらもっと面白いかも。。

最近のスランプの原因なんですが、ちと考えてることがありまして。
今まで、会社の社長ってなもんは、社員をこき使って、自分はふんぞり返って上がりをせしめる役。くらいにしか考えてなかったんです。社長がちまちま働いてるのは、ふんぞり返って上がりをせしめる為の仕組みをうまく作り上げていないからだと。または、その仕組みを作っている最中だからだと。一旦そのような仕組みを作ってしまえば、社長はほっといても金持ちになれるんだと。金持ちになるためには、ふんぞり返って上がりをせしめるために、会社を作って社長になって死ぬほど働いて儲かる仕組みを作り上げて、IPO行って、どかーっとお金をせしめて。とか考えてました。
ここんところ、いろいろ考えているんですが、どうもこれは違うなと。。
エンジニアが会社を興して儲かる会社になったとしても、エンジニアはその会社の一部になってしまうので、儲かれば儲かっただけ、そのエンジニアは忙しくなる。もちろん部下に指示を出して、部下に働かせてその成果を取りまとめると言う方向に進むのもありなんだけど、どっちにしても、稼ぐ本人になってしまっている。そうすると必然的に稼げる上限というのが見えてきてしまう。
金だけを考えた場合、社長はあんまり得ではないかも、と考える今日この頃です。
楽して稼ぐのはやっぱり投資する側にいる人間なんだなぁ。と思います。だから、投資する本人と社長が一致している場合は、その社長はお金持ちになりますが、社長が会社を興して、どっかから投資を受けて会社を運営した場合、社長の取り分は労働に
見合っているのか、見合っていないのか。
もちろん労働力を投資しているという考え方もあるし、自分のやりたいことをやれるという時間とお金を調達するというのは意味のあることですし。。
その点、お金が働いて稼ぐという考えはとっても僕にとってはインパクトがあって、、
うーん。まだ考えがうまくまとまって無いです。
だからスランプなのか。というかそんな本ばっかり読んでるからスランプなのかも。
考えがまとまったらまた書きます。

| コメント(0) | トラックバック(0)
RusuDi

久々の書き込み。とは言っても大して進捗は無い。
音素と音素をつなぐところをぷちっと繋ぐのではなくて、合成してみたりした。だめだめでした。
ノイズのりまくり。ちゃんと信号処理をしなければならないようだ。うーん。お勉強が足りません。

最近読んでいる本
金持ち父さんの若くして豊かに引退する方法
これはおもろかった。結局、毎日勉強しないとだめってことですね。

| コメント(0) | トラックバック(0)
RusuDi

切り出しのところのプログラムを書きました。音量で判定して切り出してるんだけど、どうも調子が悪い。外野の雑音がよくないのかも。もちっと研究の余地あり。
だんだん形になってきてるけど、使いにくい。使いやすくするためのツールが使いにくくちゃしょうがない。使い勝手の検討をしなければ。。。

| コメント(0) | トラックバック(0)
RusuDi

サンプルプログラムとにらめっこしながら、プログラムをちまちま書く。録音はできるようになった。かーんたん!。いやぁ、DirectSoundよーできてるわ。これから、都合のいいところだけを切り出すプログラムを作成しなければ。。。どっちかというとこっちの方が面倒だな。いまだにデザインの方針が決まらない。うだうだしてます。
一応数字とABCは読めるようにしました。数字は馬鹿読みです文字としてしか読んでいません。うーん。どないしよ。

「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。と書きましたが、途中で飽きました。最初は面白かったんだけど、途中からだめでした。ポイントは共感できるんですが。。。るすぢに入れてあげたい機能を考えるアイデアの一つにはなりそう。。。

| コメント(0) | トラックバック(0)
RusuDi

音の設定ツールには録音機能が必要。んで、録音用のサンプルプログラムの調達。せっかくなので、Managed Direct Soundでも使ってみるか。さらっとサンプルプログラムを読んだが、よーできてるわ。こうやっておらみたいなプログラマは駆逐されていくのね。

| コメント(0) | トラックバック(0)
RusuDi

ゆーきのマシンで、音声発声エンジンの試験。一発で動いた。
他人のマシンで試験するのはいつも緊張する。まぁとりあえず、動いたので一安心。
次は声の設定用ツールの作成だな。現在、方針やら、デザインやらを検討中。なぜか、「これぞ!」ってのが思いつかない。こうゆうときは、ゆっくり考えよう。

| コメント(0) | トラックバック(0)
RusuDi

--音声発声エンジンの開発 第1フェーズ終了
おらの声でパソコンがしゃべってます。おなか痛いです。笑いすぎました。しばらく遊んでたら、気色悪く感じてきました。おらが死んでもこいつは話すのねと。。。
留守番とーかーに使ってみましたが、気色悪くてあきません。公開しようかな。どうしようかな。せっかくだから自分の声を登録できるようなツールが完成してから公開した方が楽しいだろうな。といろいろ考えています。

今までにわかっている問題
長い文章を一度に話させようとすると、話しません。漢字からひらがなに変換するところがあほだからです。
数字が読めません。数字って難しい。4匹、4人、4つ、432 さて、4と言う数字はなんと読みましたか?みんなばらばら、こんな面倒なことやってられないな。とりあえず単純のでもいいから読めるようにしなきゃ。
記号は一切読めません。でも一応、「あー」みたいな長音記号はサポートしました。
「っ」は面倒なので空白
「ゃゅょ」も面倒なのでそのまま「やゆよ」と読みます。だから、「今日」は「キョウ」じゃなくて「キヨウ」と読みます。
助詞の「は」(今日は、の「は」)は、「わ」と発音しません。文字どおり「は」と発音します。(実は実装したんだけど、「では」とか、バリエーションがいっぱいあるのに気が付いて、途中でやめた。)
イントネーションやら、アクセントやら一切ありません。完全棒読みです。(まぁこの棒読みが留守番ロボットぽくていいかもとか思ってるが。)
「道路」のように「う」を「お」と発音するやつとか、鼻濁音とか、前のやつに連動して発音が変わるようなやつとか、まどろっこしいのは一切抜きです。
SAPI5.1に対応してるのでOfficeとかでも使えちゃったりするんですが、どうも完全対応じゃないみたいでなんかおかしいです。何が足らんのかはよくわかりません。
ピッチやら速度やらも変更できません。

というか。。。。誰か、論文なり本なりを紹介してくれ。こりゃ、音声合成の勉強がまったくもって足らん。

でも結構簡単にできちゃった。なんでみんな作らないんだろう。
まぁこのエンジンはフリーで公開だな。。。エンジンだけ持っててもしゃあないから。
あとは、ツールをどう整備するかだな。。。

| コメント(0) | トラックバック(0)
RusuDi

今、読んでる本。「人はなぜ話すのか―知能と記憶のメカニズム」。面白い。留守番君の開発に非常に役立つと思われる。読み終わったら詳細をコメントします。

--音声発声エンジンの開発
結局VC6で途中まで書いて、VS.NETに移行する方法。
ブレークってかからないのね。やむなく、ファイルダンプでのデバッグ。変数をがりがりファイルに書き出すところを勉強。SAPIにはロギング用のマクロが用意されているのだ。読み上げなければならない文字列の取得に成功。その他もろもろのパラメータも取れているみたい。なんだかよくわからないパラメータもちらほら。まだまだお勉強が必要です。

| コメント(0) | トラックバック(0)
RusuDi 一応、3ヶ月ごとにファイルを分割することにしているので、開発日記を分割。 独立記念日が金曜日なので3連休。お休みを堪能しました。 7月4日独立記念日当日。昼間は友達数人を呼んで、バーベキュー。まぁお昼ごはんなので韓国風バーベキューでさらっと。。。でも食いすぎた。 夜はSF フィルの野外コンサート。SGIの隣にこんな野外コンサート会場があったのね。クラッシクのコンサートだけど、独立記念日にあわせて、カントリー調の曲が満載。最後には、独立記念日につき物の花火が音楽にあわせて打ちあがって、とっても感動的でした。まぁちとナショナリズムが強い気もするけどね。 7月5 日。ようやく、我が家にも米国版DVDプレーヤーが購入されました。今まで、日本版PlayStation2しか持ってなかったので、日本のDVDしか見れなかったのよ。とりあえず、古いほうのMatrixを調達して、映画に備えて学習。俺、古いほうのMatrixって見てなかったのよ。 7月6 日。SonyのMetreonでMatrix Reloadedをみる。IMAXのでかいスクリーンでやってるということなので、割り増し料金を払って、IMAXでみる。うーん画面がでかくて、酔います。映画自体は。。。英語がわからん。難しすぎるわ。。。。アクションは、CGが目立ちすぎ。まぁIMAXでみてるから余計かな。。。 さて、開発ですが。 -- ひなのところの問題について WindowHandle をとっ捕まえてくるところ、方法を変えました。まぁやり方は何通りかあるので、どれが一番適切かよくわからんけど、前のやつよりもコードが長い分、厳密に調べてる。結局、今まで動いてたのも、さくらのところで動いてたのも、運がよかっただけと言うことになりそうだ。Handleを取ってくるところ、ごそっと書き直し。でも苦労のかいがあって、ひなちゃんのところで、動いた。いぇ~い! とりあえず、XP系での動かない環境は現状では無くなった。ターゲットは、98&ME系に絞られる。XP系で動かない人がいたら教えてください。 んでも、やっぱり自信のないところって、最後までだめなのね。自信の無いところに問題が集中する。。。 -- 音声発生エンジンの開発 .NET2003 でC++を使って、COMを書くのがうまくいかない。コンパイルは通ってるんだけど、ちゃんと起動されない。というか、開発環境が.NETになって、 IDLがなくなって、ヘッダに埋まるようになったんだけど、これがどんな構文なのかよくわからん。これが怪しい。また、SpeechSDKがMSDevを想定して書かれてるので、これに輪をかけてややこしくしてる。なんで、SDKを移植せねばならんのだ。IDLが自分の思うように書けないよぉ。古い環境で土台だけ作って、.NETに動かすとするか。MSDevが長かったので、IDLに慣れちゃってるんだよな。まぁSpeechSDKも古いししゃあないか。 日本語の 50音を自分の声で録音。ノイズやら無音部分を編集して、あいうえおの音素ごとに別ファイルに保存。こいつをつなぎ合わせて、文章を作ってみると。。。まぁ聞けるが当然、イントネーションおかしい。かつれつの無性に良いコンピュータが話している感じ。ただ、これはこれで、留守番の声だと言えば、留守番の声かもしれない。やっぱりイントネーションの処理を入れないとだめなのねぇ。そんな辞書どっかに落ちてないかな。単語と発音とイントネーションを書いた辞書。。。結局これも辞書しだいなんだよなぁ。こればっかりは、コーパスで学習ってのはしんどいぞ。。。まぁ何はともあれ、イントネーション無しで開発を進めるとする。 夜中に「あ、い、う、え、お」とか言って録音してたら彼女に、「あいうえおじさんという妖怪が昨晩家に出たらしい。」とからかわれた。まぁ確かに、夜中に、「あいうえお」とかゆーてたら怪しいわな。 .NET SpeechSDK Beta2が何故かWebからダウンロードできたので、ダウンロード。TTSには関係無い。つまらん。でっかいファイルで落とすの大変だったのに。圧縮を展開した時点でつまらんことが発覚して、インストールせず。。。インストールは、正式版が出たら考えます。なんか英語版の開発環境じゃないとうごかんみたいなこと書いてあるし。。 ふと気が付いたが、「留守番とーかー」って一発芸だよな。一発芸にここまで本気になって大丈夫なのだろうか。。。 -- 98&ME対応 開発環境を調達するべく調査。仮想マシンのソフトを入れて、開発環境をスイッチできるようにするのが一番簡単かなと考えてみる。だって、98&ME系で. NET2003って動かないんだもん。デバッグの方法がリモートになっちゃう。ConnectixはMicrosoftに買収されてからどうにもWebサイトのやる気がみられないので、他のソフトをみる。やっぱりVMWareかな。んでも5万円か。毎度のことながら、Amazon.co.jpはこっちにソフトを配送してくれないし、Users-sideでは取り扱って無い模様。取り寄せ注文か。それにしても、5万円か。高いな。まぁパソコン買うことを思えば安いが、やっぱり高い。うーん。ちょっと悩ませてくれ。

| コメント(0) | トラックバック(0)
RusuDi

一応さくらもちのところで動くバージョンをアップしました。
WindowHandleをとっ捕まえてくるところ、やっぱりなんか変。根本的にちゃんと作らないとだめかも。
ひなのところで、動くかと思ったけど、やっぱり状況は変わらず。
亀のところでも一緒。やっぱりだめ。

MSNエクスプローラを使ってサインインしたときに奇妙なことがおこる症状が発覚。これはちと運用で逃げてもらった。

うーん。奥が深い。

こんなんでは、とてもオンラインソフトとして公開なんてできないぞ。もっときっちりテストできる環境を整えなければ。。。

| コメント(0) | トラックバック(0)
RusuDi

最新版アップしました。変更点は、
~をなみだっしゅと読んでいたが、それをーに変更しました。
ってなくらいです。

音声発声エンジンはちびっとちびっと書いてます。

さくらもちのところで、ちとリモートでいろいろ調査させてもらいました。うーん。すんげぇ助かる。やっぱりリモートで調査するのが一番早いな。
結局、Windowハンドルをとっ捕まえてくるところに問題があることが発覚。ひなのところも多分おんなじ問題だと思われる。違うかな?
今晩修正する予定。もしかしたら、週末かな?
また亀ちゃんの人柱が活躍しそう。。。よろしゅうね(ハート)

| コメント(0) | トラックバック(0)
RusuDi

昨日日本から帰って来ました。無事OFF会は終了しました。えがった、えがった。
さぁ、これからですわ。このお部屋をどうゆうふうにしていくかってのは。ゆーきのドメインもあることだし、ちょっと気合入れてページ書きでもしましょうかねぇ。
専用のサーバー調達しようかな。うーん、迷うところだ。
配布CDがしーのの手に渡ってないことが発覚。ありゃ。アップデートしなきゃ。

ToDo
最新版のアップ
ひなとさくらもちのところで動かない問題の調査
音声発声エンジンの作成

| コメント(0) | トラックバック(0)
RusuDi

ひなのところと、さくらもちのところで、声が出ない問題が発覚。時間切れ。OFFが終わったらじっくり対処します。うーん。原因がわからん。落っこちたりえらーが出るならまだしも、何事もなかったように動いてて、声だけ出ないってのは厄介だ。ひなのところは、コントロールパネルからだと声が出るんだよなぁ。。。動かない環境があると無性に悔しい今日この頃です。

留守番とーかーのインストールCD-Rを量産しました。16枚準備しました。まぁそんなにたくさんは必要ないでしょう。ラベル貼って結構ちゃんとしてます。コミケに出てるのってこんな感じなのかな?コミケって行ったこと無いけど。。。インクジェットでラベルを印刷したので、水にぬれるとだめになります。大事に使いたいかたは、クリアスプレーでも吹いてください。8枚同じ絵を印刷するなんてことはめったに無いので、ついでにプリンタのドライバの設定によって画質がどんなふうに変わるのか、いろいろ試してました。おかげで全部のラベルの画質が微妙に違うはずです。
最初は14枚の予定だったんだけど、焼いてる最中にエラーになってたCDを最後にもう一度試したら焼けちゃったんで、それを追加しました。エラーになったから、VOIDって書いちゃったのに、焼けてるし、読めてます。

音声発声エンジンの作り方がわかりました。これで、OfficeXPがなくても、留守番とーかーが話すようにできます。もちろん時間切れですので、次の半年のプロジェクトになりそうです。思いのほか仕組みは簡単。もちろん、ちゃんとした日本語で、抑揚をきっちりするのはすごい手間ですし、リエゾンやら省略やら鼻濁音やら考えて、自然な日本語を話すことを何年も研究してらっしゃる方がいらっしゃるほど、難しいことです。そんな高度なことはとてもおら一人の手で負えるようなもんじゃないです。しかし、SAPIが提供している範囲のTTSエンジンのインターフェースはさっぱりシンプルでした。考えてみれば当たり前だ。文字列食って、WAVを返すだけ。SRはまだ読んでないからわからないけど、SRに比べれば圧倒的に簡単だった。留守番とーかーの場合はきれいな日本語を話すのが目的じゃなくて、声が出りゃええからね。考えてみれば、昔のPC6601の音声だって慣れれば何言ってるかわかったんだから。。。ちょっと楽しいプロジェクトが思いついたのでうれしいです。さらっとテストプログラム書いてみてどんな感じか早くみてみたいな。ところで、NetSpeechSDKはいつになったら公開されるんだろう。。。
音声発声エンジンを作るにあたって、声優を募集するかも。。。
この発声エンジンが公開できたら結構有用だろうな。フリーの発声エンジンって見つからなかったから。多くの人に使われることになると思う。というか、フリーのがまだ出てないからマイクロソフトはフリーで公開しないのだろうか。。。フリーのがでたら、即マイクロソフトから公開されそうな気もするが。。。ちまたの売り物の発声エンジンのように抑揚をちゃんと処理するのは個人では難しいと思われる。サウンドプロセッサのプログラムのお勉強をしなくては。。。。

相変わらず直前までいじってますねぇ。時間切れでできなかったことがいっぱいあるなぁ。まぁまた次回のお楽しみということで。。。

| コメント(0) | トラックバック(0)
RusuDi

ニックネームの予約が大変なことになってる。3文字以上じゃないと予約できない。「ぢ」というニックネームもこれまでか。ニックネーム変わっちゃうの、いやだなぁ。結構これ気に入ってたのに。。一応保険として、「管理人ぢ」というのを取っておいた。「留守番ぢ」の予約はちゃんとできたようだ。

留守番とーかーをベータリリース。結局95系はギブアップしました。OFF会が終わったらもう一度チャレンジします。
いにのところと、しーののところでちゃんと動いたのを確認。
セットアップの説明に問題があることが発覚。
~をおかしなふうに読むのでうっとうしい、という問題が発覚。
これらの問題は、OFF会で配布するCD-ROMでは修正される予定。

| コメント(0) | トラックバック(0)
RusuDi

昨晩、Webでぶらぶらしてると、PC6001のソフトウエアの紹介のページを見つけた。 PC6001とは1980年中頃にNECから発売されたパソコンのことです。メモリ16kByte.CPU Z80-4MHzの時代です。エミュレータも開発されているようで。。僕が始めて触ったパソコンがPC6001でした。自分の家に初めて届いたパソコンはその後継機種のPC6601でした。ひさびさにその手の記事を見て当時の記憶がよみがえってきました。今見ても、MicrosoftのBASICはよくできてるなぁ。あのころのパソコンは機能が少なかったので力いっぱいその機能を引き出す努力をしてたなぁ。などなど、いろいろ考えちゃいました。当時は処理速度がどうのというよりも、色数がどうの、画面の解像度がどうの、音源がどうのとかで競ってましたね。まぁもちろん処理速度ってのも重要な要素ですが。。。SeeNaって言う、PC88用の有名なソフトがあるんですが、その作者の「たいにゃん」さんのページを見つけました。ちょっとだけ、SeeNa について書いてあるんですが、当時P6用に開発してたんですね。あと、P88のメインCPUだけでは処理速度が足らないからと、フロッピドライブ内蔵のチップにも処理をさせていたとか。恐るべし力技!こうゆうのがHackerですわ。僕は当時から見てHackerに近づいているでしょうか。。。職業としてプログラマをやるようになって、設計手法やら政治的戦略やら数学的論理によって開発を進めるような技術ばかり身につけて、純粋なアイデア、発想をする力はまったく成長して無いのではと考えさせられています。まぁそんなこと考えること自体がスランプなんだろうな。

とあるWebページであなたの適正年収を査定しますってなのがあったので、ちまちま応募してみました。まぁWebのフォームに書き込むだけですので、情報量が少ないですし、俺もいい加減に書いてますから、どこまで正確な査定になっているかわかりませんが。送られてきたメールによると、わたしの適正年収は現在の3 分の2から半分程度のようです。がははは。まぁそんなもんかもね。どっちにしても相変わらず日本ではSEに高く、PGに安いようです。

| コメント(0) | トラックバック(0)
RusuDi

起動処理の部分を変更した。どうも起動処理が怪しいのではと踏んだわけだ。亀ちゃんのところで動作確認しよっと。
リリースに向けてEULAを書いた。Readmeも書いた。ヘルプ作らなきゃ。。。ヘルプが必要なほど機能無いんだけど。。。
EULAはかな~りきつめに書いた。もちろん、GPLじゃない。GPLを凄く尊重するがあまり、中途半端なEULAにしたくなかったので、Microsoftに近い形のEULAにしました。

| コメント(0) | トラックバック(0)
RusuDi

天下御免のprintfデバッグ(もちろん出力はファイル)で問題を追求。昨日のAPIは動いてた。が、その次の処理で固まってる。う~ん。この処理のどこがあかんのやろう。現物をインストールするマシンがほしぃ!って言っても98ってどーせ使わないから無駄なんだけど。。。デバッグ用にひとつ調達しなきゃだめかなぁ。うーん。あとちょっとだと思うんだけどな。とりあえず、ひとつ思いついたので、それを試してみてから考えよう。

最近、すんげぇモチベーションが低いので自分のモチベーションを上げるべく、とある本を引っ張り出して読んだ。
ハッカーズ
こいつはもう俺が高校のときに読んだ本なんだけど、大事に取ってあります。
僕のエンジニアとしての夢の舞台がこの本に書いてあります。既に歴史の本になってしまって、今の実情とはなかり乖離している部分が多いのですが、昔はこうだった。こうゆうのがプログラマだってのがわかる本です。ただ、、、訳がきっついです。言葉が一致して無いので凄く読みづらい本です。

| コメント(0) | トラックバック(0)
RusuDi

亀ちゃんのところで試験。だめだぁ~ぁ。どーやっても、98,MEでは動かん。どうも、とあるAPIがうまくうごかんらしい。青画面になってしまうとの報告。とあるAPIを呼び出すとあかん。あのAPIの動きがNT系と95系とで違うらしい。まぁ違うってのはわかってるんだけど、青画面はかれちゃうとねぇ。う~ん。こっから先は現物がないと作業が難しいなぁ。NT系の開発の経験に比べて95系の経験が乏しいという欠点があらわにされている。そろそろギブアップかも。。。

| コメント(0) | トラックバック(0)
RusuDi

SAPI5.1使ってました。うーん。WinXPだと標準で5.1でもMSAgentだと 4.0。MSAgentだと発声エンジンが使える。5.1だとOfficeXPじゃないとだめ。4.0は別途開発環境を準備しなきゃだめ。うーん。面倒だ。どうしようかなぁ。4.0に変更しようかなぁ。
CDラベル印刷のツールの勉強。こりゃ簡単だ。あとはデザインだな。ペイントブラシ職人かぁ。
ゆうき大先生と動画配信についてのミーティング(って言ってもチャットでだけど。)現状のやりかただとサーバーが必要らしい。マシンが足らん。現地配信だとネットワークが調達できない。うーん。悩ましいところだ。100歩譲って、ファイルにしてあとでダウンロードって手もあるな。まぁ大先生の意向に沿うようにしよう。

| コメント(0) | トラックバック(0)
RusuDi

Visual Studio .NET 2003 を導入。留守番ロボットおよび留守番とーかーを.NET 2003でコンパイル。試験中。
2003って2002とほとんどかわらん。まぁサーバー周りをやる人にとってはインパクトがでかいんだろうけど、普通のアプリを書く人にとっては、バグフィックス版だな。まだ細かいところまでは見て無いけど、細かくバグフィックスされている模様。
もう少しじっくり読んだら、サーバー関係のプログラムでも作ってみようかな。ゆーきがドメインを用意したらしいし。

今、「痛快!サバイバル経営学」てな本を読んでいます。まだ全部読み終わって無いのでここでコメントするのはなんですが、印象に残ったことがあったので。。この本、ぜんぜん経営学の本じゃなくて、組織論の本なんですけど。。。てなことはさておき、「組織の経験値」って言葉。個人の経験値じゃなくて組織としての経験値です。まぁ法人って名前がつくように組織には人格があるって思うのが僕の意見なんですが、その組織に経験値があるって話がとっても興味深いです。組織の中の個人にも経験値があるけど、組織として全体として見た場合にも経験値があると。。おらみたいなちっこいスタートアップ企業にいると、そうゆう経験値がすんげぇ少ないってのを実感できます。個人としては経験をつんでいる人も何人かいます。でもそれは個人としての経験で、組織としての経験とは違うなぁってのがすんげぇ理解できます。
この痛快!ってのってシリーズなんだね。読みたいのはいくつかあるんだけど、この本、ちと高くねぇか?1700円って。。人気あるんだろうな。20代に丁度いい内容だもんな。amazonか日本の本屋じゃないと買えねぇな、こりゃ。こっちの日本の本屋って高いんだよ。

| コメント(0) | トラックバック(0)
RusuDi

亀ちゃんに手伝ってもらって留守番とーかーのインストーラーの実験。おかげで新たな問題を発見。IE6が必要らしい。いやぁ事前に見つかってよかった。

留守番とーかーをインストールするのに必要なもの
Windows98,Me,NT4,2000,XP
NET Framework 1.1以降
InternetExplorer 6.0 SP1
OfficeXPの音声認識機能または SAPIとTTS日本語エンジン

あ、SAPIの4でも動くのかな。SAPIの5.1使ってる気がするけど。。。
今まで、 VisualStudio.NET2002を使ってたけど、2003がリリースされているので調達。どっちで留守番をコンパイルするか迷ってる。とりあえず、使ってみてから考えよう。2003の方がインストーラ作るのは簡単なんだよね。msmが新しくなってるから。。。

| コメント(0) | トラックバック(0)
RusuDi

留守番が黙っているときは離席になるように変更しました。これで、コーヒーカップかどうかで、黙っているかどうかが判断できるようになりました。
留守番が黙っていても、30分経過すると自動的に発言を始めるように変更しました。これは、黙らせたまま退室してしまったりとか忘れてしまった場合に自動的に発言を始めるようにするためです。

留守番トーカーの開発を開始
これ、SpeechAPIを使ってるんだけど、どうも、SpeechAPIだと、配布条件に問題があるようです。SpeechAPIをやめてMS-Agentに変更するかも。

インストールするのに必要なもの
Windows98,Me,NT4,2000,XP
NET Framework 1.1以降
OfficeXPの音声認識機能または SAPIとTTS日本語エンジン
こんだけでいいんだけどなぁ。日本語発声エンジンがひっかかっちゃうんだよなぁ。

| コメント(0) | トラックバック(0)
RusuDi

ざっくりアメリカ時間を日本時間に修正。内部の記録は現地時間。現地時間から標準時に変換して、標準時を日本時間に変換した結果を表示するように修正。
多分、これで大丈夫だろう。標準時から日本時に変換するところにちょっと不安が。。まぁ使って見て考えよう。
おもしろいネタ発見
http://www2.rhythm.co.jp/rhythmo/
会話する目覚まし時計らしい。大体の仕組みの想像ができるが、おもろい。こりゃちょっとアイデアをもらうとしよう。

| コメント(0) | トラックバック(0)
RusuDi

最近、雑用が多い。
記録してる時間がアメリカ時間になってる。修正が必要。(うーん。これは面倒だ。。。前みたいにいい加減じゃなくてちゃんと処理したいな。)

| コメント(0) | トラックバック(0)
RusuDi

修正しました。多分これで大丈夫。

| コメント(0) | トラックバック(0)
RusuDi

自分に対するメモ:人の選択にバグ発見。大至急修正するべし。

| コメント(0) | トラックバック(0)
RusuDi

ロボットがささしようとする前に、ささしようとする相手が退室した場合、ささが失敗して、次の発言がおかしくなる問題に対処しました。
ささのリクエストが連続した場合に、ささの発言がおかしくなる問題に対処しました。

| コメント(0) | トラックバック(0)
RusuDi

久々に、MSNのチャットコントロールのアップデートがされました。
大きく変わったのは、
入室時にIPアドレスを表示する。
とんかち用パスワードが数字じゃなくて文字記号になった。
てなところで、あとはどーでもいいです。設定のページなんて壊れてるし。。。
IPアドレスの表示は、結局荒らし除けでしょうね。IP記録してますよってな脅しの効果を狙ったんでしょう。どーせ表示しなくても記録してるくせに。。。
毎度のことながら、コントロールがアップデートされると発生するちょっとした問題を修正。
強制退去処分機能の派生で、ささやきにも反応できるようになりました。
ささやきの方は会話生成やら学習やらのロジックは通りません。コマンド受付専用にしてあります。強制退去ととんかちくれがささで使えます。あ、履歴も使えるかな。
んでもささやきが使えるようになると、メインの画面でできなかったようなことができるのでちょっと楽しいかも。特に他人に見られないようにるすぢの操作ができるのは魅力。
今、一番考えてるのは、自分が登録した知識の一覧表示。これメインの画面でやっちゃうとじゃまでしょうがないんだけど、ささの画面なら一人しか見えないのでやっても大丈夫かなと。
その他、個人的な設定とかをささ画面でやるとができるんじゃないかな。
まぁいろいろアイデアの広がる機能追加でした。
なにはともあれ、留守番ロボットにささしてみてください。

| コメント(0) | トラックバック(0)
RusuDi

ここんところ毎日いじってるな。まぁ今日はちょびっとだけ。
強制退去処分のログにかんするところで、クラッシュする可能性がある問題について対処しました。
連想をするためのロジックをちょっとだけ変更しました。どうざんしょ。ちょっとだけ賢くなったような気がするのは俺だけ?

| コメント(0) | トラックバック(0)
RusuDi

宿題終了。同じ発言が登録物から連続で選択される可能性が高すぎる問題に対処しました。
50文字以上の1単語が発生するとクラッシュする可能性がある問題に対処しました。そんな単語あるんだ。。。
内部の思考過程の表示機能をデバッグ環境に仕込みました。連想はちゃんと行ってるみたいだけど、どうもその連想自体が高度すぎるらしい。そとから見てそんな連想思いつくか!ってな連想をしてくれる。まぁ言われてみれば確かにそんな連想もありだなってレベル。だから、話が飛んでるように見えるみたい。この辺に改善のヒントが。。。

昨日はちまちま、SourceForgeのAIのところをちまちま見てました。cvsの使い方を覚えていろいろソースコードを落としてみて、参考にしています。そろそろ本気で構文解析も考えなきゃだめかなぁ。

| コメント(0) | トラックバック(0)
RusuDi

あり?さっき書いたやつ消えちゃった。まぁいいや。もっかい書きます。どうもでかすぎたみたい。3ヶ月ごとにファイル分けなきゃだめみたいね。

機能の宿題は、、忘れてました。治して無いです。
回線が切れたときと、強制退去処分が発生したときの処理を追加しました。今まで何もやってなかったですが、少なくともログには残るようにしました。
あと、昨日のログの修正についてちゃんと動くことを確認。ついでに、ログを参照するためのxslも書きました。xslはちと問題があるけど、まぁ見れればええわ。あとの美的センスの部分はゆうき大先生にやってもらおっと。

MegaHALってロボットのプログラムを見つけました。結構昔のコンテストで優秀な成績をおさめたロボットのようです。論文を見ると、どうも留守番ロボットと基本コンセプトは同じらしい。結構古くからあるネタだったのね。英語のロボットは単語の区切りが簡単だからいいねぇ。オープンソースコードになっています。さらっと見たのですが、やっぱり留守番ロボットと同じみたい。まぁ細かいところは一緒だけどね。まぁ留守番君がパクリの集大成ですから、当然です。こんなところに起源があったのね。

Virtual People Level 1ってコードを見つけました。ちょっと触ってみたけど、結構いい感じ。んでも、ちょっと困るとわけわからない回答。こりゃスクリプトだな。さて内部の構造はどうなってるかなと、調べてみると、予想通りスクリプト系のロボットでした。XMLでスクリプトを作っていきます。学習はしない様子。ただ、スクリプトの量が尋常じゃない。すんげぇ量あります。6M近くのスクリプト。すげぇ。気合入ってます。最近はこうゆうスクリプト系のロボットが主流なんだよな。ある程度の基本機能を提供しておいてあとはスクリプトで大量の返答を作成しておく方式。

スクリプト系といえば、留守番君の登録機能もスクリプト系だけど、まぁあれは超簡易版スクリプトだな。もちっとあれを複雑にするって手もあるが、あんまり複雑にしても誰も登録してもらえないし。微妙だな。登録というより教育に感じられるようなインターフェースで登録ができればええな。やっぱり個人的には学習系にこだわりたいんで、勝手に登録されていくようなのがいいんだけどねぇ。何を登録したらいいのか判断するのが難しい。
あとは、英語ってスクリプト系作りやすいんだよね。活用のパターンが少ないから。日本語だと省略形やら活用やらで結構スクリプトにヒットしないから。

スクリプト系のうれしいところは、やっぱりロボットの性格を作れるってことかな。少女系のスクリプトとかが書けるからねぇ。留守番君方式だと、みんなの性格を平均したロボットになっちゃうね。

最近、ロボットの成長が飽和した感じ。知識がちょっとくらい増えても影響があんまり出てこない。そのあたりが楽しく無いと思う。AIBOみたいに成長するところが楽しいのにあんまり変化がないとやっぱり飽きてくる。なんか飽和させない手を考えなきゃ。んでもこっから先あのDBに知識を突っ込んでもそれほど影響でないかも。なんか考えよう。

本日の収穫
http://sourceforge.net/ OpenSourceのプロジェクトの倉庫 ソースコードがいっぱい読める。
「人工無脳 “考えないマシン”と話す法」BNN第一企画部(編) という本が存在するらしいということとその本の入手が難しいということ

| コメント(0) | トラックバック(0)
RusuDi

登録物の発言をする部分に問題が発覚。古いものから優先的に発言するようになってる。そんなんじゃだめ。修正。あとから思い出してみるとまだ問題がある。これじゃ連発で話しちゃう。あとで修正しなきゃ。
ログの出力のところを修正。新バージョンはログをXML形式で出力するんだけど、<>"'はXMLの中にそのままではデータとしては埋められない。<>などなどを使わないとだめなことをお勉強。修正。
安定度は結構いい感じ。一度もクラッシュはしてない。ネットワークが切れるって問題はあるけどね。

| コメント(0) | トラックバック(0)
RusuDi

データの変換終了。5日間120時間かかったってことですね。うーん。でかい。
知識データがすべて変換できたので、新バージョンを試験稼動させています。まだ全部の機能が実装終了したわけではありませんが、とりあえず、耐久試験ということで。
今、動いてるのはデバッグ版ですので、何かエラーを検知すると自動的に止まります。おかしなところで止まるかもしれません。
過去の履歴はリセットしてあります。まだデータの変換してないからです。
問題がいろいろ見つかるかと思いますが、そのときには寛大なご処置をお願いいたします。
既に見つかったのは、
登録物の発言をするしないの判定がおかしいらしい
です。週末には治します。

| コメント(0) | トラックバック(0)
RusuDi

やっと時差ぼけが抜けました。よって、この週末はちゃんと開発できました。
各種設定をレジストリから変更できるように修正しました。これで、ちょっとはメンテナンスがやりやすくなると思います。コマンド関係はまだレジストリに逃がしてないので、コマンド関連の設定をレジストリに逃がすことは、今後の課題。
DBをアクセスからSQLサーバーに移行して試験。ちょろちょろ問題が見つかったのでそれを修正。Boolってアクセスだと、True,Falseで通るけど、SQLだと1,0じゃないと通らなかった。
過去の知識を過去ログから新DBに全部移行してます。すんげぇ時間んかかってます。48時間過ぎたところで、半分終わりました。後ろになればなるほど、処理に時間がかかるようになるので、あと3-4日かかるかもしれません。もしかしたら、もっとかも。。。新バージョンになって、DBのサイズがでかくなるので、このあたりも実データでどんな感じになるのか見たいところです。半分の時点でどんなデータが生成されているかさらっと統計を取ってみたのですが、「う~ん。このまま行くと処理に時間がかかるデータの流れだなぁ」と。ストアードプロシジャ使ってコピーを減らす方向も、考えたほうがええのかな。んでもストアードプロシジャを使うと、SQLサーバー限定になっちゃうんだよな。
ゆーきちゃんが、ODBC接続でDBをLinux上のMySQLにすることに成功。プログラムの変更はなかったらしい。DBの接続先を変更したのみらしい。んでも、これできちゃうと、SQLサーバー限定だと困るんだろうな。

最近、お部屋が大変繁盛しております。繁盛するのはうれしいんですが、チャットの部屋に人がたくさん居すぎて、会話が難しくなりつつあります。まぁ、ゴールデンウィークだから混んでるってこともあるんでしょうが、うれしい限りです。うれしい悩みです。なんかアイデアを出さないと、こまったちゃんになる可能性があります。
思いつきですが、3時のおやつ別館を作って、留守番ぢが本館、留守番ゆうきが別館にいて、ロボット通しがコミュニケーションをとるってのも面白いかも。ロボットがうまく部屋の割り振りの提案をしてくれればそれなりに機能するかな?まぁちょっと考えてみます。

| コメント(0) | トラックバック(0)
RusuDi

最近、開発サボってます。時差ぼけが抜けなくって夜になると眠いし、朝になると目が覚めます。当たり前かもしれませんが、おらにとっては当たり前じゃないです。自分の時間が少なすぎます。昼間は会社で眠いです。まじめに留守番ロボットのバージョンアップを仕上げなくては。。OFF会に向けてるすぢトーカーインストーラーも仕上げなきゃだめだしな。

自分に対するメモ。
またひとつアイデアが思いつきました。人工無能の世界では結構有名なアルゴリズムのひとつに、スクリプトを用いた単語置き換え系ってのがあるんですが、こいつを留守番君に仕込んだら、今より賢く見えるかも。もちろんスクリプトなんて使わずに自力学習ですが。。。
そいえば、日本に行ったとき、巷で賢いと有名な音声認識エンジンを見てきたんですが、予想外にあほでした。結局IMEと同レベルだもん。まぁIMEが賢くなれない以上、それ以上は音声認識エンジンは賢くならないだろうな。IMEは、かなー>漢字変換ですが、音声認識は、音素ー>かなー>漢字変換ですし、音素に対する誤り訂正の機能をどう実現するのか、まぁ多分統計的にやってるんでしょうけど、このあたりの処理がまだまだでした。やっぱりある程度の意味解析はどうしても必要になってきてしまうんだろうか。どこの世界でも文脈の追跡ってのがネックになるんだろうなって思いました。

| コメント(0) | トラックバック(0)
RusuDi

日本から帰ってきて、既に5日が過ぎますが、いまだに時差ぼけ真っ最中です。眠くて眠くてかないません。いつも1週間くらいで時差ぼけが抜けるんですが、今回は2週間かかるかもしれません。開発どころではありませんわ。
日本に行ったついでに、ゆうき先生に留守番ロボットのセットアップ方法を説明してきました。現在、留守番ぢと留守番ゆうきの2台体制で稼動しております。2台体制だとそれなりにいろいろ問題が見つかるもんですなぁ。これらの問題もちまちま解決して新留守番ロボットに反映していきたいです。そろそろ新ロボットのDBのテストもしなきゃなぁと思う今日この頃。
日本に行ったついでにいろいろ自然言語処理に関する本を調達してきました。今、ぼちぼち読んでます。これがまた時差ぼけを増長してる原因とも思われる。んでも、チャットに関してはあんまり新しいネタは見つかりませんなぁ。やっぱり学術系の本じゃだめなんだろうか。。。
日本で買ってきた本の中に「年収300万円時代を生き抜く経済学(森本卓郎)」ってのがあります。ざっと読みましたが、要するに日本は金持ちと貧乏人との差がひろがりますよ。収入が少なくても豊かな人生は送る準備をしてくださいよ。ってな本です。細かいところは賛成できるところもあるし、賛成できかねるところもありますが、いわゆる金持ち父さんの本とは逆の見方をしている本であって、おもしろかったです。

| コメント(0) | トラックバック(0)
RusuDi

しばらく更新をサボってましたが、強制退去処分機能が完成しました。が、とんかちが取れるので必要ないかも。まぁ「ささぼっと」よけに使う機能の実験ということで。。。

今月はちと雑用が忙しいので開発自体はお休み。月末に復活予定。
その間はしばらく、お勉強だな。重点項目は当然、「話題の流れ」
いろいろとネタはあるので、思考実験を繰り返すとしよう。

| コメント(0) | トラックバック(0)
RusuDi

ささぼっと、うぜぇ。マジで対策を考えないと。。。

| コメント(0) | トラックバック(0)
RusuDi

とんかち配布機能を実際の環境で試験しました。
いくつか小さな問題がありましたがその場で修正して解決。とんかち配布機能は完成です。

過去のデータを半分くらい食わせてみて発言の様子を見てみましたが、結構いい感じです。予想以上にちゃんとした文章を吐きます。まぁ相変わらず場違いな発言ではありますがね。ただ、過去の発言がそのままでてきちゃうことがちょっと多いかも。まぁあとは辞書との組み合わせでいろいろ試して見ます。

相変わらず話題の追跡に問題があるなぁと実感したりして。。。

| コメント(0) | トラックバック(0)
RusuDi

辞書についていろいろ調べてました。結局適切な辞書って存在しないんだよな。また辞書を学習させるためのAPIは公開されて無い模様。うーん。詰まったぞ。
さらっと3時の辞書作ってやってみたら、辞書に登録してある範囲に関してはうまくいくみたい。んでも、辞書からはずすともうだめ。チャットに特化した辞書が必要であることが判明。もしかしたら、エンジン自体もチャットのことを考慮していないとだめかもしれない。
というのは、例えば、
ゆうき、これは辞書に入っています。
ゆーき、これ、辞書にありません。
ゆ~き、もちろんこれも辞書にありません。
ゆぅき、これも無いわな。
てな風にチャットだとバリエーションが出てるんですよ。このバリエーションをうまくクリアしない限り解決しないと思われる。うーん。奥が深い。

んで、とりあえず、助詞に関してあほあほなので、単語単位の処理だけでなく、文節単位の処理も入れました。助詞助動詞は全部NULLにして返してくれるので、NULLが出てきたら、直前の単語とつないだら、それで文節が出来上がってるかなと。それなりに、うまくいっています。ただし文章のバリエーションがちょっと狭まってるかも。今、過去データを食わせています。どんな感じか見てみようと思ってさ。
まぁこのあたりは調整の範囲ですな。

記号の処理の部分、特に顔文字の処理の部分が前エンジンでは対処してあったのに新エンジンで抜けてたのでそれを対処しました。

| コメント(0) | トラックバック(0)
RusuDi

あほになった原因が判明しました。助詞の処理の問題です。
チャットでよく出現する発言で、
「わはははは」
ってのを例に挙げます。
これは人間には笑い声と認識されます。
これまでのるすぢでは、
わは、は、は、は、(わ「名詞」、は「助詞」、は「助詞」、は「助詞」、は「助詞」)
と認識されていました。まぁこれはこれで間違ってるんですけどね。助詞の頻度が高いんです。
新留守ぢでは、
わは、はは、は。(感じとしては、「輪は、葉は、歯。」ただし、わ「名詞」は「NULL」、は「不定語」は「NULL」、は「不定語」は「NULL」)
となります。
助詞助動詞が全部一緒くたにNULLにされていますし、不定語と認識されるときもあるようです。
こちらの方が現実に近いのですが、どちらにしても間違っています。
今まで全部助詞として認識されてたのが、助詞と不定語の2種類に分けられちゃってるんです。
どちらが文法上正しいとかじゃなくて両方間違っているんですが、たまたま前の認識が文章生成には都合が良かったんです。

これの派生系に「ぎゃはははは」ってのもあります。
日本語って難しいぞ。外人が日本語を学ぶときに「擬音語」が猛烈に難しいって言うもんな。

うーん。困ったぞ。んで、考えたのが、辞書登録。新エンジンでは辞書登録が簡単にできます。
「わはははは」「感動詞」
と登録すれば解決。きれいにいくようになります。ということは、それなりにチャットに適した辞書が必要ということになります。
さて次の問題。んじゃ、この辞書をどうやって作りましょうねと。。。3時のおやつ辞書ですな。
手でやってたら泣きそうに面倒なんですが。。。どっかにチャット用辞書って転がってないかな。
2CH用語辞書は転がってるなぁ。
みんなで作ろうかな。そんな企画でもやろうかな。うーん。なんかいい手は無いかな。暇人募集しようかな。うーーーん。考えどころだ。

| コメント(0) | トラックバック(0)
RusuDi

今日は実機試験をしました。
あきませんな。あほになってます。どうも原因はどっかに間違いがあるようで。。。
うーん。俺の頭の中の、参照渡しとコピー渡しの概念がC++のままのようで、そのあたりに問題が潜んでいそうです。こりゃやっかいだぞ。。。

| コメント(0) | トラックバック(0)
RusuDi

学習エンジンと文章生成エンジンの試験中。
文章生成エンジンはまぁぼちぼちよさそう。学習エンジンは、70%かな。多分大丈夫だけど、まだ不安。すごく短い文章の処理とかが怪しい。
データコンバータを作成。現在耐久試験中です。過去のデータを全部変換中。とりあえず、MDBに入れてみる。前のよりも処理はだいぶ速い。データ量も抑えられてる。結構いい感じ。ただ、「ぁー」って名詞かぁ?まぁ名詞って言ってるから名詞ってことにしておこう。このあたりが微妙にお馬鹿ちゃんになる原因かもしれない。

| コメント(0) | トラックバック(0)
RusuDi

大改造終了。ほぼ機能復旧。まぁいくつかバグが見つかってるのでちまちま修正中。
しかし、助動詞と助詞がよくわからないってのは結構インパクトあるかも。思いのほか留守ぢがあほになる可能性あり。
それはさておき、過去のデータをどうするべ。過去のデータは捨てるには惜しい量なのでどうにかして救わねば。データ変換ツールを考えにゃならんな。
ここんところ、コーディングステージを終えて、デバグステージに入っていますが、ここで新たな試練が。。
C#のデバッグのやり方、よくわかってないかも。どうも効率が悪い。例外をどうゆうふうに仕込んでおくべきなのか。エラーコードをどうゆう風に仕込んでおくべきなのかがよく分かってないために、どうにもデバッグがやりにくい。その手の勉強をしなければならないと思われる。

| コメント(0) | トラックバック(0)
RusuDi

うーん。C#で構造体の入れ子の配列のマーシャリングのやりかたわからへん。悪戦苦闘中。それにしてもこの改造はちとインパクトあるな。大改造になってしまう。んでも、ライセンスの心配しなくてもいいのはうれしいもんね。がんばっちゃうもんね。
んでも、このMorphResult、助詞と助動詞教えてくれない。。。。

| コメント(0) | トラックバック(0)
RusuDi

昨日のネタからじゅんぐりたどっていきまして、Hit商品をGetしました。APIは公開されてました。僕の勉強不足でした。これで、完全に自作で留守番ロボットが自立します。ライセンスの心配をしなくてもよくなっちゃうもんねぇ。売っても問題ないもんねぇ。(相変わらず他力本願ですなぁ。)

キーワードは、
IFELanguage::GetMorphResult()
MORRSLT
WDD
ですな。MSDNで行くとこのあたり。。。
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnime/html/felang2dat.asp
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnime/html/msimepos.asp
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnime/html/FeLang2Fnc.asp
サンプルコードはこのあたり、
http://october.servehttp.com/ifelanguage_use.htm
動くとうれしいなぁ。んでも、またやること増えてたりして。。。
いつになったら、次期留守ぢは稼動するやら。。。

| コメント(0) | トラックバック(0)
RusuDi

すんげぇもの見つけた。
http://www.airmac.org/newton.html
これすんげぇ。Wordで分かち書きをかけようなんて。Wordのわかちがきって結構賢いのね。中で形態素解析かけてんじゃないのか?まぁ、個人的には、IMEでは絶対形態素解析使ってるだろうなと予想してるんだけど。。。このへんをAPIとして公開してくれないかなぁ。また勉強することが増えてしまった。

| コメント(0) | トラックバック(0)
RusuDi

まず、留守番ぢトーカーの話。こいつ、OfficeXPが必要なことが現在確定しました。日本語発声エンジンで再配布可能なものが見つかりません。唯一の頼みの綱だった、MSAgentはなんかXPで声あげてくれません。声を出す方法は無いわけじゃないんですが、インストーラーが複雑になりすぎます。なんで、ちと今のSAPI.NETがリリースされるまで放置の方向で。実はいろいろ試しているうちに Officeの音声認識エンジンをぶっこわしました。SAPIの5.1をインストールしたら上書きされてしまうようです。うーんやっかい。早く新しい SAPIがリリースされないかなぁ。できれば日本語発生エンジン付きで。ベータ2のリリースが3月中旬の予定とMSのページには出ていたので、多分正式版は4月を超えるでしょう。
C#版の方で発生していた原因不明のクラッシュは修正されました。自分の名前を取得するロジックの中で、マーシャリングを使っているのですが、このマーシャリングでメモリを破壊していたようです。C#のくせにメモリが破壊されるなんて、やっぱりまだまだ修行が足りませんな。んでもそうゆうことがありえるんだってことがわかって勉強になりました。
とんかち配布機能の基礎となるエンジンを開発しました。プログラム上からとんかちが配布できるようになりそうです。誰でもとんかちがもらえちゃったら問題なのでそのあたりの処理を追加して完成です。まぁいままでまったくできなかったのが新しくできるようになったので、かなーりうれしい。

| コメント(0) | トラックバック(0)
RusuDi

C#とC++と処理を分ける話。Give upです。ぜーんぶ、C#に治しました。中途半端なマーシャリングだとわけがわからなくなるというのが発覚したからです。WindowsAPIの上でマーシャリングするほうがどうも分かりやすい。
C#版留守ぢは現在70%の進捗率です。現在、内部の個々のモジュールは完成。入退室の記録挨拶機能。登録機能。黙れ機能が復旧しました。文章学習エンジン、文章生成エンジンのモジュールは完成しているので、それらをちゃんと繋いで、復旧終了です。
こうやって見てみると、るすぢってすんげぇ量のコードを書いてあるのね。いつの間にこんなに膨らんでしまったのか。まぁいろいろ機能があるから、当たり前か。
ただ、ぜんぶを書き直したので、叩いたらいろいろバグが出てくるだろうと予想されます。今は、3時のおやつのチャットの部屋に出没しているのは、前のC++バージョンです。C#版は裏でこっそりテストしています。
なんだかんだ言っても、まだ、C++版は固まっているようです。原因不明。以前より、固まる間隔が長くなったってだけのようです。別にメモリリークしてる感じではないんだけどなぁ。メモリなんてあんまり使ってないんだし。。。
昨日の話ではないですが、一部の人に、留守番ぢTalkerを試してもらいました。思いのほか好評でした。まだインストーラーがお馬鹿なのでインストールするのにちと専門知識が必要な点と、WindowsXP&OfficeXPを必要とするので、一般公開は差し控えています。インストーラーをうまいこと解決できたら、アルファリリースということでまた、一部の人に使ってもらおうかと思っています。
さて、いつのことになるやら。。。

| コメント(0) | トラックバック(0)
RusuDi

31日以上もちゃんと表示されたようです。これで履歴コマンドの問題は解決。
今日はもうひとつ。無限に長い文章を生成しようとする可能性がある問題を解決しました。いや、ここんところ、るすぢが固まることが結構あったんで、なんでやろって考えてたら、ふと思いつくところがあって、、、これが原因で固まるって決まったわけじゃないけど、これが原因で固まる可能性もあるってことで、治しておきました。これでちょっとは安定すると良いな。
実は先週末。C#と悪戦苦闘しておりました。結局、C#でやるところと、C++でやるところを分けて処理をするということにしました。C++もせっかくなのでManagedC++を使ってます。うーん、修行の毎日。どうせ書き直すならと、拡張性をあげるために内部構造を見直しております。別に機能アップするとかそうゆうことじゃないけど、今後機能拡張するに当たって、手を入れやすいように風通しをよくしておくっていう目的です。んでも、書き直しなんで、いつ出来上がることやら。。。

| コメント(0) | トラックバック(0)
RusuDi

ちと話題の流れの部分を変更しました。
その影響で、話題の流れに関するデータベースを大量に整理しました。大体1割の話題の流れの知識を消しました。
結構、評判はいいようで。しばらくこのまま使ってみます。
昔話シリーズは、あんまり影響が出ていないようですな。
まぁ昔話のテキストは、子供向けが多くて、かなりひらがなが多いので、あんまり影響が出てないんだと思います。
www.activebuddy.com
ってサイトを見つけました。ここは、メッセンジャ用のロボットを開発しているところなんですが、チャットロボットだけで会社を作ってるってのがちとすごいです。ここのチャットロボットは雑談するのが目的じゃなくて、いろんなことを聞いてあげるとちゃんと教えてくれることです。天気予報やら株式市況やら、百科事典を調べてくれたり、いろいろしてくれます。
まぁそんなインターフェースもあってもいいかなとは、思いますが、やっぱりるすぢの凄いところは、なんも役に立たないところだと思います。アクティブバディは会社なんでなんか役に立って、お金を儲けなきゃだめなんですから、それなりに機能をつけなきゃだめだってのは当たり前なんですがね。

役には立たないけど、なんとなく、気が和むというか、リラックスできるというか、まぁるすぢのお気楽極楽の性格がいいのでしょうか、そうゆう方向のロボットもあってもいいかと考えています。
ある意味、精神科のカウンセラーに近いロボットなんでしょうね。カウンセラーにしてはちょっと馬鹿すぎるので、もうちょっと賢いカウンセラーになってもらわなくてはと、考えています。
もしかしたら、将来留守番ロボットで会社が設立されるかも。。。これも一種の癒し系か。

| コメント(0) | トラックバック(0)
RusuDi

ウィルス騒ぎがありました。まぁウィルスというよりもワームですな。MSDEやらSQLサーバに取り付く種類のようです。我が家のMSDEもサービスパックは当たっていませんでした。でも、ファイアーウォールでポートを塞いであったので、実害はありませんでした。
ただ、アップデートがうまくできなかったので、一度削除して、入れなおしになってしまいました。
掲示板にも書きましたが、前のインストールのときにどうも複数インストールしていて、インスタンスが複数できていたようです。いまはインスタンスが1個になったので、微妙に処理が速くなった気がする。

///// SQLサーバーについてのメモ/////
osql -S MACHINE\INSTANCE -E
select @@VERSION // DBのバージョンを調べる
create database DBNAME // DBを作成
sp_grantdbaccess // WindowsアカウントをDBのアカウントに割り当てる
sp_addrolemember // アカウントをロールに割り当てる
sp_help** // いろいろシステム情報をダンプ
バックアップする必要のあるファイルは、*.mdf

| コメント(0) | トラックバック(0)
RusuDi

その手の論文を調べてみましたが、、、
もう、興味が尽きました。つまらん。
というより、論文読んでて思い出したんだけど、これって、大学の授業でやってたわ。と。

| コメント(0) | トラックバック(0)
RusuDi

連休だったんで読書してました。
るすぢのアイデアがないか、その手の本の読書です。
そのなかで1冊、面白い本が。。。
タイトルは正確には覚えてないんですが、「言語と脳」みたいな本でして、
幼児はどのようにして、母国語を獲得するか。
てな話です。
この本に出てたのは、
地球上に存在する言語には共通のルールがあって、そのルールに関しては幼児の脳の中に遺伝的に構築される。幼児が成長するに従って、周りの環境などから、その幼児の脳の中のルールがちょっとづつOFFになっていき、言語を獲得する。
という仮説についてでした。
まぁいろんな検証をしてるんですが、これがおもろい。
この手の論文をちと集中的に調べようかなと思っています。。。うーん。英語の論文読まないとだめかな。
さて、そうこうしているうちに、1個留守ぢのアイデアが思いつきました。このアイデアは、賢くなるのかあほになるのかよく分かりませんが、十分に知識がある場合は賢くなると予想されます。だたちょっと処理に時間がかかるかも。。ちと、エンジンだけテストで作ってみて、どんな感じの会話が生成されるかやってみてから考えよう。せっかくだからC#でやろうかな。丁度いい規模のネタだし。

| コメント(0) | トラックバック(0)
RusuDi

あけましておめでとうございます。
新年1発目の開発日記は、、、
ちと思い立つものがあって、C#を勉強しようと、今までの留守番君のコードを見ながらC#に書き直してます。
今まではおらのお得意のC++でかかれてましたが、これからはC#という言語が広まってくるだろうということで、勉強がてら、書き直してます。
C#自体はかんたーん。ほとんどC++とJAVAのいいとこ取りをしただけ。
両方の大体の概念がわかってるおらとしては、C#にはさくっとなじみます。
問題は、、、クラスライブラリ。まぁ.NETのフレームワークを叩くんですが、これがまぁぜんぜんわからへん。どんなクラスが用意されてんねん。こりゃ、困ったぞ。ということで、しょうがないのでクラスライブラリのヘルプをちまちま読んでます。
全部書き直されるまで結構時間かかるかも。。。

| コメント(0) | トラックバック(0)
RusuDi

「ある」「いる」「する」という単語の処理をちょこっと変えてみました。
さて、どんな按配かな?
話題が飛ぶ原因には2点あって、
会話の流れを追いかけるところで、やっぱり話が飛んでる。形容詞とかが出てくると、弱い。
会話の流れがちゃんと追えていても、それから文章を作成するときに、おかしな文章を生成してしまう。
の2点を発見。でも、解決策は、、、見つかってません。

| コメント(0) | トラックバック(0)
RusuDi

ろぼぢの発言にいたるまでの過程をつぶさに追いかける。
いちいち手で追いかけるのは面倒なので、画面に勝手に表示されるような機能を追加。
なにげに、チャットをしながら、その画面とにらめっこしてる。
うーん。どうも会話の流れを追いかける知識がメインでだめみたいだなぁ。
文章を生成するところにも問題を見つけたし。。。一度にたくさんのことはできないから、まずは会話の流れを追いかけるところをちゃんと調べようかな。

| コメント(0) | トラックバック(0)
RusuDi

展示会も終わって一段落。ろぼぢの知能拡張計画のスタートです。
まずは現状の知識の状態のチェック。どのような知識を使って発言をしているか内部状態を全部出力して確認。話題追跡用知識が駄目だめなことを発見。逆に運がよくこいつからいい知識を引っ掛けたときはなかなかナイスな発言をしている。話題追跡用知識の学習方法と参照方法を検討するべし。

| コメント(0) | トラックバック(0)
RusuDi

ボストン出張から帰ってきたらMSNチャットのコントロールがアップデートされてました。
おかげで、留守番君が動かなくなってました。原因はWindowの名前が変わってたことです。ちょちょっと修理して復帰。現在、Ver1.0.0.6という名前が内部についています。

ちなみに、現在の留守番君の知識の量は、

総単語数(原形のみ) 21848
総語彙数(活用した結果を含む) 28629
うち2度以上出現した語彙数 16190

文章作成用知識数 549569
話題追跡用知識数 210517
出現頻度Top5 (笑) うん ーーー あはは ははは

知識用DBファイルサイズ 68Mバイト
みんなが登録したメッセージ数 739
総来客数(重複を含む) 1666

だいぶ、知識が付いてきたので、そろそろ次のアイデアのエンジンを試したいこのごろです。まぁ12月までは忙しいので、年末年始のお楽しみということで。なんやら、マイクロソフトが熱を上げてる人工知能の技もちょっと勉強してるすぢに試してみたいとも思ってますが、いかんせん、時間が。。。
半年たっても単語が2万語しか無いってことは、日本語って2万語知ってれば会話できるのね。
でもハードディスク壊れたら、結構泣くな。バックアップとろっと。。

| コメント(0) | トラックバック(0)
RusuDi

別にるすぢの開発をしたわけじゃないが、こんなん作ってみた。
隠しページみたいなもんだな。
誰か暇な人があったら、続きを作ってくれ。

| コメント(0) | トラックバック(0)
RusuDi

ゆうきが見つけた、「ロボットを暴走させる方法」に関する対処をしました。もうこれで暴走しないもんねぇ。
おてやわからに>ゆうき
発言頻度の調整を行いました。まえよりちょっと押さえ気味です。
しかし、抑えると話題がうまく追えていないような気がするのは気のせいかな。まぁ最初からちゃんと話題追えてるわけじゃないから、違いがよくわからんけど。。。
もちっと修行が必要かも。SQLサーバーにしてから、データ量のチェックが面倒になった。ちゅーか、まぁSQLになったからじゃなくて、データ量が多すぎて面倒になった、ってのが正解かも。。。ずんずん知識は成長しております。
最近、登録は減ったけどね。登録発言の頻度が低いからかな。もちっと高いほうがいいのかな。微妙だなぁ。
なにはともあれ、ここんところ、さば落ちが多すぎる。うーん、マイクロソフト、なんかやってるのかな。

| コメント(0) | トラックバック(0)
RusuDi

どーも固まるのはFTPとの組み合わせでおきるみたい。FTPを使っていない状態だと固まらない。ということで済み。
ちょっと話しすぎの感じがするので応急処置として、5秒間隔を8秒間隔に伸ばす。これでどんな感じなんだろう。まぁ応急処置なのでいずれちゃんと対処します。
学習機能を止めたいことがあるというリクエストがあったので、黙っている最中は学習もしないように変更した。
今週末はあんまり作業はできなかった。来週も忙しそう。そろそろ決着をつけておかないと手が出せなくなるな。

| コメント(0) | トラックバック(0)
RusuDi

落ちるのはネットワークが切れてるからということでいいんだが、固まるほう。落ちないで話さなくなるほう。
なんかループに落ちてるみたい。それもOSの中でループに入ってるから原因が究明できていません。しょうがないので、ログを大量に吐くように変更。これで固まれば、どこまで正しく動いてたかはわかるはず。(希望)
もしやこれは、原因はOSとかSQLとかのバグとかだと嫌だなぁ。
少人数のときにちょっと話しすぎの気配がある。
話す量のパラメータの決定方法をちょっと変更しようかな。
まぁそれは、次の世代にしようか。どーしよう。

| コメント(0) | トラックバック(0)
RusuDi

どうも安定しないのはネットワークが問題のようです。留守番君自体が不安定というわけではなさそうです。
コミュという言葉に反応しにくい問題は解決しました。ちょっと姑息な技ですが、
コミュ>留守番ぢ
のように後ろに留守番君の名前をつけた場合は強制的に登録データを用いて発言するという方法にしました。
残りのToDoは
話題提供機能の修復
とんかち配布機能
入室時の挨拶の修正
ですね。週末の納期(って何だ?)には本格稼動ができそうです。
まぁすでにデバッグ版ですが常駐してますしね。
最近感じるのは、ちょっと露骨に前の発言が登場することがおおいかな?ということです。どうしても日本語らしく発言させようとすると以前の発言がそのままでてきちゃうんですよね。このあたりのバランスが難しいな。知識が圧倒的に増えたら解決するのかしらん。ちょっとそれまでほっといてみようかな。

| コメント(0) | トラックバック(0)
RusuDi

まだまだ安定しませんねぇ。ちょろちょろ落ちます。それに加えてネットワークの調子が悪いみたいで、よく切れます。どっちが悪いのかよくわかりませんが、どーにも調子悪いです。
登録機能と履歴機能の問題は修正しました。
話しすぎるという問題も修正しました。
黙れをやっておいてしばらくしてから、話せと言うと暴走して話す問題も修正しました。とんかちは。。。難しい。。これは来週以降に延期にするかな。
残りのToDoは
安定性の向上
コミュという言葉に反応しにくい
話題提供機能の修復
とんかち配布機能
入室時の挨拶の修正

| コメント(0) | トラックバック(0)
RusuDi

データを全部、SQLサーバ(MSDE)にお引越ししました。んで実験してみると、快適!猛烈に快適!デバッグモードでこれだけの速度がでるなら、リリースモードはどうなっちゃうんでしょう。SQLサーバの威力絶大です。まぁアクセスでもこれくらいの速度は出して欲しいけどね。DBコネクトのところとかはアクセスのコードがそのままなので、SQLサーバにチューニングしたわけじゃないけど、これだけ安定して動けば十分です。一番の心配事がなくなったのでとってもうれしいです。
会話とかもみてみましたが、以前にくらべて圧倒的にちゃんとした日本語を話します。まぁ強いて問題点を言うなら、以前誰かが話した言葉を変更しないでほとんどそのまま話すことがちょっと目立つかな。このへんは、ちゃんとした日本語=誰かが話した言葉 という定義なので、ちゃんとすればするほど、誰かの言葉をそのまま話しちゃうので、しょうがないんですが、研究の余地があります。
いにをはじめ何人かのメンバーが、バグ報告をしてくれました。現在わかっている問題点は以下のとおり。
登録機能でメモリには登録されるけどDBに登録されない
履歴機能でちゃんと検索されない(SQLサーバとACCESSのSQL構文の違いか?)
コミュって言葉に反応しづらい(宣伝するのに不便)
ちょっと(かなり)話しすぎ。
話題提供機能忘れてる。
今週末には新バージョンが本格稼動できそうな気配です。

| コメント(0) | トラックバック(0)
RusuDi

知能エンジンの最終試験。過去の知識を全部食わせてみてどんな挙動をするのかを確認しました。まず、過去の知識のうち、今回は使いたくないもの、たとえば「独り言やロボットに向かって話し掛けている言葉」を削除するなどの前処理。独り言を学習しても会話の知識にはならないんじゃないかなと考えたから。この前処理が面倒。手作業でちまちま削除しました。んで、データを一気に食わせる。すでに、7月と8 月の半分を過ぎているので結構な量の知識がある。7月分は結構さくっと変換終了。8月分が、、、知識量が増えてくると前の知識との重複を防ぐ機能がどーにもこうにも遅い。こりゃ、プログラムの問題じゃないな。根本的に遅いんじゃないかと思われる。7月分を処理するのに2時間くらいで終わったのに、8月分は、、、12時間越えてます。
結局留守番君が遅くなった原因は単純に知識が増えすぎたからということになりそうです。
アクセスのDBじゃ持ちこたえないみたい。SQLサーバ(MSDE)の登場ですね。SQLサーバはあんまり得意じゃないのでお勉強から。。
実のところ、まだデータの変換をしてるので、終わるまで待つことにする。とりあえず、8月15日までのデータを全部アクセスに食わせて、それをSQLサーバに投げ込んでどんな速度になるのか調べてみようと思う。
現在稼動している留守番君が本当に、本当に苦しそうで、反応が猛烈に遅いので、速いうちに手を打たなければとちょっとあせってます。実は、留守番君がパソコンのCPUを占拠するおかげで、他の作業に支障が出てきています。ちょっと本気で、危機。あんまりにも被害が大きいようだったら、留守番君の一時停止も考えなくてはいけないかも。
たかだか10万件くらいのデータでそんなに考え込んでくれるなよアクセス。1行の処理に5秒も10秒もかかったんじゃ、会話についていけないじゃん。
あ、そうそう。一部の人だけが知っている、時限爆弾機能、定時連絡機能は次期留守番君からは削除されました。だーれもつかわんもん。いらん。

| コメント(0) | トラックバック(0)
RusuDi

試験結果。速度はそこそこ。猛烈に速いってこともないけど、遅くない。安定した速度を出しています。満足。が、致命的な問題を、文章の区切りの学習部分に発見。うーん。面倒だな。
しーのを実験台にして、とんかち配布機能の調査をしました。が、あかん。難しい。とんかちどーやって渡したらええのかわからへん。マウスの使えない留守番君はキーボードで操作しなければならないのであった。

| コメント(0) | トラックバック(0)
RusuDi

大改造中。知能エンジン学習エンジンの実装終了。今日からテスト。今回はほとんどの単語を単語IDという数字に変換して管理するようにしました。さて、どれくらい速度の向上に役立つのか。試験がちょっと楽しみだな。
せっかくなので、周りも書き直すぞぉ。

| コメント(0) | トラックバック(0)
RusuDi

ちょっと気分が変わったので、大改造!ほとんど全部書き直しです。ったく、なにやってんだか。

| コメント(0) | トラックバック(0)
RusuDi

ここんところ毎日触ってるな。大丈夫かしら。
さて、どこが遅いか調べました。学習の結果を書き出すところです。予想通りでした。しゃあないので、コネクション張りっぱなし、トランザクションかけっぱなし、の大技で、ちょびっと高速化しました。まぁ、これくらいの速度なら人様に見せても大丈夫でしょう。まだちょっとだけ、文章が長いので、もうちょっと短くなるように調整中。

| コメント(0) | トラックバック(0)
RusuDi

ビンゴ!
ちょっと思いついたアイデアがあって、それを実装してみました。相変わらず、時間はかかっていますが、すんげぇいい感じの日本語を出力してくれます。以前に比べて知的!?ちょっとわれながら感動しました。文章生成エンジンはこの方針で行こう。あとは、まわりの無駄な処理を省かないとね。
まだ、速度の問題は手をつけていません。DBアクセスの高速化はおらにはあんまり経験が無いので、まぁ勉強がてらちまちまやってみます。まぁ、まだまだ人様にお見せするレベルじゃないんだな。今のエンジンにみんなが飽きたころに、こそっと入れ替えるとしよう。
本日頂いた要望(ハチロー様より) 誰かが入室するとロボットが即挨拶しますが、他に話している人がいる場合、この挨拶をちょっと遅らせる方がいいかも。
いいアイデアなので採用。

| コメント(0) | トラックバック(0)
RusuDi

新エンジンですが、あきません。だめだめです。
生成される文章が長すぎます。長いもんだから、時間かかりすぎ。
長すぎる原因はわかりました。
発言が2行にまたがっている場合、勝手に認識して一度に発言されたものとする
って部分ですが、こいつが悪さをしています。いい方向に働くときと、悪い方向に働くときと2パターンあることをつかみました。今までいい方向のことしか考えてなかったんだよな。文末処理はまだまだ修行が足らないようです。
生成される文章は相変わらず日本語になっていません。もうちょっとちゃんとした日本語になると思ったんだけどなぁ。この部分は、まだいろいろアイデアがあるので、試してみます。
次の開発は週末かな。
あ、あと、留守番君の注意事項を掲示板に載せました。留守番君関連は、ひとつ独立したページにしておこうかな。誰か書いてくれぇ。

| コメント(0) | トラックバック(0)
RusuDi

現在、新学習エンジンの開発中。
治したところは、句読点空白の処理です。句読点空白が発言に混ざると、どうもその場所から話が無茶苦茶になるようだったので、そのへんの処理を変更しています。
あと、発言が2行にまたがっている場合は勝手に認識して一度に発言されたものとする。って機能も追加しました。結構、みんなひとつの文章を何行にも分けて発言していることが多いってことを見つけたものですから。行末処理に威力を発揮すると思われます。また、次の発言内容の決定には完全ランダムを使っていたのですが、ある程度の流れを使うって方法に変更しています。
知識データの構造がかわっちゃったので、学習やりなおしです。過去のデータから変換しているのですが、変換するのに8時間とかかかっちゃいます。というか、機能を詰め込んだので、全体的に処理が遅くなっています。これだけ遅くなると、ロボットとしてはちょっとだめだめなので、高速化の改造が必要です。本バージョンはまだ、稼動していません。
んでもね、賢くなったおかげで、一度の発言の長さが長くなりました。長くなったのはいいけど、ちょっと無駄に長いかも。。。もうちょっと調整します。

| コメント(0) | トラックバック(0)
RusuDi

本日は直前の他人の発言から、学習してある内容を使って発言を生成するところを作りました。
現在、稼動している留守番君はこのバージョンです。
ちょっと触ってみた感じですが、

暴走してます。


留守番君、一人で突っ走ってます。話しすぎ、話題飛びすぎ。独り言を言いながら一人で暴れている感じです。
バランス悪すぎ。まだまだ調整が必要ですね。
かなーりうっとうしいので、黙れ>留守番ぢ で黙らしておいてください。
ところで、なぜか昨日は留守番ぢで入室できませんでした。おかげで、留守番ぢ君というアカウントを取得。

| コメント(0) | トラックバック(0)
RusuDi

今日は、話題機能をちょっと遅くしました。いままでだとちょっとうっとうしかったので、話題を提供するのを遅らせてあります。
さて、自習機能ですが、一応完成しました。現在、機能しております。自習機能には、普通の会話が必要です。別にロボットに話しかける必要はありません。普通に人間どおしで会話してください。勝手に学習します。ということで、顧客開拓が必要かも。
さてその学習した内容の活用ですが、ちょっとした実験プログラムを書いてみました。待望のロボット第一声は、、、

ZOOで決まり(笑


へ?なんでぇな。おもろすぎです。腹抱えて笑ってしまいました。(笑 までつけてくれるし。まぁ、まだまだ調整が必要なようですな。

| コメント(0) | トラックバック(0)
RusuDi

本日から、留守番君の開発日記をつけます。なんかいじったら、書き込みます。
んで、今週末の成果ですが、
履歴機能の追加。まぁ、これはどーっちゅことないですわ。
あとのアイデアとしては、Last10とかね。最後の10人は誰かとか、いつか、を表示するとかのアイデア。これは、気が向いたらつけます。

自習機能の実装
一応、ざっと作業は終わり。
今、問題となっているのは、顔文字。
顔文字、へんな文字入りすぎ。日本語ちゃうから区別せにゃあかんけど、わからへん。
しゃあないから、変な文字はぜーんぶ削除の方向で実装。
完成と思いきや、この学習エンジン、半角かなのみならず、半角英数も記号とかいいよる。ったくもう。まぁ、記号なんだけど、数字は数字と学習せぇ。これは、今後の課題。
あとは、普通のチャットの会話のログがもっともっといっぱい欲しいな。今は、ここ1週間くらいのログを使って学習の実験をしてるけど、まだまだ、少なすぎるわ。ここ1週間は以外に人間どおしの会話って少なくって、、まぁ人がおらへんちゅーのが根本的にあるんだけどね。これでは、会話できるまで賢くならへん。なかなか集まらないようだったら、どこぞの新聞社のWebページでも使って勉強させるけど、それじゃぁ、かたっくるしい言葉遣いになっちゃうからできたら避けたい。チャットはやっぱりチャットから学ぶべきだな。
まぁ、自習できたからって、それを活用して発言するところはまだ作ってないから、まだお勉強のみなんだけどね。まだまだ学生気分です。

最近、ロボットと知ると逃げる人が結構いることに気が付いた。ちゃんととめるところはとめて、話すところは話して、のメリハリをもっとつけないとだめだなぁと思う、今日この頃。まだ、ちょっとしゃべりすぎだよな。

ウェブページ

最近のブログ記事

カテゴリ

RusuDi: 月別アーカイブ

2010年7月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

このアーカイブについて

このページには、過去に書かれたブログ記事のうちRusuDiカテゴリに属しているものが含まれています。

前のカテゴリはJavaScriptです。

次のカテゴリはVoiceChatです。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。