すんげぇもの見つけた。
http://www.airmac.org/newton.html
これすんげぇ。Wordで分かち書きをかけようなんて。Wordのわかちがきって結構賢いのね。中で形態素解析かけてんじゃないのか?まぁ、個人的には、IMEでは絶対形態素解析使ってるだろうなと予想してるんだけど。。。このへんをAPIとして公開してくれないかなぁ。また勉強することが増えてしまった。

まず、留守番ぢトーカーの話。こいつ、OfficeXPが必要なことが現在確定しました。日本語発声エンジンで再配布可能なものが見つかりません。唯一の頼みの綱だった、MSAgentはなんかXPで声あげてくれません。声を出す方法は無いわけじゃないんですが、インストーラーが複雑になりすぎます。なんで、ちと今のSAPI.NETがリリースされるまで放置の方向で。実はいろいろ試しているうちに Officeの音声認識エンジンをぶっこわしました。SAPIの5.1をインストールしたら上書きされてしまうようです。うーんやっかい。早く新しい SAPIがリリースされないかなぁ。できれば日本語発生エンジン付きで。ベータ2のリリースが3月中旬の予定とMSのページには出ていたので、多分正式版は4月を超えるでしょう。
C#版の方で発生していた原因不明のクラッシュは修正されました。自分の名前を取得するロジックの中で、マーシャリングを使っているのですが、このマーシャリングでメモリを破壊していたようです。C#のくせにメモリが破壊されるなんて、やっぱりまだまだ修行が足りませんな。んでもそうゆうことがありえるんだってことがわかって勉強になりました。
とんかち配布機能の基礎となるエンジンを開発しました。プログラム上からとんかちが配布できるようになりそうです。誰でもとんかちがもらえちゃったら問題なのでそのあたりの処理を追加して完成です。まぁいままでまったくできなかったのが新しくできるようになったので、かなーりうれしい。

C#とC++と処理を分ける話。Give upです。ぜーんぶ、C#に治しました。中途半端なマーシャリングだとわけがわからなくなるというのが発覚したからです。WindowsAPIの上でマーシャリングするほうがどうも分かりやすい。
C#版留守ぢは現在70%の進捗率です。現在、内部の個々のモジュールは完成。入退室の記録挨拶機能。登録機能。黙れ機能が復旧しました。文章学習エンジン、文章生成エンジンのモジュールは完成しているので、それらをちゃんと繋いで、復旧終了です。
こうやって見てみると、るすぢってすんげぇ量のコードを書いてあるのね。いつの間にこんなに膨らんでしまったのか。まぁいろいろ機能があるから、当たり前か。
ただ、ぜんぶを書き直したので、叩いたらいろいろバグが出てくるだろうと予想されます。今は、3時のおやつのチャットの部屋に出没しているのは、前のC++バージョンです。C#版は裏でこっそりテストしています。
なんだかんだ言っても、まだ、C++版は固まっているようです。原因不明。以前より、固まる間隔が長くなったってだけのようです。別にメモリリークしてる感じではないんだけどなぁ。メモリなんてあんまり使ってないんだし。。。
昨日の話ではないですが、一部の人に、留守番ぢTalkerを試してもらいました。思いのほか好評でした。まだインストーラーがお馬鹿なのでインストールするのにちと専門知識が必要な点と、WindowsXP&OfficeXPを必要とするので、一般公開は差し控えています。インストーラーをうまいこと解決できたら、アルファリリースということでまた、一部の人に使ってもらおうかと思っています。
さて、いつのことになるやら。。。

31日以上もちゃんと表示されたようです。これで履歴コマンドの問題は解決。
今日はもうひとつ。無限に長い文章を生成しようとする可能性がある問題を解決しました。いや、ここんところ、るすぢが固まることが結構あったんで、なんでやろって考えてたら、ふと思いつくところがあって、、、これが原因で固まるって決まったわけじゃないけど、これが原因で固まる可能性もあるってことで、治しておきました。これでちょっとは安定すると良いな。
実は先週末。C#と悪戦苦闘しておりました。結局、C#でやるところと、C++でやるところを分けて処理をするということにしました。C++もせっかくなのでManagedC++を使ってます。うーん、修行の毎日。どうせ書き直すならと、拡張性をあげるために内部構造を見直しております。別に機能アップするとかそうゆうことじゃないけど、今後機能拡張するに当たって、手を入れやすいように風通しをよくしておくっていう目的です。んでも、書き直しなんで、いつ出来上がることやら。。。

ちと話題の流れの部分を変更しました。
その影響で、話題の流れに関するデータベースを大量に整理しました。大体1割の話題の流れの知識を消しました。
結構、評判はいいようで。しばらくこのまま使ってみます。
昔話シリーズは、あんまり影響が出ていないようですな。
まぁ昔話のテキストは、子供向けが多くて、かなりひらがなが多いので、あんまり影響が出てないんだと思います。
www.activebuddy.com
ってサイトを見つけました。ここは、メッセンジャ用のロボットを開発しているところなんですが、チャットロボットだけで会社を作ってるってのがちとすごいです。ここのチャットロボットは雑談するのが目的じゃなくて、いろんなことを聞いてあげるとちゃんと教えてくれることです。天気予報やら株式市況やら、百科事典を調べてくれたり、いろいろしてくれます。
まぁそんなインターフェースもあってもいいかなとは、思いますが、やっぱりるすぢの凄いところは、なんも役に立たないところだと思います。アクティブバディは会社なんでなんか役に立って、お金を儲けなきゃだめなんですから、それなりに機能をつけなきゃだめだってのは当たり前なんですがね。
役には立たないけど、なんとなく、気が和むというか、リラックスできるというか、まぁるすぢのお気楽極楽の性格がいいのでしょうか、そうゆう方向のロボットもあってもいいかと考えています。
ある意味、精神科のカウンセラーに近いロボットなんでしょうね。カウンセラーにしてはちょっと馬鹿すぎるので、もうちょっと賢いカウンセラーになってもらわなくてはと、考えています。
もしかしたら、将来留守番ロボットで会社が設立されるかも。。。これも一種の癒し系か。

ウィルス騒ぎがありました。まぁウィルスというよりもワームですな。MSDEやらSQLサーバに取り付く種類のようです。我が家のMSDEもサービスパックは当たっていませんでした。でも、ファイアーウォールでポートを塞いであったので、実害はありませんでした。
ただ、アップデートがうまくできなかったので、一度削除して、入れなおしになってしまいました。
掲示板にも書きましたが、前のインストールのときにどうも複数インストールしていて、インスタンスが複数できていたようです。いまはインスタンスが1個になったので、微妙に処理が速くなった気がする。
///// SQLサーバーについてのメモ/////
osql -S MACHINEINSTANCE -E
select @@VERSION // DBのバージョンを調べる
create database DBNAME // DBを作成
sp_grantdbaccess // WindowsアカウントをDBのアカウントに割り当てる
sp_addrolemember // アカウントをロールに割り当てる
sp_help** // いろいろシステム情報をダンプ
バックアップする必要のあるファイルは、*.mdf

その手の論文を調べてみましたが、、、
もう、興味が尽きました。つまらん。
というより、論文読んでて思い出したんだけど、これって、大学の授業でやってたわ。と。

連休だったんで読書してました。
るすぢのアイデアがないか、その手の本の読書です。
そのなかで1冊、面白い本が。。。
タイトルは正確には覚えてないんですが、「言語と脳」みたいな本でして、
幼児はどのようにして、母国語を獲得するか。
てな話です。
この本に出てたのは、
地球上に存在する言語には共通のルールがあって、そのルールに関しては幼児の脳の中に遺伝的に構築される。幼児が成長するに従って、周りの環境などから、その幼児の脳の中のルールがちょっとづつOFFになっていき、言語を獲得する。
という仮説についてでした。
まぁいろんな検証をしてるんですが、これがおもろい。
この手の論文をちと集中的に調べようかなと思っています。。。うーん。英語の論文読まないとだめかな。
さて、そうこうしているうちに、1個留守ぢのアイデアが思いつきました。このアイデアは、賢くなるのかあほになるのかよく分かりませんが、十分に知識がある場合は賢くなると予想されます。だたちょっと処理に時間がかかるかも。。ちと、エンジンだけテストで作ってみて、どんな感じの会話が生成されるかやってみてから考えよう。せっかくだからC#でやろうかな。丁度いい規模のネタだし。

あけましておめでとうございます。
新年1発目の開発日記は、、、
ちと思い立つものがあって、C#を勉強しようと、今までの留守番君のコードを見ながらC#に書き直してます。
今まではおらのお得意のC++でかかれてましたが、これからはC#という言語が広まってくるだろうということで、勉強がてら、書き直してます。
C#自体はかんたーん。ほとんどC++とJAVAのいいとこ取りをしただけ。
両方の大体の概念がわかってるおらとしては、C#にはさくっとなじみます。
問題は、、、クラスライブラリ。まぁ.NETのフレームワークを叩くんですが、これがまぁぜんぜんわからへん。どんなクラスが用意されてんねん。こりゃ、困ったぞ。ということで、しょうがないのでクラスライブラリのヘルプをちまちま読んでます。
全部書き直されるまで結構時間かかるかも。。。

「ある」「いる」「する」という単語の処理をちょこっと変えてみました。
さて、どんな按配かな?
話題が飛ぶ原因には2点あって、
会話の流れを追いかけるところで、やっぱり話が飛んでる。形容詞とかが出てくると、弱い。
会話の流れがちゃんと追えていても、それから文章を作成するときに、おかしな文章を生成してしまう。
の2点を発見。でも、解決策は、、、見つかってません。

日々の出来事を自分用にメモしています