久々に、MSNのチャットコントロールのアップデートがされました。
大きく変わったのは、
入室時にIPアドレスを表示する。
とんかち用パスワードが数字じゃなくて文字記号になった。
てなところで、あとはどーでもいいです。設定のページなんて壊れてるし。。。
IPアドレスの表示は、結局荒らし除けでしょうね。IP記録してますよってな脅しの効果を狙ったんでしょう。どーせ表示しなくても記録してるくせに。。。
毎度のことながら、コントロールがアップデートされると発生するちょっとした問題を修正。
強制退去処分機能の派生で、ささやきにも反応できるようになりました。
ささやきの方は会話生成やら学習やらのロジックは通りません。コマンド受付専用にしてあります。強制退去ととんかちくれがささで使えます。あ、履歴も使えるかな。
んでもささやきが使えるようになると、メインの画面でできなかったようなことができるのでちょっと楽しいかも。特に他人に見られないようにるすぢの操作ができるのは魅力。
今、一番考えてるのは、自分が登録した知識の一覧表示。これメインの画面でやっちゃうとじゃまでしょうがないんだけど、ささの画面なら一人しか見えないのでやっても大丈夫かなと。
その他、個人的な設定とかをささ画面でやるとができるんじゃないかな。
まぁいろいろアイデアの広がる機能追加でした。
なにはともあれ、留守番ロボットにささしてみてください。

ここんところ毎日いじってるな。まぁ今日はちょびっとだけ。
強制退去処分のログにかんするところで、クラッシュする可能性がある問題について対処しました。
連想をするためのロジックをちょっとだけ変更しました。どうざんしょ。ちょっとだけ賢くなったような気がするのは俺だけ?

宿題終了。同じ発言が登録物から連続で選択される可能性が高すぎる問題に対処しました。
50文字以上の1単語が発生するとクラッシュする可能性がある問題に対処しました。そんな単語あるんだ。。。
内部の思考過程の表示機能をデバッグ環境に仕込みました。連想はちゃんと行ってるみたいだけど、どうもその連想自体が高度すぎるらしい。そとから見てそんな連想思いつくか!ってな連想をしてくれる。まぁ言われてみれば確かにそんな連想もありだなってレベル。だから、話が飛んでるように見えるみたい。この辺に改善のヒントが。。。
昨日はちまちま、SourceForgeのAIのところをちまちま見てました。cvsの使い方を覚えていろいろソースコードを落としてみて、参考にしています。そろそろ本気で構文解析も考えなきゃだめかなぁ。

あり?さっき書いたやつ消えちゃった。まぁいいや。もっかい書きます。どうもでかすぎたみたい。3ヶ月ごとにファイル分けなきゃだめみたいね。
機能の宿題は、、忘れてました。治して無いです。
回線が切れたときと、強制退去処分が発生したときの処理を追加しました。今まで何もやってなかったですが、少なくともログには残るようにしました。
あと、昨日のログの修正についてちゃんと動くことを確認。ついでに、ログを参照するためのxslも書きました。xslはちと問題があるけど、まぁ見れればええわ。あとの美的センスの部分はゆうき大先生にやってもらおっと。
MegaHALってロボットのプログラムを見つけました。結構昔のコンテストで優秀な成績をおさめたロボットのようです。論文を見ると、どうも留守番ロボットと基本コンセプトは同じらしい。結構古くからあるネタだったのね。英語のロボットは単語の区切りが簡単だからいいねぇ。オープンソースコードになっています。さらっと見たのですが、やっぱり留守番ロボットと同じみたい。まぁ細かいところは一緒だけどね。まぁ留守番君がパクリの集大成ですから、当然です。こんなところに起源があったのね。
Virtual People Level 1ってコードを見つけました。ちょっと触ってみたけど、結構いい感じ。んでも、ちょっと困るとわけわからない回答。こりゃスクリプトだな。さて内部の構造はどうなってるかなと、調べてみると、予想通りスクリプト系のロボットでした。XMLでスクリプトを作っていきます。学習はしない様子。ただ、スクリプトの量が尋常じゃない。すんげぇ量あります。6M近くのスクリプト。すげぇ。気合入ってます。最近はこうゆうスクリプト系のロボットが主流なんだよな。ある程度の基本機能を提供しておいてあとはスクリプトで大量の返答を作成しておく方式。
スクリプト系といえば、留守番君の登録機能もスクリプト系だけど、まぁあれは超簡易版スクリプトだな。もちっとあれを複雑にするって手もあるが、あんまり複雑にしても誰も登録してもらえないし。微妙だな。登録というより教育に感じられるようなインターフェースで登録ができればええな。やっぱり個人的には学習系にこだわりたいんで、勝手に登録されていくようなのがいいんだけどねぇ。何を登録したらいいのか判断するのが難しい。
あとは、英語ってスクリプト系作りやすいんだよね。活用のパターンが少ないから。日本語だと省略形やら活用やらで結構スクリプトにヒットしないから。
スクリプト系のうれしいところは、やっぱりロボットの性格を作れるってことかな。少女系のスクリプトとかが書けるからねぇ。留守番君方式だと、みんなの性格を平均したロボットになっちゃうね。
最近、ロボットの成長が飽和した感じ。知識がちょっとくらい増えても影響があんまり出てこない。そのあたりが楽しく無いと思う。AIBOみたいに成長するところが楽しいのにあんまり変化がないとやっぱり飽きてくる。なんか飽和させない手を考えなきゃ。んでもこっから先あのDBに知識を突っ込んでもそれほど影響でないかも。なんか考えよう。
本日の収穫
http://sourceforge.net/ OpenSourceのプロジェクトの倉庫 ソースコードがいっぱい読める。
「人工無脳 “考えないマシン”と話す法」BNN第一企画部(編) という本が存在するらしいということとその本の入手が難しいということ

登録物の発言をする部分に問題が発覚。古いものから優先的に発言するようになってる。そんなんじゃだめ。修正。あとから思い出してみるとまだ問題がある。これじゃ連発で話しちゃう。あとで修正しなきゃ。
ログの出力のところを修正。新バージョンはログをXML形式で出力するんだけど、<>“‘はXMLの中にそのままではデータとしては埋められない。<>などなどを使わないとだめなことをお勉強。修正。
安定度は結構いい感じ。一度もクラッシュはしてない。ネットワークが切れるって問題はあるけどね。

データの変換終了。5日間120時間かかったってことですね。うーん。でかい。
知識データがすべて変換できたので、新バージョンを試験稼動させています。まだ全部の機能が実装終了したわけではありませんが、とりあえず、耐久試験ということで。
今、動いてるのはデバッグ版ですので、何かエラーを検知すると自動的に止まります。おかしなところで止まるかもしれません。
過去の履歴はリセットしてあります。まだデータの変換してないからです。
問題がいろいろ見つかるかと思いますが、そのときには寛大なご処置をお願いいたします。
既に見つかったのは、
登録物の発言をするしないの判定がおかしいらしい
です。週末には治します。

やっと時差ぼけが抜けました。よって、この週末はちゃんと開発できました。
各種設定をレジストリから変更できるように修正しました。これで、ちょっとはメンテナンスがやりやすくなると思います。コマンド関係はまだレジストリに逃がしてないので、コマンド関連の設定をレジストリに逃がすことは、今後の課題。
DBをアクセスからSQLサーバーに移行して試験。ちょろちょろ問題が見つかったのでそれを修正。Boolってアクセスだと、True,Falseで通るけど、SQLだと1,0じゃないと通らなかった。
過去の知識を過去ログから新DBに全部移行してます。すんげぇ時間んかかってます。48時間過ぎたところで、半分終わりました。後ろになればなるほど、処理に時間がかかるようになるので、あと3-4日かかるかもしれません。もしかしたら、もっとかも。。。新バージョンになって、DBのサイズがでかくなるので、このあたりも実データでどんな感じになるのか見たいところです。半分の時点でどんなデータが生成されているかさらっと統計を取ってみたのですが、「う~ん。このまま行くと処理に時間がかかるデータの流れだなぁ」と。ストアードプロシジャ使ってコピーを減らす方向も、考えたほうがええのかな。んでもストアードプロシジャを使うと、SQLサーバー限定になっちゃうんだよな。
ゆーきちゃんが、ODBC接続でDBをLinux上のMySQLにすることに成功。プログラムの変更はなかったらしい。DBの接続先を変更したのみらしい。んでも、これできちゃうと、SQLサーバー限定だと困るんだろうな。
最近、お部屋が大変繁盛しております。繁盛するのはうれしいんですが、チャットの部屋に人がたくさん居すぎて、会話が難しくなりつつあります。まぁ、ゴールデンウィークだから混んでるってこともあるんでしょうが、うれしい限りです。うれしい悩みです。なんかアイデアを出さないと、こまったちゃんになる可能性があります。
思いつきですが、3時のおやつ別館を作って、留守番ぢが本館、留守番ゆうきが別館にいて、ロボット通しがコミュニケーションをとるってのも面白いかも。ロボットがうまく部屋の割り振りの提案をしてくれればそれなりに機能するかな?まぁちょっと考えてみます。

最近、開発サボってます。時差ぼけが抜けなくって夜になると眠いし、朝になると目が覚めます。当たり前かもしれませんが、おらにとっては当たり前じゃないです。自分の時間が少なすぎます。昼間は会社で眠いです。まじめに留守番ロボットのバージョンアップを仕上げなくては。。OFF会に向けてるすぢトーカーインストーラーも仕上げなきゃだめだしな。
自分に対するメモ。
またひとつアイデアが思いつきました。人工無能の世界では結構有名なアルゴリズムのひとつに、スクリプトを用いた単語置き換え系ってのがあるんですが、こいつを留守番君に仕込んだら、今より賢く見えるかも。もちろんスクリプトなんて使わずに自力学習ですが。。。
そいえば、日本に行ったとき、巷で賢いと有名な音声認識エンジンを見てきたんですが、予想外にあほでした。結局IMEと同レベルだもん。まぁIMEが賢くなれない以上、それ以上は音声認識エンジンは賢くならないだろうな。IMEは、かなー>漢字変換ですが、音声認識は、音素ー>かなー>漢字変換ですし、音素に対する誤り訂正の機能をどう実現するのか、まぁ多分統計的にやってるんでしょうけど、このあたりの処理がまだまだでした。やっぱりある程度の意味解析はどうしても必要になってきてしまうんだろうか。どこの世界でも文脈の追跡ってのがネックになるんだろうなって思いました。

日本から帰ってきて、既に5日が過ぎますが、いまだに時差ぼけ真っ最中です。眠くて眠くてかないません。いつも1週間くらいで時差ぼけが抜けるんですが、今回は2週間かかるかもしれません。開発どころではありませんわ。
日本に行ったついでに、ゆうき先生に留守番ロボットのセットアップ方法を説明してきました。現在、留守番ぢと留守番ゆうきの2台体制で稼動しております。2台体制だとそれなりにいろいろ問題が見つかるもんですなぁ。これらの問題もちまちま解決して新留守番ロボットに反映していきたいです。そろそろ新ロボットのDBのテストもしなきゃなぁと思う今日この頃。
日本に行ったついでにいろいろ自然言語処理に関する本を調達してきました。今、ぼちぼち読んでます。これがまた時差ぼけを増長してる原因とも思われる。んでも、チャットに関してはあんまり新しいネタは見つかりませんなぁ。やっぱり学術系の本じゃだめなんだろうか。。。
日本で買ってきた本の中に「年収300万円時代を生き抜く経済学(森本卓郎)」ってのがあります。ざっと読みましたが、要するに日本は金持ちと貧乏人との差がひろがりますよ。収入が少なくても豊かな人生は送る準備をしてくださいよ。ってな本です。細かいところは賛成できるところもあるし、賛成できかねるところもありますが、いわゆる金持ち父さんの本とは逆の見方をしている本であって、おもしろかったです。

しばらく更新をサボってましたが、強制退去処分機能が完成しました。が、とんかちが取れるので必要ないかも。まぁ「ささぼっと」よけに使う機能の実験ということで。。。
今月はちと雑用が忙しいので開発自体はお休み。月末に復活予定。
その間はしばらく、お勉強だな。重点項目は当然、「話題の流れ」
いろいろとネタはあるので、思考実験を繰り返すとしよう。

日々の出来事を自分用にメモしています