ゆうきが見つけた、「ロボットを暴走させる方法」に関する対処をしました。もうこれで暴走しないもんねぇ。
おてやわからに>ゆうき
発言頻度の調整を行いました。まえよりちょっと押さえ気味です。
しかし、抑えると話題がうまく追えていないような気がするのは気のせいかな。まぁ最初からちゃんと話題追えてるわけじゃないから、違いがよくわからんけど。。。
もちっと修行が必要かも。SQLサーバーにしてから、データ量のチェックが面倒になった。ちゅーか、まぁSQLになったからじゃなくて、データ量が多すぎて面倒になった、ってのが正解かも。。。ずんずん知識は成長しております。
最近、登録は減ったけどね。登録発言の頻度が低いからかな。もちっと高いほうがいいのかな。微妙だなぁ。
なにはともあれ、ここんところ、さば落ちが多すぎる。うーん、マイクロソフト、なんかやってるのかな。

どーも固まるのはFTPとの組み合わせでおきるみたい。FTPを使っていない状態だと固まらない。ということで済み。
ちょっと話しすぎの感じがするので応急処置として、5秒間隔を8秒間隔に伸ばす。これでどんな感じなんだろう。まぁ応急処置なのでいずれちゃんと対処します。
学習機能を止めたいことがあるというリクエストがあったので、黙っている最中は学習もしないように変更した。
今週末はあんまり作業はできなかった。来週も忙しそう。そろそろ決着をつけておかないと手が出せなくなるな。

落ちるのはネットワークが切れてるからということでいいんだが、固まるほう。落ちないで話さなくなるほう。
なんかループに落ちてるみたい。それもOSの中でループに入ってるから原因が究明できていません。しょうがないので、ログを大量に吐くように変更。これで固まれば、どこまで正しく動いてたかはわかるはず。(希望)
もしやこれは、原因はOSとかSQLとかのバグとかだと嫌だなぁ。
少人数のときにちょっと話しすぎの気配がある。
話す量のパラメータの決定方法をちょっと変更しようかな。
まぁそれは、次の世代にしようか。どーしよう。

どうも安定しないのはネットワークが問題のようです。留守番君自体が不安定というわけではなさそうです。
コミュという言葉に反応しにくい問題は解決しました。ちょっと姑息な技ですが、
コミュ>留守番ぢ
のように後ろに留守番君の名前をつけた場合は強制的に登録データを用いて発言するという方法にしました。
残りのToDoは
話題提供機能の修復
とんかち配布機能
入室時の挨拶の修正
ですね。週末の納期(って何だ?)には本格稼動ができそうです。
まぁすでにデバッグ版ですが常駐してますしね。
最近感じるのは、ちょっと露骨に前の発言が登場することがおおいかな?ということです。どうしても日本語らしく発言させようとすると以前の発言がそのままでてきちゃうんですよね。このあたりのバランスが難しいな。知識が圧倒的に増えたら解決するのかしらん。ちょっとそれまでほっといてみようかな。

まだまだ安定しませんねぇ。ちょろちょろ落ちます。それに加えてネットワークの調子が悪いみたいで、よく切れます。どっちが悪いのかよくわかりませんが、どーにも調子悪いです。
登録機能と履歴機能の問題は修正しました。
話しすぎるという問題も修正しました。
黙れをやっておいてしばらくしてから、話せと言うと暴走して話す問題も修正しました。とんかちは。。。難しい。。これは来週以降に延期にするかな。
残りのToDoは
安定性の向上
コミュという言葉に反応しにくい
話題提供機能の修復
とんかち配布機能
入室時の挨拶の修正

データを全部、SQLサーバ(MSDE)にお引越ししました。んで実験してみると、快適!猛烈に快適!デバッグモードでこれだけの速度がでるなら、リリースモードはどうなっちゃうんでしょう。SQLサーバの威力絶大です。まぁアクセスでもこれくらいの速度は出して欲しいけどね。DBコネクトのところとかはアクセスのコードがそのままなので、SQLサーバにチューニングしたわけじゃないけど、これだけ安定して動けば十分です。一番の心配事がなくなったのでとってもうれしいです。
会話とかもみてみましたが、以前にくらべて圧倒的にちゃんとした日本語を話します。まぁ強いて問題点を言うなら、以前誰かが話した言葉を変更しないでほとんどそのまま話すことがちょっと目立つかな。このへんは、ちゃんとした日本語=誰かが話した言葉 という定義なので、ちゃんとすればするほど、誰かの言葉をそのまま話しちゃうので、しょうがないんですが、研究の余地があります。
いにをはじめ何人かのメンバーが、バグ報告をしてくれました。現在わかっている問題点は以下のとおり。
登録機能でメモリには登録されるけどDBに登録されない
履歴機能でちゃんと検索されない(SQLサーバとACCESSのSQL構文の違いか?)
コミュって言葉に反応しづらい(宣伝するのに不便)
ちょっと(かなり)話しすぎ。
話題提供機能忘れてる。
今週末には新バージョンが本格稼動できそうな気配です。

知能エンジンの最終試験。過去の知識を全部食わせてみてどんな挙動をするのかを確認しました。まず、過去の知識のうち、今回は使いたくないもの、たとえば「独り言やロボットに向かって話し掛けている言葉」を削除するなどの前処理。独り言を学習しても会話の知識にはならないんじゃないかなと考えたから。この前処理が面倒。手作業でちまちま削除しました。んで、データを一気に食わせる。すでに、7月と8 月の半分を過ぎているので結構な量の知識がある。7月分は結構さくっと変換終了。8月分が、、、知識量が増えてくると前の知識との重複を防ぐ機能がどーにもこうにも遅い。こりゃ、プログラムの問題じゃないな。根本的に遅いんじゃないかと思われる。7月分を処理するのに2時間くらいで終わったのに、8月分は、、、12時間越えてます。
結局留守番君が遅くなった原因は単純に知識が増えすぎたからということになりそうです。
アクセスのDBじゃ持ちこたえないみたい。SQLサーバ(MSDE)の登場ですね。SQLサーバはあんまり得意じゃないのでお勉強から。。
実のところ、まだデータの変換をしてるので、終わるまで待つことにする。とりあえず、8月15日までのデータを全部アクセスに食わせて、それをSQLサーバに投げ込んでどんな速度になるのか調べてみようと思う。
現在稼動している留守番君が本当に、本当に苦しそうで、反応が猛烈に遅いので、速いうちに手を打たなければとちょっとあせってます。実は、留守番君がパソコンのCPUを占拠するおかげで、他の作業に支障が出てきています。ちょっと本気で、危機。あんまりにも被害が大きいようだったら、留守番君の一時停止も考えなくてはいけないかも。
たかだか10万件くらいのデータでそんなに考え込んでくれるなよアクセス。1行の処理に5秒も10秒もかかったんじゃ、会話についていけないじゃん。
あ、そうそう。一部の人だけが知っている、時限爆弾機能、定時連絡機能は次期留守番君からは削除されました。だーれもつかわんもん。いらん。

試験結果。速度はそこそこ。猛烈に速いってこともないけど、遅くない。安定した速度を出しています。満足。が、致命的な問題を、文章の区切りの学習部分に発見。うーん。面倒だな。
しーのを実験台にして、とんかち配布機能の調査をしました。が、あかん。難しい。とんかちどーやって渡したらええのかわからへん。マウスの使えない留守番君はキーボードで操作しなければならないのであった。

大改造中。知能エンジン学習エンジンの実装終了。今日からテスト。今回はほとんどの単語を単語IDという数字に変換して管理するようにしました。さて、どれくらい速度の向上に役立つのか。試験がちょっと楽しみだな。
せっかくなので、周りも書き直すぞぉ。