「RusuDi」カテゴリーアーカイブ

ここんところ毎日触ってるな。大丈夫かしら。
さて、どこが遅いか調べました。学習の結果を書き出すところです。予想通りでした。しゃあないので、コネクション張りっぱなし、トランザクションかけっぱなし、の大技で、ちょびっと高速化しました。まぁ、これくらいの速度なら人様に見せても大丈夫でしょう。まだちょっとだけ、文章が長いので、もうちょっと短くなるように調整中。

ビンゴ!
ちょっと思いついたアイデアがあって、それを実装してみました。相変わらず、時間はかかっていますが、すんげぇいい感じの日本語を出力してくれます。以前に比べて知的!?ちょっとわれながら感動しました。文章生成エンジンはこの方針で行こう。あとは、まわりの無駄な処理を省かないとね。
まだ、速度の問題は手をつけていません。DBアクセスの高速化はおらにはあんまり経験が無いので、まぁ勉強がてらちまちまやってみます。まぁ、まだまだ人様にお見せするレベルじゃないんだな。今のエンジンにみんなが飽きたころに、こそっと入れ替えるとしよう。
本日頂いた要望(ハチロー様より) 誰かが入室するとロボットが即挨拶しますが、他に話している人がいる場合、この挨拶をちょっと遅らせる方がいいかも。
いいアイデアなので採用。

新エンジンですが、あきません。だめだめです。
生成される文章が長すぎます。長いもんだから、時間かかりすぎ。
長すぎる原因はわかりました。
発言が2行にまたがっている場合、勝手に認識して一度に発言されたものとする
って部分ですが、こいつが悪さをしています。いい方向に働くときと、悪い方向に働くときと2パターンあることをつかみました。今までいい方向のことしか考えてなかったんだよな。文末処理はまだまだ修行が足らないようです。
生成される文章は相変わらず日本語になっていません。もうちょっとちゃんとした日本語になると思ったんだけどなぁ。この部分は、まだいろいろアイデアがあるので、試してみます。
次の開発は週末かな。
あ、あと、留守番君の注意事項を掲示板に載せました。留守番君関連は、ひとつ独立したページにしておこうかな。誰か書いてくれぇ。

現在、新学習エンジンの開発中。
治したところは、句読点空白の処理です。句読点空白が発言に混ざると、どうもその場所から話が無茶苦茶になるようだったので、そのへんの処理を変更しています。
あと、発言が2行にまたがっている場合は勝手に認識して一度に発言されたものとする。って機能も追加しました。結構、みんなひとつの文章を何行にも分けて発言していることが多いってことを見つけたものですから。行末処理に威力を発揮すると思われます。また、次の発言内容の決定には完全ランダムを使っていたのですが、ある程度の流れを使うって方法に変更しています。
知識データの構造がかわっちゃったので、学習やりなおしです。過去のデータから変換しているのですが、変換するのに8時間とかかかっちゃいます。というか、機能を詰め込んだので、全体的に処理が遅くなっています。これだけ遅くなると、ロボットとしてはちょっとだめだめなので、高速化の改造が必要です。本バージョンはまだ、稼動していません。
んでもね、賢くなったおかげで、一度の発言の長さが長くなりました。長くなったのはいいけど、ちょっと無駄に長いかも。。。もうちょっと調整します。

本日は直前の他人の発言から、学習してある内容を使って発言を生成するところを作りました。
現在、稼動している留守番君はこのバージョンです。
ちょっと触ってみた感じですが、

暴走してます。

留守番君、一人で突っ走ってます。話しすぎ、話題飛びすぎ。独り言を言いながら一人で暴れている感じです。
バランス悪すぎ。まだまだ調整が必要ですね。
かなーりうっとうしいので、黙れ>留守番ぢ で黙らしておいてください。
ところで、なぜか昨日は留守番ぢで入室できませんでした。おかげで、留守番ぢ君というアカウントを取得。

今日は、話題機能をちょっと遅くしました。いままでだとちょっとうっとうしかったので、話題を提供するのを遅らせてあります。
さて、自習機能ですが、一応完成しました。現在、機能しております。自習機能には、普通の会話が必要です。別にロボットに話しかける必要はありません。普通に人間どおしで会話してください。勝手に学習します。ということで、顧客開拓が必要かも。
さてその学習した内容の活用ですが、ちょっとした実験プログラムを書いてみました。待望のロボット第一声は、、、

ZOOで決まり(笑

へ?なんでぇな。おもろすぎです。腹抱えて笑ってしまいました。(笑 までつけてくれるし。まぁ、まだまだ調整が必要なようですな。

本日から、留守番君の開発日記をつけます。なんかいじったら、書き込みます。
んで、今週末の成果ですが、
履歴機能の追加。まぁ、これはどーっちゅことないですわ。
あとのアイデアとしては、Last10とかね。最後の10人は誰かとか、いつか、を表示するとかのアイデア。これは、気が向いたらつけます。
自習機能の実装
一応、ざっと作業は終わり。
今、問題となっているのは、顔文字。
顔文字、へんな文字入りすぎ。日本語ちゃうから区別せにゃあかんけど、わからへん。
しゃあないから、変な文字はぜーんぶ削除の方向で実装。
完成と思いきや、この学習エンジン、半角かなのみならず、半角英数も記号とかいいよる。ったくもう。まぁ、記号なんだけど、数字は数字と学習せぇ。これは、今後の課題。
あとは、普通のチャットの会話のログがもっともっといっぱい欲しいな。今は、ここ1週間くらいのログを使って学習の実験をしてるけど、まだまだ、少なすぎるわ。ここ1週間は以外に人間どおしの会話って少なくって、、まぁ人がおらへんちゅーのが根本的にあるんだけどね。これでは、会話できるまで賢くならへん。なかなか集まらないようだったら、どこぞの新聞社のWebページでも使って勉強させるけど、それじゃぁ、かたっくるしい言葉遣いになっちゃうからできたら避けたい。チャットはやっぱりチャットから学ぶべきだな。
まぁ、自習できたからって、それを活用して発言するところはまだ作ってないから、まだお勉強のみなんだけどね。まだまだ学生気分です。
最近、ロボットと知ると逃げる人が結構いることに気が付いた。ちゃんととめるところはとめて、話すところは話して、のメリハリをもっとつけないとだめだなぁと思う、今日この頃。まだ、ちょっとしゃべりすぎだよな。