その手の論文を調べてみましたが、、、
もう、興味が尽きました。つまらん。
というより、論文読んでて思い出したんだけど、これって、大学の授業でやってたわ。と。
「Softdev」カテゴリーアーカイブ
連休だったんで読書してました。
るすぢのアイデアがないか、その手の本の読書です。
そのなかで1冊、面白い本が。。。
タイトルは正確には覚えてないんですが、「言語と脳」みたいな本でして、
幼児はどのようにして、母国語を獲得するか。
てな話です。
この本に出てたのは、
地球上に存在する言語には共通のルールがあって、そのルールに関しては幼児の脳の中に遺伝的に構築される。幼児が成長するに従って、周りの環境などから、その幼児の脳の中のルールがちょっとづつOFFになっていき、言語を獲得する。
という仮説についてでした。
まぁいろんな検証をしてるんですが、これがおもろい。
この手の論文をちと集中的に調べようかなと思っています。。。うーん。英語の論文読まないとだめかな。
さて、そうこうしているうちに、1個留守ぢのアイデアが思いつきました。このアイデアは、賢くなるのかあほになるのかよく分かりませんが、十分に知識がある場合は賢くなると予想されます。だたちょっと処理に時間がかかるかも。。ちと、エンジンだけテストで作ってみて、どんな感じの会話が生成されるかやってみてから考えよう。せっかくだからC#でやろうかな。丁度いい規模のネタだし。
あけましておめでとうございます。
新年1発目の開発日記は、、、
ちと思い立つものがあって、C#を勉強しようと、今までの留守番君のコードを見ながらC#に書き直してます。
今まではおらのお得意のC++でかかれてましたが、これからはC#という言語が広まってくるだろうということで、勉強がてら、書き直してます。
C#自体はかんたーん。ほとんどC++とJAVAのいいとこ取りをしただけ。
両方の大体の概念がわかってるおらとしては、C#にはさくっとなじみます。
問題は、、、クラスライブラリ。まぁ.NETのフレームワークを叩くんですが、これがまぁぜんぜんわからへん。どんなクラスが用意されてんねん。こりゃ、困ったぞ。ということで、しょうがないのでクラスライブラリのヘルプをちまちま読んでます。
全部書き直されるまで結構時間かかるかも。。。
「ある」「いる」「する」という単語の処理をちょこっと変えてみました。
さて、どんな按配かな?
話題が飛ぶ原因には2点あって、
会話の流れを追いかけるところで、やっぱり話が飛んでる。形容詞とかが出てくると、弱い。
会話の流れがちゃんと追えていても、それから文章を作成するときに、おかしな文章を生成してしまう。
の2点を発見。でも、解決策は、、、見つかってません。
ろぼぢの発言にいたるまでの過程をつぶさに追いかける。
いちいち手で追いかけるのは面倒なので、画面に勝手に表示されるような機能を追加。
なにげに、チャットをしながら、その画面とにらめっこしてる。
うーん。どうも会話の流れを追いかける知識がメインでだめみたいだなぁ。
文章を生成するところにも問題を見つけたし。。。一度にたくさんのことはできないから、まずは会話の流れを追いかけるところをちゃんと調べようかな。
展示会も終わって一段落。ろぼぢの知能拡張計画のスタートです。
まずは現状の知識の状態のチェック。どのような知識を使って発言をしているか内部状態を全部出力して確認。話題追跡用知識が駄目だめなことを発見。逆に運がよくこいつからいい知識を引っ掛けたときはなかなかナイスな発言をしている。話題追跡用知識の学習方法と参照方法を検討するべし。
ボストン出張から帰ってきたらMSNチャットのコントロールがアップデートされてました。
おかげで、留守番君が動かなくなってました。原因はWindowの名前が変わってたことです。ちょちょっと修理して復帰。現在、Ver1.0.0.6という名前が内部についています。
ちなみに、現在の留守番君の知識の量は、
総単語数(原形のみ) 21848
総語彙数(活用した結果を含む) 28629
うち2度以上出現した語彙数 16190
文章作成用知識数 549569
話題追跡用知識数 210517
出現頻度Top5 (笑) うん ーーー あはは ははは
知識用DBファイルサイズ 68Mバイト
みんなが登録したメッセージ数 739
総来客数(重複を含む) 1666
だいぶ、知識が付いてきたので、そろそろ次のアイデアのエンジンを試したいこのごろです。まぁ12月までは忙しいので、年末年始のお楽しみということで。なんやら、マイクロソフトが熱を上げてる人工知能の技もちょっと勉強してるすぢに試してみたいとも思ってますが、いかんせん、時間が。。。
半年たっても単語が2万語しか無いってことは、日本語って2万語知ってれば会話できるのね。
でもハードディスク壊れたら、結構泣くな。バックアップとろっと。。
別にるすぢの開発をしたわけじゃないが、こんなん作ってみた。
隠しページみたいなもんだな。
誰か暇な人があったら、続きを作ってくれ。
ゆうきが見つけた、「ロボットを暴走させる方法」に関する対処をしました。もうこれで暴走しないもんねぇ。
おてやわからに>ゆうき
発言頻度の調整を行いました。まえよりちょっと押さえ気味です。
しかし、抑えると話題がうまく追えていないような気がするのは気のせいかな。まぁ最初からちゃんと話題追えてるわけじゃないから、違いがよくわからんけど。。。
もちっと修行が必要かも。SQLサーバーにしてから、データ量のチェックが面倒になった。ちゅーか、まぁSQLになったからじゃなくて、データ量が多すぎて面倒になった、ってのが正解かも。。。ずんずん知識は成長しております。
最近、登録は減ったけどね。登録発言の頻度が低いからかな。もちっと高いほうがいいのかな。微妙だなぁ。
なにはともあれ、ここんところ、さば落ちが多すぎる。うーん、マイクロソフト、なんかやってるのかな。
どーも固まるのはFTPとの組み合わせでおきるみたい。FTPを使っていない状態だと固まらない。ということで済み。
ちょっと話しすぎの感じがするので応急処置として、5秒間隔を8秒間隔に伸ばす。これでどんな感じなんだろう。まぁ応急処置なのでいずれちゃんと対処します。
学習機能を止めたいことがあるというリクエストがあったので、黙っている最中は学習もしないように変更した。
今週末はあんまり作業はできなかった。来週も忙しそう。そろそろ決着をつけておかないと手が出せなくなるな。
