ベイズフィルター2

IMAPの時の通信のタイミングをいまいち理解せずに適当に行き当たりばったりでコーディング。


で、とりあえず不完全ながらも実メールを使ってベイズフィルターの性能を試してみました。


実験内容

  1. INBOXとSPAMフォルダのメールを各々読み込ませ、INBOXのメールはINBOX、SPAMSPAMとしてトレーニングする。
  2. 学習に使ったメールをフィルタリングさせる。


結果


9通のINBOXのメール、20通のSPAMメールで学習を行い、学習に使用したメールのフィルタリングの失敗は1件のみ。


感想


ィェィ. ☆-(ノ゚∀゚)八(゚∀゚ )ノイエーイ☆
結構性能よくありませんか!!!


検体数がすくないのは、

  1. サブのアカウントでメールがこない(メインのアドレス使って色々消えたりしたらしゃれにならん)
  2. MimeMultipartのメッセージからテキストパート抜くのが面倒なんで、MimeMultipartを無視


という背景があるんですが、面白そうなので検体数増やしてどの程度の精度が出るのか後日試してみます。
あと、学習に使ったメールがフィルタリングできるのは当然だろって話もあるかとは思うので、学習に使用するメールとフィルター対象メールも分けなきゃ、、、、


結構面白いおもちゃが手に入ったって感じです。
しばらくは、メールで遊んでそのあと投機系にどうつなげるか考えます。