ベイズフィルター1
といってもまだ、ベイズフィルターを本格的に使うところまでいっていませんが、、、
基本的には、前紹介した下記のページに従うだけでOK。
Java版ベイズ実装 ci-bayes を試す
http://diary.voq.jp/archives/8
JARを使わずに、ソースからやると一部JARが足りなくてコンパイルエラーが出るのだが、大筋には関係ないので無視。
で、どのぐらいベイズフィルターが使えるか確認するには、メールの解析をさせるて性能を見るのが早道。
ってことで、GmailにIMAPでつないでデータをとって解析しようとする・・・・
JavaMailを使ってGmailにIMAPで接続するデモコード
http://d.hatena.ne.jp/jbking/20080608/p1
うーん。世の中には親切な人がいるものだ。ってことで、INBOXのデータは取得できた。
で対照群とするSPAMのデータも拾おうとする。
で、またまた人のサイトを参考に。
送信済み、ゴミ箱、下書きなどの特定の IMAP フォルダの設定
・・・・・・・
([Gmail]/Spam または [Gmail]/Trash フォルダから削除した場合は例外で、メッセージは完全に Gmail から削除されます。)サーバ上に削除したメッセージを保存する設定にすると、削除されたメッセージの無駄なコピーを持つことになります。
IMAP 対応した Gmail を設定する(解説付き)
http://travel-lab.info/tech/pblog/article.php?id=164
ふむふむ。Spam フォルダに入れられるのだな。
ってことで、やってみると
( ̄ー ̄?).....??アレ??
そんなつれないこといわないでくださいよ・・・
大括弧が余分なのかと思って試してみるも効果なし。
で、outlookとかを立ち上げてみると、「[Gmail]/迷惑メール」との表記。まさかデフォルトのシステム設定のフォルダが漢字ってことはないだろうと疑いつつ、とりあえず試してみると、、、、
「[Gmail]/迷惑メール」で通りました。
orz........
ってことで、もう夜遅いので、ベイズフィルターは明日に持越しです。
いつ為替に適用できることやら、、、、