― MozillaZine.jp フォーラムは Mozilla 製品に関する情報交換の場です ―



All times are UTC + 9 hours

新しいトピックを投稿する このトピックは閉鎖されているため、編集・返信することはできません  [ 4 件の記事 ] 
作成者 メッセージ
投稿記事Posted: 2011年10月17日(月) 14:00 
オフライン

登録日時: 2011年10月17日(月) 13:31
記事: 2
これまで正常に働いていたのに迷惑メールの学習機能どころかひとつも削除してくれません。
training.datは2.1kB。 notepadで開けようとしましたが膨大な文字化けファイルでした。
迷惑メールの学習の数の上限というのはあるのでしょうか。
これまでの機能を復活し更に学習して行って欲しいのですが、やり方はありますか。

OS:Windows XP Pro SP3 2002
Intel Core2 Quad 2.4G
Mem:4GB


通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2011年10月17日(月) 16:54 
オフライン

登録日時: 2006年9月05日(火) 18:47
記事: 4207
 
*質問・投稿する前に フォーラムの利用について を読んでその内容を理解した上でそれに
 沿って投稿しましょう。
*ご自分の利用環境として Thunderbird の正確なバージョンぐらいは書き添えましょう。
*質問した後やアドバイスをもらった後には結果や経緯を必ず書くようにしましょう。



teric さんが書きました:
これまで正常に働いていたのに迷惑メールの学習機能どころかひとつも削除してくれません。

そのようになる直前に何かありませんでしたか?
Thunderbird のアップデートをしたとか、アドオンを入れたとか。。。。
また学習していた状態記録を確認してみましたか?
 #[オプション] > [セキュリティ] > [迷惑メール] でログを有効にしていれば確認できます。

teric さんが書きました:
training.datは2.1kB。 notepadで開けようとしましたが膨大な文字化けファイルでした。

training.dat はバイナリデータですので通常のテキストエディタで編集できるものではありません。

teric さんが書きました:
これまでの機能を復活し更に学習して行って欲しいのですが、やり方はありますか。

以下を試して改善されるか確認してみましょう。
但し、元通りに復元は無理ですので新たに再学習することになります。

1.迷惑メール学習データのリセット
  [オプション] > [セキュリティ] > [迷惑メール] > [判別基準データのリセット] を実行する。
  #リセット後に Thunderbird を再起動して確認です。
2.初期化
  training.dat を削除するか、別の場所にバックアップ移動して初期化する。
  #Thunderbird を終了させた状態でおこない、その後起動して確認です。 

結果、どうなったか教えてください。
 


最後に編集したユーザー kiki [ 2011年10月19日(水) 23:30 ], 累計 1 回

通報する
ページトップ
 プロフィール  
引用付きで返信する  
投稿記事Posted: 2011年10月19日(水) 21:05 
横から失礼します。

下記の点についての補足です。

teric さんが書きました:
迷惑メールの学習の数の上限というのはあるのでしょうか。

いちおう上限が規定されているみたいですよ。

mailnews.bayesian_spam_filter.junk_maxtokens ; 100000(初期値)

初期値では、判別用の単語数の上限が 10 万語とされているようです。
ただ、これを超えたからといって迷惑メールフィルタが働かなくなるかどうかは知りません。
  | 当方の環境では、たぶん上限まで十分のゆとりを持ったまま、
  | ほぼ確実に迷惑メールを振り分けてくれていますので、
  | 学習内容の上限超えを経験したことがありません。


この 10 万を多いと見るか少ないとみるかはユーザーの利用条件とニーズしだいだとは思いますが、もし学習内容の上限を緩和したいのなら、この値を上げればよいと思われます。
しかし同時に、学習データの大量蓄積による弊害(*)が現れる危険性が高まることへの、覚悟は必要だと思います。
ぼく自身はやったことがありませんし、積極的にはお勧めしません。どうするかはご自身でご判断ください。

(補足)
― この種のフィルタ処理では、判別データの蓄積(学習)で精度が上がる反面、状況によっては肥大化した判別データによってフィルタ処理に大きな負担がかかることがあります(*)。そのため、際限なく学習データを蓄積して Thunderbird そのものに動作不良を引き起こさないよう、学習内容の上限が設けられているのだと思われます。
― いくら学習を積んでもフィルタリングの効率が上がらないとき、蓄積された学習結果(training.dat)に問題が起っていることも考えられるます。そのまま学習データを蓄積し続けるより、面倒でも一度リセットして学習を積み直したほうが効果的にデータを蓄積できるケースもあります。


とりあえず以上です。外してたらすみません。


通報する
ページトップ
  
引用付きで返信する  
投稿記事Posted: 2011年10月21日(金) 00:30 
オフライン

登録日時: 2011年10月17日(月) 13:31
記事: 2
kikiさん

ありがとうございました。
training.datを削除して、又一からの迷惑メール学習が始まりました。

偶然的通行人さん
丁寧な解説をありがとうございました。
上記のように問題が解決しました。 


通報する
ページトップ
 プロフィール  
引用付きで返信する  
期間内表示:  ソート  
新しいトピックを投稿する このトピックは閉鎖されているため、編集・返信することはできません  [ 4 件の記事 ] 

All times are UTC + 9 hours


オンラインデータ

このフォーラムを閲覧中のユーザー: Google [Bot] & ゲスト[82人]


トピック投稿:  可
返信投稿:  可
記事編集: 不可
記事削除: 不可
ファイル添付: 不可

検索:
ページ移動:  
Powered by MozillaZine.jp® Forum Software © phpBB Group , Almsamim WYSIWYG
Japanese translation principally by ocean