スポンサーサイト 

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

SpamAssassinを入れてみる 

なんで今更SpamAssassinを入れるのかと言えば、ISPや携帯会社のSPAM対策が今一、今二、今三位に感じられてきたので、自前でやろうという気になったため。
きちんとベイズ学習させれば非常に精度良くなるはずなんだよね。

というわけでとりあえず入れて試してみてからどうやって本番で使っていくかを再度検討する予定。特に携帯からはK-9 Mailとかで普通にメールをやりとりできるので、キャリアメールも全部自前サーバのSpamAssassin経由にして良いんじゃないかな、と思っている。

ただ、自分は使ったことがこれまでにないので分からないことも多い。例えばSPAMが通常のメールとして通過してきた場合、またはその逆に通常のメールがSPAM判定された場合どうやって学習させれば良いのかその手順が分からない。調べながらやっていこう~


SpamAssassinのインストールと初期設定


必要な周辺ソフトの一括インストール

yum install spamassassin
rpm -e spamassassin



spamassassinのtarballを入手、展開

wget http://mirrors.go-part.com/apache//spamassassin/source/Mail-SpamAssassin-3.3.2.tar.gz
tar -zxf Mail-SpamAssassin-*.gz



日本語パッチを入手、適用

mkdir patch
cd patch
wget http://spamassassin.emaillab.jp/pub/ja-patch/sa3.3/spamassassin-3.3.2-ja-1.patch
cd ../Mail-SpamAssassin-3.3.2
patch -p1 ../patch/spamassassin-3.3.2-ja-1.patch



Makeとかしてインストール

perl Makefile.PL
make
make install



日本語パッチに必要な設定とかを行う
[/etc/mail/spamassassin/local.cf]

normalize_charset 1
loadplugin Mail::SpamAssassin::Plugin::Tokenizer::SimpleJA
loadplugin Mail::SpamAssassin::Plugin::Tokenizer::MeCab



なんやら必要なファイルを入れる

cd /etc/mail/spamassassin
wget http://spamassassin.emaillab.jp/pub/ja-patch/sa3.3/tokenizer.pre



ええい、めかぶも入れてしまえ。

めかぶのインストール

mkdir ../MeCab
cd ../MeCab
wget http://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar -zxf mecab-0.996.tar.gz
cd mecab-0.996
./configure --with-charset=utf8
make
make check
make install



めかぶ辞書のインストール

mkdir ../../MeCab-ipadic
cd ../../MeCab-ipadic
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar -zxf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
make install



MeCabのPerlバインディングmecab-perlインストール

cd ../..
mkdir MeCab-perl
cd MeCab-perl
wget http://mecab.googlecode.com/files/mecab-perl-0.996.tar.gz
tar -zxf mecab-perl-0.996.tar.gz
cd mecab-perl-0.996
perl Makefile.PL
make
make install



これでインストールは一通り終わりかな。次は初期設定だ。
次のエントリに続けてみる。

コメント

コメントの投稿















管理者にだけ表示を許可する

トラックバック

この記事のトラックバックURL
http://haginov.blog35.fc2.com/tb.php/237-b667f78c

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。