Go to TOP Page
Google:


□ia_archiver ってナニ?


○いわゆる、クローラーでつ。

robots.txt には従うようで、お行儀の良いクローラーッぽいのでつが、大きな問題が 1 つありまつ。
どこからもリンクされていないハズ(隠しページとか)の Web ページを

モリモリ GET していきまつ(@_@;)

どこからリンクを探してきたの〜?と思ってぐぐってみると・・・
Alexa Toolbar ってブラウザの plugin が原因。
コイツが閲覧している URL 情報を Alexa に送信されているモヨウでつ。
んで、ia_archiver は Alexa に蓄積された URL 情報を元に隠しページをも GET してくるよーでつ。 要は、 Alexa Toolbar を install したヤツが関係者限定 page の URL を漏らしているのら。

Alexa Toolbar 自体の詳細は、 SpywareGuide を参照してください。
ってゆーか、

扱いが Spyware だよね。

□拒否りかた


○Alexa に書いてあるよ。

□ia_archiver を拒否る。

robots.txt で Disallow すればおっけ。
拒否り方は、 http://www.alexa.com/site/help/webmasters に書いてあるので、先ずはそちらを参照あれ。
んで、書き方は、


robots.txt
User-agent: ia_archiver
Disallow: /

と、ゆぅことで。


□Alexa Toolbar をインストールしているブラウザを拒否る

拒否りたいディレクトリに .htaccess を作って、

.htaccess
BrowserMatch "Alexa" alexa
<Limit GET>
    order deny,allow
    deny from env=alexa
</Limit>

□一番ヨイ拒否りかた

確実なのは、 basic 認証とかするのがヨイそうでつ。
状況により検討してみてくらさい。




go back    next
Copyright(c) ORATORIO-TANGRAM.com 2001-2007 All Rights Reserved.
Total:counter