Go to TOP Page
Google:


□また来たのぉ????


○お引取り願うだけだけどね。

もぉーちょっと空気読めよ。
ミタイな。
今日は、 2007/08/14 日。
Baidu タンをなんとかするで 事態は沈静化するかと思われましたが、手法を変えて再び降臨してやんの。

相変わらずエモーション

ログはこんなかんぢ。

Apache のログの一例
ip-122-152-128-48.asianetcom.net - - [01/Aug/2007:01:04:23 +0900] "GET / HTTP/1.1" 403 202 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"

今回の Baiduspider はお行儀が良くなっているやぅでつ。
robots.txt を GET して、Baiduspider が Disallow されていれば、 クロールする動きは見られませんでした。

一瞬、ナイス━━━━━━(゚∀゚)━━━━━━ !!!!!と思ったのですが、

robots.txt ばっかり GET するなっ!

多いときで、1日アタリ 15 回前後・・・・
robots.txt や、 / を GET しにきていまつた。
ま、実害はないので・・・・・・と、思ったらっ!☆-Σ(゚∀゚)!

やっぱ、robots.txt 無視かよ。

でつが、不思議な動きでつ。アクセス元の、

何ゆえにこのやぅな動きをするのでせぅか?
役割分担が決まっているのでしょーか?

クロールの頻度は極端に少なくなっていまつが、結局、 robots.txt は無視ってことでつた。
それとも、 DNS を逆引きできるようになっただけ進歩したと見るかっ?
ここまで来ると、 ip address で drop するしかなさそうでつね。
っつーワケで .htaccess に ip address で deny しまつ。


□.htaccess で拒否る。


○設定はカンタン

.htaccess
Order allow, deny
Allow from all
Deny from 122.152.128.
Deny from 122.152.140.
Deny from 122.152.129.

こんなとこか。
これで暫く様子を見てみまつ。
ルーターで drop させるのがイチバンのやぅな気がしまつが。


□baidu に関するエントリ


・第壱次 baidu 戦役 - Baidu タンをなんとかする
・第弐次 baidu 戦役 - Baidu タン再び降臨
・第参次 baidu 戦役 - Baidu 魔王、三度降臨
・第四次 baidu 戦役 - Baidu 魔神、四度降臨
・第伍時 baidu 戦役 - baidu.jp を拒否る。
・第六次 baidu 戦役 - baidu 対策のまとめ
・第七次 baidu 戦役 - BaiduChecker, BaiduMobaider を拒否る。





go back    next
Copyright(c) ORATORIO-TANGRAM.com 2001-2007 All Rights Reserved.
Total:counter