![]() |
Baiduspider のIP アドレスを見ると、中国のポータルサイトのようですね。
nslookup で逆引きしてみたら、逆引きできなかったので
アヤシイサイトに決定しておきまつ。
中国だって突き止めるのに APNIC で cctld 見ながら探しちゃったぢゃねーか。
オイ!みたいな。
GET リクエストの出し方は
の一言。
1 週間で約 6,000Hit っつーのは、
ミタイな。Ultra60 で細々とがんばってるウチにやるなっつーのっ!!
で、Log に載っかってた Baiduspider リクエストの一例
複数行に渡って見えちゃってると思うけど、実際には 1 行でつ。
60.28.17.40 - - [15/Oct/2006:03:49:54 +0900] "GET /ksh.html HTTP/1.1" 404 206 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" |
この Baiduspider、ちょこっと google ってみただけでいっぱい Hit しまつね。
他の方々もお困りのご様子。
robots.txt も読まないようでお行儀の悪さは
ルーターで拒否れれば一番良いのでしょうけれども、.htaccess で拒否る事にしまつた。
Baiduspider 対応の .htaccess のリストはすでに沢山 google れると思いますが・・・
SetEnvIf User-Agent "Baiduspider" deny_user-agent order allow,deny allow from all deny from env=deny_user-agent |
でつ。
あ、
http://www.baidu.com/search/robots.htmlに、拒否り方書いているみたい。
だけど、中国語(普通語ってゆーのが正確なのかな?)解んないや。
yahoo 翻訳とかすらする気ナシっす。
ざっと見た感ぢ、
User-agent: baiduspider Disallow: / |
でも良いミタイだけれども、
と思ったら、読みにきてるよっ。
でも、robots.txt を読みにくる頻度は非常に低いようでつし、
その後も GET リクエスト出しまくりのところを見ると・・・
エモーショナルに GET してるんだから、さぞやエモーショナルな検索をしてくれるのであろう。
Baidu で検索してみた。
検索結果もエモーションでつた。
ふと、思ったのですけれども、Baidu の拒否りかたのページも
GET してるんだよねっ?
情報元は、 IT media News の 2006 年 12 月 04 日掲載の 中国の検索エンジンBaidu、日本進出へから。
「日本の検索エンジンユーザーは、既存のものに代わる ユーザーフレンドリーな検索エンジンを提供するBaiduの 強力な日本語検索技術を高く評価するだろう」(同氏)
*IT media News の記事から抜粋
おいらサイトをエモーショナルに get しておきながら検索に引っかからないのに、
ミタイな。
・第壱次 baidu 戦役 - Baidu タンをなんとかする
・第弐次 baidu 戦役 - Baidu タン再び降臨
・第参次 baidu 戦役 - Baidu 魔王、三度降臨
・第四次 baidu 戦役 - Baidu 魔神、四度降臨
・第伍時 baidu 戦役 - baidu.jp を拒否る。
・第六次 baidu 戦役 - baidu 対策のまとめ
・第七次 baidu 戦役 - BaiduChecker, BaiduMobaider を拒否る。