以前、こちらで紹介した話の続報。

前回の設定でみごと、.dynamic.163data.com.cn のブロックは順調にできてます。
けど、アクセスそのものは、未だ無くなりません。
でも、実質的な被害もなくなったので、あとは放置しておいてよさそうです。

これでログがすっきりしたことで、今度は別のホストからのアクセスが目立つようになってきました。

 hn.kd.ny.adsl

調べた限り、某国のクローラーのようです。
アクセス数が突然上がる時があり、ログを確認するとこのホストのようです。
クロールしていただくことは大歓迎なのですが、接続ごとに別IPアドレスで大量にくるので、ログが荒れてしまいます。

例のごとく対策しましたので、また記録を残しておきます。

そもそも、.adslなるトップレベルドメイン(TLD)なんてあるのか?
TLDはどんどん新設されているで、私が知らないだけということもあるのですが、やはり存在してなさそうです。
DNSの逆引きで、存在しないホスト名を名乗られるというのは、あまり気持ちいいものではありません。

このホスト名(hn.kd.ny.adsl)も、当然、DNSの正引きができないので、
 Deny from hn.kd.ny.adsl
上記では前回同様に、.htaccess でのブロックはできないと思われます。
ググってみると、できているような記事も見かけるのでやはりApacheには、2重逆引きチェックしないバージョンもあるのかな?
無論、前回のソース書き換えしたApacheなら、これでもブロック可能です。

このクローラーは親切で、User-Agent(自分がどんなブラウザであるか自己申告する情報)に、特定の文字列を入れてくれます。

 360Spider

少し調べた限りでは、この識別を使うのは、このクローラーのみのようですから、これを使わない手はありません。
.htaccess に以下の記述を追加します。

SetEnvIf User-Agent "360Spider" deny_agent
deny from env=deny_agent

これらなら誤って余計なホストまでブロックしてしまうこともなくよさそうです。
実際にこれらの設定を追加して、現在は様子見です。

中国からのアクセスも歓迎しますし、記事を世界中から見ていただけるのはうれしい限りなのですが、通常の範囲を逸脱した集中アクセスがあると、少し困りますので。
巻きぞえになってしまうホストがありましたらすみません。

P.S.
ブロックはうまくいってるのですが、思っていた以上に実際にアクセスして読んでいただいてる方が少ないことも露見して、少ししょんぼりです。。。

コメント

  • コメントはまだありません。

コメント登録

  • コメントを入力してください。
登録フォーム
名前
メール
URL
コメント
閲覧制限
投稿キー
(スパム対策に、投稿キー を半角で入力してください。)