找回密码
 注册

插件 Plugins > Plugin 蜘蛛看门狗 v2.0(dicky_spider_watchdog)

admin 发表于 2022-4-8 12:16:04
https://www.tmd9.com/plugin.php?id=dicky_spider_watchdog/ H4 A2 H' Y" [8 g3 L$ p
discuz_plugin_dicky_spider_watchdog_SC_GBK.xml (简体 GBK 编码)( R& {8 `4 E+ P2 C
discuz_plugin_dicky_spider_watchdog_SC_UTF8.xml (简体 UTF8SC 编码)
' L. q0 y1 k3 o+ E3 Sdiscuz_plugin_dicky_spider_watchdog_TC_UTF8.xml (繁体 UTF8TC 编码)
1 O6 L" j- T, t- F% U0 ~discuz_plugin_dicky_spider_watchdog_TC_BIG5.xml (繁体 BIG5 编码)
5 P' d& o" v5 C) J2 t% C8 D1 `
: H. u7 r  a# W
* [3 O! M8 o6 H8 {3 P插件可以阻止指定的蜘蛛、爬虫程序抓取网站,降低服务器负载,并可以设置指定版块、指定帖子ID、指定文章栏目ID、指定文章ID禁止蜘蛛和爬虫程序访问。, K. b# |1 z/ f
2 R" S. d. L' Y% i; \' r
演示地址:http://dz.25941.cn
+ d+ [  w5 G7 |+ m" ]/ J$ c0 P3 O0 i# K* o( `
搜索引擎爬虫对网站的负面影响:
! o" O  ^+ n8 _: A; l6 `0 y" j(1)、网站有限的带宽资源,而爬虫的量过多,导致正常用户访问缓慢。
- C, n% p3 t7 c8 d: b4 m- U例如,原本虚拟主机主机的连接数受限,带宽资源也是有限。这种情况搜索引擎爬虫受影响呈现更明显。
, w/ F8 f: C9 E: z8 ?) D& r: p2 g9 y(2)、搜索引擎爬虫过频密,抓取扫描很多无效页面。甚至抓页面抓到服务器报502、500 、504 等服务器内部错误了,蜘蛛爬虫还在不停使劲抓取。* Q( R) v7 ]" C2 z& X
(3)、设置了robots.txt文件不代表可以高枕无忧。
/ ?' `6 t; @* j: i8 A" f# z肯定有很多人认为,在robots.txt设置屏蔽搜索引擎爬虫即可,或者允许某些特定的搜索引擎爬虫,能达到你预想效果。不错正规的搜索引擎会遵守规则,且不会及时生效。实际中某些蜘蛛往往不是这样的,先扫描抓取你的页面,无视你的robots.txt。也可能它抓取后不一定留用;或者它只是统计信息,收集互联网行业趋势分析统计。# j; w' h% V- i. g
(4)、还有一种它们不是蜘蛛,但其有蜘蛛的特性。例如采集软件,采集程序,网络扫描e-mail地址的工具,各式各样的SEO分析统计工具,千奇百怪的网站漏洞扫描工具,等等,只有你想不到的工具,没有它做不到的...,对于这种蜘蛛,需要从网站访问日志中提取UA关键字,放到插件设置中。
5 q# \7 X; \. _# r. x7 C( r
* m* j3 S! i, x$ s6 l. J9 `" N: E常见蜘蛛:
! G& w8 c& `7 [! U8 pBaiduspider
! C4 o0 W& w# u* NYodaoBot
1 u. u0 K' E: \$ a, P0 WYoudaoBot
% L2 h3 m$ |3 v, }% mGooglebot
9 P" [& N+ s7 \- }8 mGooglebot-Image5 G/ }) T0 A# o7 j2 V  L5 |* p2 U
Mediapartners-Google: O" N7 V5 p  G$ Z: o5 t
Sogou-Test-Spider  F; q/ L+ A9 j, ^+ l4 X: l
Twiceler
  N; A7 K6 [, P/ v3 v* VYahoo! Slurp
2 n" n" `/ V% p' @Yahoo! Slurp China" y+ z. k4 S$ _  ]. i- \
Yahoo!-AdCrawler/ ~+ s3 A, a7 T/ N. x2 L/ y
Yahoo ContentMatch Crawler1 |! x6 o4 _4 d- I
Sosospider
9 R5 b3 l7 s2 c+ r# [; iCollapsarWEB qihoobot$ Z( T6 T1 H6 g: M
NaverBot1 Z* `9 u7 o# k1 C
sogou spider
( Y4 X% W4 U- ]. [9 t* Wsogou in spider8 }  Z* u2 i, ]' [
Sogou web spider
  ?" Q$ q7 j' v, h- wSogou News Spider
# \, E: O! l/ ]9 T" q' j* [Sogou Orion spider
1 k& b+ J  r% ]! w1 F! @  eSogou head spider$ Y. ~' ^; U4 R: k% z
SurveyBot& h) a8 t" b2 z9 }" ~; b
Yanga WorldSearch Bot v
2 m: p2 q- J; l4 @baiduspider-mobile-gate5 ?/ y- `' G0 t' |  a5 }  O
discobot( S$ g, h" N( W1 K
ia_archiver
8 g; {+ M/ G& rmsnbot: U# i3 d3 K2 C. \& y% a* d
msnbot-media
$ f2 j$ [" [. j7 J360Spider
! G, V! o$ k# g  _& U2 }8 ^! qbingbot
0 X4 [( F' |4 k8 uYisouSpider; p) i+ s' Z. p- D
EasouSpider
6 \  q# J3 F% EJikeSpider
/ q, X& B, f: _9 r3 OEtaoSpider7 [: l+ r$ W4 \
YandexBot
+ }4 k8 v) s) x9 j0 e' kAhrefsBot% e: s; U% R* j( j: c% n
ezooms.bot
! P% P8 n1 [( V" [  `7 D+ U& M7 D7 P! p# I: K' g/ ~4 e+ _4 T! i
creditlist 发表于 2023-4-9 17:13:17
tshuz_tools
portal 发表于 2023-7-13 12:45:58
nciaer_autoforum
sms 发表于 2023-7-30 06:59:18
pin_baidu_hot
activitylog 发表于 2023-10-9 16:53:22
llx_wxfollow
todaynews 发表于 2023-12-7 05:27:23
dzl8_webmaster
Powered by Discuz! Team and Comsenz UI Team 温馨提示: 本站资源仅供学习等! 请下载后24小时内删除! 谢谢合作! Beta DZ X2 X2.5 X3 X3.1 X3.2 X3.3 X3.4 X3.5 F1.0 L1.0 UCenter Release Development
快速回复 返回顶部 返回列表