找回密码
 注册

插件 Plugins > Plugin 蜘蛛看门狗 v2.0(dicky_spider_watchdog)

admin 发表于 2022-4-8 12:16:04
https://www.tmd9.com/plugin.php?id=dicky_spider_watchdog* f0 ^# r( \' R; k) `
discuz_plugin_dicky_spider_watchdog_SC_GBK.xml (简体 GBK 编码)& ]& l+ H/ d% ^
discuz_plugin_dicky_spider_watchdog_SC_UTF8.xml (简体 UTF8SC 编码)9 d/ G0 a7 F- W
discuz_plugin_dicky_spider_watchdog_TC_UTF8.xml (繁体 UTF8TC 编码)
) [7 G# I4 |- I; h. G) \6 Ndiscuz_plugin_dicky_spider_watchdog_TC_BIG5.xml (繁体 BIG5 编码)  w2 s  \7 M' P( c

+ B8 y7 L' q% b  C4 O# `% ]$ V8 W) w5 b4 K1 S6 J6 u* P
插件可以阻止指定的蜘蛛、爬虫程序抓取网站,降低服务器负载,并可以设置指定版块、指定帖子ID、指定文章栏目ID、指定文章ID禁止蜘蛛和爬虫程序访问。
  C9 \! }1 _/ n+ N$ Q( [1 e( ]& O- G6 H& \
演示地址:http://dz.25941.cn
" K7 L' X* u4 ~, ^
. H7 O/ \" O" G7 i/ S搜索引擎爬虫对网站的负面影响:
! y8 Y# D) q" [. u; y( [" Z(1)、网站有限的带宽资源,而爬虫的量过多,导致正常用户访问缓慢。
& ]# Y! o9 f) o: Z例如,原本虚拟主机主机的连接数受限,带宽资源也是有限。这种情况搜索引擎爬虫受影响呈现更明显。0 U/ o0 R, w3 u# X, I
(2)、搜索引擎爬虫过频密,抓取扫描很多无效页面。甚至抓页面抓到服务器报502、500 、504 等服务器内部错误了,蜘蛛爬虫还在不停使劲抓取。
) g0 I8 g( Z5 A% P- x6 V(3)、设置了robots.txt文件不代表可以高枕无忧。: s7 H+ l* @& p# y/ w( V9 g/ t
肯定有很多人认为,在robots.txt设置屏蔽搜索引擎爬虫即可,或者允许某些特定的搜索引擎爬虫,能达到你预想效果。不错正规的搜索引擎会遵守规则,且不会及时生效。实际中某些蜘蛛往往不是这样的,先扫描抓取你的页面,无视你的robots.txt。也可能它抓取后不一定留用;或者它只是统计信息,收集互联网行业趋势分析统计。
# x: N: H9 `0 q) T+ p(4)、还有一种它们不是蜘蛛,但其有蜘蛛的特性。例如采集软件,采集程序,网络扫描e-mail地址的工具,各式各样的SEO分析统计工具,千奇百怪的网站漏洞扫描工具,等等,只有你想不到的工具,没有它做不到的...,对于这种蜘蛛,需要从网站访问日志中提取UA关键字,放到插件设置中。
' Q0 Z8 \3 N9 Q
$ [$ ~- ~5 ~! j. X2 D# f- V( S% E( q# x2 ~常见蜘蛛:0 [- a; E" H8 [' P$ B$ w: @8 i
Baiduspider; r6 a# d; R% f& s2 D  H
YodaoBot6 \% _0 D5 r1 X* Q# P8 \
YoudaoBot2 C. F1 f7 B* C
Googlebot) B, Z% L3 z2 G& W2 J1 ]0 }+ F- u9 a
Googlebot-Image& ?9 R/ i) q) c1 S9 }
Mediapartners-Google
2 Q) b% Z' w- f# KSogou-Test-Spider. z0 P. m2 X* T6 O" n+ W3 S
Twiceler# P# v* L9 y6 Q) O
Yahoo! Slurp
; B  ^! N6 D2 v$ b& h/ S9 UYahoo! Slurp China) y  V) E. ^: |8 ]$ j) Y5 z. L2 U
Yahoo!-AdCrawler
- p  w! A) B8 R' W3 x. j+ dYahoo ContentMatch Crawler
' A* j8 R$ S' ]: ~5 \; o. pSosospider
5 U, F8 I1 ^9 B( x; ?/ ]CollapsarWEB qihoobot& o  v; T+ P& y: h/ K0 p
NaverBot  ?) V" q. |; f8 ]# {4 n
sogou spider
1 L' A8 Y, z  P! S" \sogou in spider
7 @) q' _, a0 B) C8 QSogou web spider
5 O& E; ?3 }* b, ZSogou News Spider
5 h! j( b3 p4 PSogou Orion spider
+ j+ |3 N' ~2 A7 {3 wSogou head spider  h: n6 _5 t- [2 V  z9 v- m! d. o- \
SurveyBot2 e! Z- _  _- I9 i' t; s
Yanga WorldSearch Bot v
8 D9 \3 b& R! c9 ]baiduspider-mobile-gate
( S9 B/ }4 e3 x9 [discobot
2 o2 F0 X, G* Gia_archiver
3 ~* Q: N5 H4 A* S  ~* s" @msnbot
3 @" P3 Z6 m1 _msnbot-media
3 d7 Q2 F# N3 w5 U1 R& u360Spider% y" h, m- Y% k- h0 F
bingbot
7 T( m/ O& R9 s/ f2 y8 ?, @YisouSpider
4 v; U& c+ V* r6 v2 OEasouSpider4 [5 y; Q/ V' A2 W0 p, D3 a$ T
JikeSpider
, h3 U- v8 i% P" WEtaoSpider
: A. B5 n# `" T5 \6 lYandexBot: ^3 F% l; i0 m' w& u/ N- \
AhrefsBot
4 C2 r* E, l& Q- r1 Hezooms.bot5 z* a- E! Z3 e5 F& ?( F9 L, G
; b: z0 j# T1 K) T3 r3 T$ g
creditlist 发表于 2023-4-9 17:13:17
tshuz_tools
portal 发表于 2023-7-13 12:45:58
nciaer_autoforum
sms 发表于 2023-7-30 06:59:18
pin_baidu_hot
activitylog 发表于 2023-10-9 16:53:22
llx_wxfollow
todaynews 发表于 2023-12-7 05:27:23
dzl8_webmaster
Powered by Discuz! Team and Comsenz UI Team 温馨提示: 本站资源仅供学习等! 请下载后24小时内删除! 谢谢合作! Beta DZ X2 X2.5 X3 X3.1 X3.2 X3.3 X3.4 X3.5 F1.0 L1.0 UCenter Release Development
快速回复 返回顶部 返回列表