https://www.tmd9.com/plugin.php?id=tpgao_toutiao
" P9 I- o2 w& @; t. q+ F$ X$ s" adiscuz_plugin_tpgao_toutiao_SC_GBK.xml (简体 GBK 编码)
& G0 }6 {, h/ X3 ]& pdiscuz_plugin_tpgao_toutiao_SC_UTF8.xml (简体 UTF8SC 编码)
3 a, y1 P: C! l0 c' {% Q* z" Bdiscuz_plugin_tpgao_toutiao_TC_UTF8.xml (繁体 UTF8TC 编码)2 z4 q4 T0 G2 d+ k& I8 t& N( D6 Y
discuz_plugin_tpgao_toutiao_TC_BIG5.xml (繁体 BIG5 编码)$ S4 l1 l! L6 o* h6 f
8 o/ Y$ W( E5 h: m, F$ k
, p6 v7 f) H+ h% o$ W传统采集器基于页面(如PHP),这种方式的问题在于在服务器端运行,加大服务器压力,也很容易造成服务器IP被屏蔽,同时,由于PHP的先天语言特性,假死、不确定性、定时不方便等诸多问题;' L |8 s5 O2 e- R+ g, j
重要问题:头条等服务器已经采用浏览器本地渲染方式来加载数据,传统的curl等已经很难拿到数据,本客户端克服了该问题,基于现在流行的渲染采集技术来采集数据;
A. J" N8 x- r' w& ?9 x相对于传统采集器,有如下特性3 l5 i* t0 r8 I4 a& f/ r
. c K3 H5 U& c$ x3 j1、稳定、基于客户端运行,减小对服务器造成压力;
4 s2 J; q1 H, T; w4 ]4 L. s- ?2、可以配合IP池更换IP(后期规划,目前版本没有);
" b- t! n4 p+ q; s. s n/ T+ P3、定时及运行方便;+ r4 J- m l' o' ~
4、本地渲染数据,可以很轻松的爬取数据;" b, T- X/ e- a, n0 V+ `
" }+ M7 Q% J8 b; D* K
购买后客户端可以找客服索取;
$ Q) i) K8 {2 [. C2 T) a# @! @6 ~5 I9 }+ r
|