https://www.tmd9.com/plugin.php?id=tpgao_toutiao5 B/ A( X8 J6 z2 g! g% t
discuz_plugin_tpgao_toutiao_SC_GBK.xml (简体 GBK 编码)
" @! \5 J2 Z9 N* T* [. [discuz_plugin_tpgao_toutiao_SC_UTF8.xml (简体 UTF8SC 编码)
f. }3 v' ` q4 p! i3 Wdiscuz_plugin_tpgao_toutiao_TC_UTF8.xml (繁体 UTF8TC 编码)+ Q' h* \0 m: y
discuz_plugin_tpgao_toutiao_TC_BIG5.xml (繁体 BIG5 编码)& B- F! p" t& ^" N7 E" |, K5 g5 u3 |
$ O4 o/ a* Q: C1 V2 N. V
% n3 c& {" Y0 k8 [) j) o传统采集器基于页面(如PHP),这种方式的问题在于在服务器端运行,加大服务器压力,也很容易造成服务器IP被屏蔽,同时,由于PHP的先天语言特性,假死、不确定性、定时不方便等诸多问题;$ T9 K8 ?' y" O
重要问题:头条等服务器已经采用浏览器本地渲染方式来加载数据,传统的curl等已经很难拿到数据,本客户端克服了该问题,基于现在流行的渲染采集技术来采集数据;
& r+ l( f& }/ A, a+ ^, A相对于传统采集器,有如下特性/ j# i& C+ b" }1 P2 S7 G- v( M
* m2 p( X5 `& `$ A/ g7 k+ D1、稳定、基于客户端运行,减小对服务器造成压力;, h7 ^+ @7 y; p1 N8 c9 N9 H
2、可以配合IP池更换IP(后期规划,目前版本没有);
6 J8 p. i% e$ l3 U n3、定时及运行方便;. B- ?; I' u! E% n4 R5 c
4、本地渲染数据,可以很轻松的爬取数据;
$ `& }. K$ Q& s: q, v$ Z
# }6 U2 R6 [/ N/ d购买后客户端可以找客服索取;
# B; }; A) O( F& f2 M0 P- @+ b! E; k* p( ~6 C( i) }4 Z2 S! n
|