https://www.tmd9.com/plugin.php?id=tpgao_toutiao/ `! Z% m$ F1 L6 F
discuz_plugin_tpgao_toutiao_SC_GBK.xml (简体 GBK 编码)
6 H, W- F5 x* T# f: Bdiscuz_plugin_tpgao_toutiao_SC_UTF8.xml (简体 UTF8SC 编码)
3 w! f- x& p# Gdiscuz_plugin_tpgao_toutiao_TC_UTF8.xml (繁体 UTF8TC 编码)6 F& T. z- L- [$ C! K
discuz_plugin_tpgao_toutiao_TC_BIG5.xml (繁体 BIG5 编码)
$ E0 I8 N; c' x0 V, g7 x
$ z6 ]: g- F9 U9 q! h1 T0 }4 ]- K- C1 |
传统采集器基于页面(如PHP),这种方式的问题在于在服务器端运行,加大服务器压力,也很容易造成服务器IP被屏蔽,同时,由于PHP的先天语言特性,假死、不确定性、定时不方便等诸多问题;
- L# c' E4 B+ D1 r 重要问题:头条等服务器已经采用浏览器本地渲染方式来加载数据,传统的curl等已经很难拿到数据,本客户端克服了该问题,基于现在流行的渲染采集技术来采集数据;
- a g/ v% R, n+ m% g" o相对于传统采集器,有如下特性2 F, Z3 j: O ]! B5 ?
- y1 k8 I7 V `$ v2 p
1、稳定、基于客户端运行,减小对服务器造成压力;
. T; E( I4 p" K1 t5 j# E2、可以配合IP池更换IP(后期规划,目前版本没有);5 V: H" b R6 g b- t* y
3、定时及运行方便; w! r: z7 G+ Y% w; t0 z" O' L
4、本地渲染数据,可以很轻松的爬取数据;4 E n; _6 `; V3 d# ~8 ]
# {: T: T0 Z3 v购买后客户端可以找客服索取;' y9 P2 i# H9 {- Q
6 p% v$ D6 K: @; L* l' B$ F |