1.前端纯HTML+JS+JSON(链接统计除外),后端python生成标准JSON
2.自带30几个常用网站采集规则
3.多线程抓取,30+网站5秒内采集完毕
4.相同网站放在一个框架内,可局部刷新和滚动
5.更新时间显示(按采集页的自带更新时间或按时间排序的第一条时间采集,没有的为采集完成时间)
6.内容链接防盗链,链接通过base64+字符逆序+大小写反转+base64实现加密(更换大小写转换顺序或增加数字替换可实现不同密码加密)
7.内容链接点击统计
8.部分内容鼠标悬停提示(如appstore排行有更新内容、时间、版本号)
安装:
1.python3 caiji.py采集(保持后台运行请用screen或nohup)
2.打开首页访问
笔记:
caiji.py为后端采集程序,其余为前端,需在同一目录下
相应的设置修改请参考源码中的注释
admin.php是第三方数据库管理程序,用于查看内容链接统计(默认密码为admin,请在文件中修改)
点击统计数据库log.db,第一次访问内容链接会生成,如果没有建立,请确保主目录可写
为安全起见,请将后台程序caiji.py和数据库查看程序admin.php改成复杂的文件名,或移动到非web目录下(文件中生成的json存放目录需要修改在同时为网站根目录,默认为当前目录)
默认使用多线程爬取,如有问题请使用单线程
请用您自己的 cookie 替换今日头条的集合。头条短线采集,相同内容过多(目前1分钟采集一次,合并10次)。同一个cookie分段收集后几乎不会重复。推荐内容均为杂乱无章的垃圾内容(请定期更换cookies或自行添加随机头条cookie生成规则)
大部分采集站的logo修改为透明图层png,在非白色背景下可能会难看
© 版权声明
文章版权归作者所有,未经允许请勿转载。