低质量的个人、小型爬虫存在的主要问题有下面:?
低质量的个人、小型爬虫存在的主要问题有下面:?
A、不遵守Robots协议,链接一个Web服务器之后不检测虚拟根目录下是否存在robots.txt文件,也不管文件里面关于页面访问许可列表的规定。
B、规范了网络的爬虫爬行行为。
C、爬行策略没有优化
D、许多爬虫实现了多线程、分布式的架构,对于网络爬虫仅仅”一厢情愿“。
E、爬行策略、增量模式等问题没有解决好。
正确答案:不遵守Robots协议,链接一个Web服务器之后不检测虚拟根目录下是否存在robots.txt文件,也不管文件里面关于页面访问许可列表的规定。|爬行策略没有优化|许多爬虫实现了多线程、分布式的架构,对于网络爬虫仅仅”一厢情愿“。|爬行策略、增量模式等问题没有解决好。
- 上一篇:爬虫技术评价方法有:
- 下一篇:网络爬虫技术出身于:?