低质量的个人、小型爬虫存在的主要问题有下面:?


低质量的个人、小型爬虫存在的主要问题有下面:?

A、不遵守Robots协议,链接一个Web服务器之后不检测虚拟根目录下是否存在robots.txt文件,也不管文件里面关于页面访问许可列表的规定。

B、规范了网络的爬虫爬行行为。

C、爬行策略没有优化

D、许多爬虫实现了多线程、分布式的架构,对于网络爬虫仅仅”一厢情愿“。

E、爬行策略、增量模式等问题没有解决好。

正确答案:不遵守Robots协议,链接一个Web服务器之后不检测虚拟根目录下是否存在robots.txt文件,也不管文件里面关于页面访问许可列表的规定。|爬行策略没有优化|许多爬虫实现了多线程、分布式的架构,对于网络爬虫仅仅”一厢情愿“。|爬行策略、增量模式等问题没有解决好。


Tag:爬虫 策略 文件 时间:2024-05-07 20:36:59