题目内容（请给出正确答案）

[单选题]

只会在需要的时候爬行新产生或发生更新的页面，并不爬行没有发生变化的页面的爬虫是（)。

A.通用网络爬虫

B.专用网络爬虫

C.聚焦网络爬虫

D.增量式网络爬虫

单选题，请选择你认为正确的答案：

ABCD

提交

如搜索结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装赏学吧APP，拍照搜题省时又省心！

更多“只会在需要的时候爬行新产生或发生更新的页面，并不爬行没有发生…”相关的问题

第1题

（)爬行的页面数量少并且更新快，可以很好地满足一些特定人群对特定领域信息的需求。

A.定量式网络爬虫

B.增量式网络爬虫

C.通用网络爬虫

D.聚集网络爬虫

点击查看答案

第2题

Page Rank优先策略常用于（)。

A.所有网络爬虫

B.通用网络爬虫

C.增量式网络爬虫

D.Deep Web爬虫

点击查看答案

第3题

网络数据采集法，主要通过网络爬虫或网站公开API的方式获取，网络爬虫从网页的（）开始获取。

A.HTML

B.WWW

C.URL

D.XML

点击查看答案

第4题

以下关于深度优先的爬行策略的说法，正确的有（)。

A.其基本方法是按照深度由低到高的顺序，依次访问下一级网页链接，直到不能再深入为止

B.处于较浅目录层次的页面都可以首先被爬行

C.爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接，直到所有链接遍历完

D.比较适合垂直搜索或站内搜索

点击查看答案

第5题

RDD有哪些缺陷？（)

A.不支持细粒度的写和更新操作(如网络爬虫)

B.基于内存的计算

C.拥有schema信息

D.不支持增量迭代计算

点击查看答案

第6题

以下关于深度优先和广度优先爬取策略的说法，正确的有（)。

A.深度优先策略比较适合垂直搜索或站内搜索

B.广度优先策略能够有效控制页面的爬行深度

C.深度优先策略的基本方法是按照深度由低到高的顺序，依次访问下一级网页链接

D.广度优先策略按照网页内容目录层次深浅来爬行页面，处于较浅目录层次的页面首先被爬行

点击查看答案

第7题

常见的分布式网络爬虫架构有（)。

A.peer-peer

B.Master-slave

C.Mixed

D.Master-worker

点击查看答案

第8题

大数据采集中的网络抓取是指通过网络爬虫或公开API等方式获取政府机构存在互联网上公开提供的数据。（)

点击查看答案

第9题

网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息网络数据采集方法。（)

点击查看答案

第10题

在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法（)？

A.深度优先

B.OPIC

C.广度优先

D.局部PageRank策略

点击查看答案

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“赏学吧”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

微信搜一搜

赏学吧

点击打开微信

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反赏学吧购买须知被冻结。您可在“赏学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

微信搜一搜

赏学吧

点击打开微信