题目内容（请给出正确答案）

[单选题]

搜索引擎的网页抓取程序是通过（)来连续抓取网页的。

A.超链接

B.网络蜘蛛

C.短标题

D.人工收录

如搜索结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装赏学吧APP，拍照搜题省时又省心！

更多“搜索引擎的网页抓取程序是通过()来连续抓取网页的。”相关的问题

第1题

每个独立的搜索引擎都有自己的网页抓取程序（spider)。spider顺着网页中的超链接，连续地抓取网页，被抓取的网页被称之为（)

A.网页截图

B.网页索引

C.网页快照

D.网页标记

点击查看答案

第2题

对网页进行两次抓取，第一次是正常的搜索引擎爬虫抓取，第二次以模拟人工访问页面的方式抓取，如果两次抓取到的内容差异较大，则认为是作弊页面，这属于（)。

A、链接反作弊

B、反内容作弊

C、识别网页重定向

D、识别页面隐藏

点击查看答案

第3题

搜索引擎的信息搜集基本都是自动的，它利用称为网络蜘蛛的网页顺着网页中的（)连续地抓取网

A.标题

B.图片

C.超链接

D.关键词

点击查看答案

第4题

网络爬虫（网页蜘蛛或网络机器人）是一种按照一定的规则，自动抓取互联网信息的程序或者脚本，是搜索引擎的重要组成（）

点击查看答案

第5题

网络爬虫（网页蜘蛛或网络机器人)是一种按照一定的规则，自动抓取互联网信息的程序或者脚本，是搜索引擎的重要组成。（)

点击查看答案

第6题

搜索引擎派出的一个能够在网上发现新网页并抓取文件的程序被称为蜘蛛（spider)或机器人（robo

搜索引擎派出的一个能够在网上发现新网页并抓取文件的程序被称为蜘蛛 (spider)或机器人(robot)。()

点击查看答案

第7题

网络营销导向网站设计的（)，是充分适应用户通过网页浏览获取信息的习惯并且符合搜索引擎抓取网页内容的一般规律。

A.基本思想

B.主要内容

C.目标

D.工作方法

点击查看答案

第8题

关于Whisker对Apache的扫描，下面说法正确的是：A、通过模式匹配方法，禁止掉具有某些特征的访问

关于Whisker对Apache的扫描，下面说法正确的是：

A、通过模式匹配方法，禁止掉具有某些特征的访问请求，可以通过 LocationMatch来配置

B、在cgi-bin目录，建立欺骗性脚本，当Whisker扫描到这些脚本时，这些脚本被执行。在这些脚本里通过定义一些功能，比如报警功能，可以发邮件告知管理员发生了cgi扫描

C、robots.txt文件是帮助google、baidu等搜索引擎抓取网页用的用的，扫描软件没有利用这种技术

D、以上说法均不正确

点击查看答案

第9题

全文搜索引擎拥有自己的检索程序，能够自己从互联网中抓取网页建立数据库，从自身的数据库中调用搜索结果。（）

此题为判断题(对，错)。

点击查看答案

第10题

以下关于网络爬虫的描述中，错误的一项是（)。

A.在爬虫开始的时候，需要给爬虫输送一个URL列表，作为爬虫的起始位置

B.爬虫程序会抓取所有网页，以保证搜索正确性

C.根据某种抓取策略爬行新发现的URL，如此重复下去

D.对于商业搜索引擎来说，分布式爬虫是必须采用的技术

点击查看答案

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“赏学吧”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

微信搜一搜

赏学吧

点击打开微信

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反赏学吧购买须知被冻结。您可在“赏学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

微信搜一搜

赏学吧

点击打开微信