题目内容（请给出正确答案）

[主观题]

2、数据大概有两种来源：现实生活与网络。传感器和系统日志是从现实生活进行数据采集， Web爬虫是从网络进行数据采集。

答案

错误

如搜索结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装赏学吧APP，拍照搜题省时又省心！

更多“2、数据大概有两种来源：现实生活与网络。传感器和系统日志是从…”相关的问题

第1题

2、采集数据时，根据不同的数据来源我们可以采取不同的采集方法，下列属于有效的数据采集方法的有（）。 ①复制数据文件 ②从信息系统导出数据 ③爬取网络数据 ④从微信企业号接口接收数据 ⑤数据采集器接收温度传感器数据

A.①②③④

B.①③④⑤

C.②③④⑤

D.①②③④⑤

点击查看答案

第2题

关于网络爬虫，说法正确的是

A.网络爬虫也叫做网络机器人，可以代替人们自动地在互联网中进行数据信息的采集与整理

B.网络爬虫是数据采集的一种方式

C.网络爬虫爬取互联网上的信息，不会受到限制

D.网络爬虫可以代替手工做很多事情

点击查看答案

第3题

下列关于网络爬虫的说法中，不正确的是（）。

A.网络爬虫广泛用于互联网搜索引擎或其他类似网站，以获取或更新这些网站的内容和检索方式

B.爬虫获取数据的方式为模拟浏览器发送请求，然后提取有用的数据，最后存放于数据库或文件中。

C.从功能上来讲，爬虫一般分为数据采集和处理两个部分

D.利用网络爬虫能自动完成数据获取、汇总的工作，大大提升了统计工作的效率。

E.网络爬虫技术在互联网时代具有较大的应用价值

点击查看答案

第4题

大数据采集方面，网络爬虫是Python的传统强势领域。

点击查看答案

第5题

30、第六章网络数据采集的教学目的是（）

A.介绍爬虫的定义与规范，让大家可以使用简单的爬虫合理合法的进行采集，满足部分研究需要

B.学习如何进行反爬虫

C.学习如何入侵网站

D.学习如何入侵他人电子设备

点击查看答案

第6题

下列说法错误的是

A.受限于编写水平和目的，网络爬虫将会为Web服务器带来巨大的资源开销

B.网络爬虫可能具备突破简单访问控制的能力，获得被保护数据从而泄露个人隐私

C.服务器上的数据没有产权归属，可以通过网络爬虫获取数据后牟利利益

D.网络爬虫会引起性能骚扰，法律风险和隐私泄露

点击查看答案

第7题

1、以下哪个步骤不属于数据的采集与预处理：

A.利用ETL工具将分布的、异构数据源中的数据，抽取到临时中间层后进行清洗、转换、集成，最后加载到数据仓库或数据集市中

B.利用日志采集工具把实时采集的数据作为流计算系统的输入，进行实时处理分析

C.利用网页爬虫程序到互联网网站中爬取数据

D.对分析结果进行可视化呈现，帮助人们更好地理解数据、分析数据

点击查看答案

第8题

12、数据采集的主要数据源包括：

A.传感器数据

B.互联网数据

C.日志文件

D.企业业务系统数据

点击查看答案

第9题

【单选题】根据数据采集的需求不同，采集的方法也多种多样。其中，系统日志数据采集是指在网站日志中记录了_____、访问时间、访问次数、_____、_____等数据。通过对这些日志信息进行采集、分析，可以挖掘电子商务企业业务平台日志数据中的潜在价值。（）

A.访客IP地址、停留时间、访客来源

B.访客IP地址、离开时间、联系方式

C.访客注册时间、停留时间、访客来源

D.访客性别、离开时间、联系方式

点击查看答案

警告：系统检测到您的账号存在安全风险

为了保护您的账号安全，请在“赏学吧”公众号进行验证，点击“官网服务”-“账号验证”后输入验证码“”完成验证，验证成功后方可继续查看答案！

微信搜一搜

赏学吧

点击打开微信

警告：系统检测到您的账号存在安全风险

抱歉，您的账号因涉嫌违反赏学吧购买须知被冻结。您可在“赏学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封，或联系客服。

微信搜一搜

赏学吧

点击打开微信