题目内容 (请给出正确答案)
[主观题]

请对《阿甘正传-网络版》进行中文分词,删除单个字符的分词结果,输出排序后的前10的词语。完善代码。 import jieba f=open("阿甘正传-网络版.txt","r",encoding="utf-8") txt=f.read() #读入文本,到字符串txt words=_______________ #对txt进行中文分词,生成词语列表words counts={} #字典,用于统计词频 for word in words: #遍历词语列表words counts[word]=counts.get(word,0)+1 #统计词频到字典counts中 items=list(counts.items()) #将字典转换为列表类型 items.sort(key=lambda x:x[1],reverse=True) #按照词频进行排序 for i in range(10): #输出前10项 word,count=items[i] print("{}:{}".format(word,c

答案
D
如搜索结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能会需要:
您的账号:
发送账号密码至手机
发送
更多“请对《阿甘正传-网络版》进行中文分词,删除单个字符的分词结果…”相关的问题

第1题

jieba是一个中文分词库,一些句子可能存在多种分词结果,请补充横线处代码,产生字符串s可能的所有分词结果列表,提示代码如下。 import jieba s = "世界冠军运动员的乒乓球拍卖完了" ls = jieba.lcut(_________________) print(ls)
点击查看答案

第2题

jieba 库是一个中文分词工具。
点击查看答案

第3题

jieba库的分词原理是利用中文文本中的空格或者标点符号进行分割的。
点击查看答案

第4题

使用jieba分词工具,不仅可以获取分词结果,还能标注出每个词的词性
点击查看答案

第5题

jieba是优秀的中文分词第三方库,需要额外安装。
点击查看答案

第6题

《射雕英雄传》是金庸的重要武侠作品之一。这里给出一个《射雕英雄传》的网络版本,文件名为“射雕英雄传-网络版.txt”。 请编写程序,统计该文件出现的所有中文词语及出现次数(不要求输出),并输出按照出现次数最多的8个词语,忽略标点符号及单个字符,采用如下方式打印输出。 输出格式 词语1,词语2,词语3,词语4,词语5,词语6,词语7,词语8 import jieba f=open("射雕英雄传-网络版.txt","r",encoding="utf-8") txt=f.read() words=jieba.lcut(txt) counts={} for word in words: if len(word)>1: counts[word]=counts.get(word,0)+1 items=list(counts.items()) items.sort(key=lambda x:x[1],reverse=True) ls=[] for i in range(8): ls.append
点击查看答案

第7题

获得用户输入的一个中文字符串,将所有中文字符替换为其Unicode编码值小3的字符,并在一行内打印输出结果。完善代码。 s=input("请输入一个中文字符串") for ch in s: print(chr(_____________),end="")
点击查看答案

第8题

中文自动分词的一个障碍是歧义,歧义可以分为交集型歧义和____________歧义
点击查看答案

第9题

以下属于 Python 中文分词方向第三方库的是()。

A.pandas

B.beautifulsoup4

C.Python-docx

D.jieba

点击查看答案
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改
温馨提示
每个试题只能免费做一次,如需多次做题,请购买搜题卡
立即购买
稍后再说
警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

微信搜一搜
赏学吧
点击打开微信
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反赏学吧购买须知被冻结。您可在“赏学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
微信搜一搜
赏学吧
点击打开微信