深圳租赁住房和建设局网站,丢盖网logo制作免费,学校官网入口,做网站最便宜计算机二级python真题 文章目录计算机二级python真题一、德国工业战略规划二、德国工业战略规划 第一问三、德国工业战略规划 第二问一、德国工业战略规划
描述:在右侧答题模板中修改代码#xff0c;删除代码中的横线#xff0c;填写代码#xff0c;完成考试答案。…计算机二级python真题 文章目录计算机二级python真题一、德国工业战略规划二、德国工业战略规划 第一问三、德国工业战略规划 第二问一、德国工业战略规划
描述:在右侧答题模板中修改代码删除代码中的横线填写代码完成考试答案。
附件文本文件“data.txt”中包含一篇从互联网上下载的关于“德国工业4.0战略规划实施建议摘要”的文章。请分别补充2 个python 源文件完成以下功能。
二、德国工业战略规划 第一问
问题1文件内容清洗。
要求在右侧答题模板中修改代码删除代码中的横线填写代码对文件 data.txt 的内容进行清洗去掉中文标点符号、中英文空格、回车等符号只保留中文、英文、数字、英文标点符号将结果输出到文件clean.txt 中。
示例如下
德国工业4.0战略计划实施建议摘编机械工业信息研究院战略与规划研究所-德国实施工业…略
f open(data.txt,r,encodingutf-8)
line f.read()
f.close()# 键盘上所有中文标点符号包括空格和换行\n符号
for i in [,。,《,》,、,,,,‘,’,“,”,【,】,{,},,,……,,\n, ,———]:line line.replace(i,)
f open(clean.txt,w,encodingutf-8)
f.write(line)
f.close() 讲解 该题学会方法就不难。 键盘上所有中文标点符号包括空格和换行\n符号使用中文shift上档键添加共22个。 “”, “。”, ““”, “””, “,”, “”, “”, “【”, “】”, “{”, “}”, “《”, “》”, “”, “”, “、”, “”, “……”, “”, “—”, “\n”, …… 省略号中文状态下 (shift6) — 破折号中文状态下 (shift -) 逗号句号分为中文全角和半角。 笨办法打开文档看一下还有没有标点符号一看有“破折号”冒号 括号等逐一加上就可以了。如下图 4.0 中的点5% 的百分号是数学符号不清除其他符号用文本搜索功能检查一下即可。 三、德国工业战略规划 第二问
问题2提取主题词及其出现频次。
要求在右侧答题模板中修改代码删除代码中的横线填写代码提取clean.txt 文件中长度不少于3个字符的词语并统计词频将词频最高的10个词语作为主题词并将主题词及其频次输出到屏幕。
示例如下
4.0:10,制造业:9,…略
---------------------------------------------------------------
注意输出格式采用英文冒号和英文逗号标点符号前后无空格各词语中间用逗号分隔最后一个词语无逗号。
import jieba
f open(clean.txt,r,encodingutf-8)
txtf.read()
f.close()
wordsjieba.lcut(txt)d {}for word in words:if len(word)3:continueelse:d[word]d.get(word,0)1lt list(d.items())
lt.sort(key lambda x:x[1],reverse True)for i in range(10):word,countlt[i]if i9:print({}:{}.format(word,count),end,)else:print({}:{}.format(word,count))