> 文章列表 > 【计算机二级python】综合题目

【计算机二级python】综合题目

【计算机二级python】综合题目

计算机二级python真题


文章目录

  • 计算机二级python真题
  • 一、德国工业战略规划
  • 二、德国工业战略规划 第一问
  • 三、德国工业战略规划 第二问

在这里插入图片描述


一、德国工业战略规划

描述:在右侧答题模板中修改代码,删除代码中的横线,填写代码,完成考试答案。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

附件:文本文件“data.txt”中包含一篇从互联网上下载的关于“德国工业4.0战略规划实施建议摘要”的文章。请分别补充2 个python 源文件,完成以下功能。

二、德国工业战略规划 第一问

问题1:文件内容清洗。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

要求:在右侧答题模板中修改代码,删除代码中的横线,填写代码,对文件 data.txt 的内容进行清洗,去掉中文标点符号、中英文空格、回车等符号,只保留中文、英文、数字、英文标点符号,将结果输出到文件clean.txt 中。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

示例如下:‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

德国工业4.0战略计划实施建议摘编机械工业信息研究院战略与规划研究所-德国实施工业…(略)

f = open("data.txt","r",encoding="utf-8")
line = f.read()
f.close()# 键盘上所有中文标点符号,包括空格和换行\\n符号
for i in [",","。","《","》","、","?",";",":","‘","’","“","”","【","】","{","}","(",")","……","!","\\n"," ","———"]:line = line.replace(i,"")
f = open("clean.txt","w",encoding="utf-8")
f.write(line)
f.close()

讲解:
该题学会方法,就不难。
键盘上所有中文标点符号,包括空格和换行\\n符号,使用中文shift上档键添加,共22个。
“,”, “。”, ““”, “””, “,”, “(”, “)”, “【”, “】”, “{”, “}”, “《”, “》”, “!”, “:”, “、”, “?”, “……”, “;”, “—”, “\\n”," "
…… 省略号中文状态下 (shift+6)
— 破折号中文状态下 (shift+ -)
逗号句号分为,中文全角,和半角。
笨办法,打开文档看一下还有没有标点符号,一看有“破折号”冒号, 括号等,逐一加上就可以了。(如下图)
4.0 中的点,5% 的百分号,是数学符号,不清除,其他符号用文本搜索功能检查一下即可。

三、德国工业战略规划 第二问

问题2:提取主题词及其出现频次。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

要求:在右侧答题模板中修改代码,删除代码中的横线,填写代码,提取clean.txt 文件中长度不少于3个字符的词语并统计词频,将词频最高的10个词语作为主题词,并将主题词及其频次输出到屏幕。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

示例如下:‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

4.0:10,制造业:9,…(略)‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

---------------------------------------------------------------‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬

注意:输出格式采用英文冒号和英文逗号,标点符号前后无空格,各词语中间用逗号分隔,最后一个词语无逗号。

import jieba
f = open("clean.txt","r",encoding="utf-8")
txt=f.read()
f.close()
words=jieba.lcut(txt)d = {}for word in words:if len(word)<3:continueelse:d[word]=d.get(word,0)+1lt = list(d.items())
lt.sort(key = lambda x:x[1],reverse = True)for i in range(10):word,count=lt[i]if i<9:print("{}:{}".format(word,count),end=",")else:print("{}:{}".format(word,count))