当前位置: 首页 > news >正文

石家庄网站制作招聘做网站银川

石家庄网站制作招聘,做网站银川,北京燕化工程建设有限公司网站,wap 网站 开发目录 序言#xff1a;第三方库及所需材料函数模块介绍分词词频统计条形图绘制词云绘制主函数 效果预览全部代码 序言#xff1a;第三方库及所需材料 编程语言#xff1a;Python3.9。 编程环境#xff1a;Anaconda3#xff0c;Spyder5。 使用到的主要第三方库#xff1a;… 目录 序言第三方库及所需材料函数模块介绍分词词频统计条形图绘制词云绘制主函数 效果预览全部代码 序言第三方库及所需材料 编程语言Python3.9。 编程环境Anaconda3Spyder5。 使用到的主要第三方库jieba-0.42.1wordcloud-1.8.2.2matplotlib-3.5.1。 文本数据txt格式本文以2023年内蒙古自治区政府工作报告为例命名为“2023.txt”。停用词“cn_stopwords.txt”网络下载字体文件tff格式本文使用方正粗黑宋简体命名为“fzch.tff”主题背景图片本文使用白底内蒙古自治区地图命名为“R-C.png” 以上文件置于py文件的同级目录下使用相对路径读取。 函数模块介绍 具体的代码可见全部代码部分这部分只介绍思路和相应的函数模块 分词 在主函数中读取文本数据调用分词函数cutWord使用jieba分词库和停用词表对文本进行分词操作并返回词语组成的列表。 def cutWord(text): wordsjieba.cut(text)stopwords {}.fromkeys([ line.rstrip() for line in open(cn_stopwords.txt,encodingutf-8) ])finalwords []for word in words:if word not in stopwords:if (word ! 。 and word ! ) :finalwords.append(word) return finalwords词频统计 将词语列表传入词频统计函数countWord去除单字词和换行符后统计各词语出现的频率并返回各词语的频数列表。 def countWord(text):counts{}for word in text: if len(word) 1 or word\n:#单个词和换行符不计算在内continueelse:if word not in counts.keys():counts[word]1else:counts[word]1return counts条形图绘制 将词频字典传入高频词条形图绘制函数drawBar根据注释传入参数选择前RANGE项词语和图像横竖 def drawBar(countdict,RANGE, heng):#函数来源于https://blog.csdn.net/leokingszx/article/details/101456624有改动#dicdata字典的数据。#RANGE截取显示的字典的长度。#heng0代表条状图的柱子是竖直向上的。heng1代表柱子是横向的。考虑到文字是从左到右的让柱子横向排列更容易观察坐标轴。by_value sorted(countdict.items(),key lambda item:item[1],reverseTrue)print(by_value[:20])x []y []plt.figure(figsize(9, 6))for d in by_value:x.append(d[0])y.append(d[1])if heng 0:plt.bar(x[0:RANGE], y[0:RANGE])plt.show()return elif heng 1:plt.barh(x[0:RANGE], y[0:RANGE])plt.show()return else:return heng的值仅为0或1词云绘制 将词语列表传入词云绘制函数drawWordCloud绘制词云图。进一步地将词语列表传入词云绘制函数drawWordCloudwithMap以内蒙古自治区地图为背景绘制词云图。 def drawWordCloud(textList):wc WordCloud(font_path fzch.ttf,background_colorwhite,width1800,height1200).fit_words(countdict)plt.figure(figsize(18, 12))plt.imshow(wc)plt.axis(off)plt.show()def drawWordCloudwithMap(textList):d path.dirname(__file__)map_coloring np.array(Image.open(path.join(d, R-C.png))) wc WordCloud(font_path fzch.ttf,maskmap_coloring,background_colorwhite,width1800,height1200).fit_words(countdict)plt.figure(figsize(18, 12))plt.imshow(wc)plt.axis(off)plt.show()主函数 if __name__ __main__:with open(2023.txt,r,encodingutf-8) as f:textf.read()#读取文本cutTextcutWord(text)#jieba分词countdictcountWord(cutText)#生成词频字典drawBar(countdict,10,0)#绘制词语出现次数前10的竖向条形图 drawBar(countdict,20,1)#绘制词语出现次数前20的横向条形图 drawWordCloud(cutText)#绘制词云图drawWordCloudwithMap(cutText)#以地图为背景绘制词云图效果预览 全部代码 # -*- coding: utf-8 -*- # Time : 2023/11/22 # Author : Ryo_Yuki # Software: Spyderimport jieba import jieba.analyse from wordcloud import WordCloud import matplotlib.pyplot as plt import numpy as np from PIL import Image from os import path plt.rcParams[font.sans-serif] [SimHei] # 用来正常显示中文标签def cutWord(text): wordsjieba.cut(text)stopwords {}.fromkeys([ line.rstrip() for line in open(cn_stopwords.txt,encodingutf-8) ])finalwords []for word in words:if word not in stopwords:if (word ! 。 and word ! ) :finalwords.append(word) return finalwordsdef countWord(text):counts{}for word in text: if len(word) 1 or word\n:#单个词和换行符不计算在内continueelse:if word not in counts.keys():counts[word]1else:counts[word]1return countsdef drawBar(countdict,RANGE, heng):#函数来源于https://blog.csdn.net/leokingszx/article/details/101456624有改动#dicdata字典的数据。#RANGE截取显示的字典的长度。#heng0代表条状图的柱子是竖直向上的。heng1代表柱子是横向的。考虑到文字是从左到右的让柱子横向排列更容易观察坐标轴。by_value sorted(countdict.items(),key lambda item:item[1],reverseTrue)print(by_value[:20])x []y []plt.figure(figsize(9, 6))for d in by_value:x.append(d[0])y.append(d[1])if heng 0:plt.bar(x[0:RANGE], y[0:RANGE])plt.show()return elif heng 1:plt.barh(x[0:RANGE], y[0:RANGE])plt.show()return else:return heng的值仅为0或1def drawWordCloud(textList):wc WordCloud(font_path fzch.ttf,background_colorwhite,width1800,height1200).fit_words(countdict)plt.figure(figsize(18, 12))plt.imshow(wc)plt.axis(off)plt.show()def drawWordCloudwithMap(textList):d path.dirname(__file__)map_coloring np.array(Image.open(path.join(d, R-C.png))) wc WordCloud(font_path fzch.ttf,maskmap_coloring,background_colorwhite,width1800,height1200).fit_words(countdict)plt.figure(figsize(18, 12))plt.imshow(wc)plt.axis(off)plt.show()#主函数 if __name__ __main__:with open(2023.txt,r,encodingutf-8) as f:textf.read()#读取文本cutTextcutWord(text)#jieba分词countdictcountWord(cutText)#生成词频字典drawBar(countdict,10,0)#绘制词语出现次数前10的竖向条形图 drawBar(countdict,20,1)#绘制词语出现次数前20的横向条形图 drawWordCloud(cutText)#绘制词云图drawWordCloudwithMap(cutText)#以地图为背景绘制词云图
http://www.huolong8.cn/news/72296/

相关文章:

  • 教育网站开发文档wordpress4.8.1模板
  • 深圳wap网站建设公司360站长平台链接提交
  • 如何让自己的网站被搜索引擎收录网站可以做第三方检测报告
  • 溆浦县建筑公司网站小企业一键做网站
  • 网站建设好学吗做期权关注哪个网站
  • 企业级网站建设注册子公司流程及所需资料
  • 网站名查找公司网站建设服务类别
  • 邓州网站设计学校招标网站建设
  • 广汉市建设局网站华能电子商务平台
  • 手机网站建设的教程视频南昌地宝网租房信息网
  • 湛江网站关键字优化土豆网网站开发源代码
  • 肥东建设局网站网站开发前景与趋势如何
  • 网站开发资金新闻app开发
  • 佛山网站建设 奇锐科技视频拍摄公司
  • 中网建站wordpress 用户权限管理
  • 在县城怎么做网站公司网站开发英文翻译
  • php做网站流程wordpress关闭伪静态
  • 浪子做的阿哲喊麦网站多少企业网站 更新 seo
  • 1元涨1000粉丝网站鞍山58
  • 电商网站如何避免客户信息泄露图形化html编辑器
  • 肥西县城乡建设局网站有关网站建设的知识
  • 学做网站视频论坛沈阳专门做网站
  • 好的ppt模板免费下载网站网站建设费用做做什么科目
  • 购物网站分为几个模块优化手机软件
  • 网站建设 软件服务建站公司经营
  • 简洁的网站建设合同怎么网上推广自己的门店
  • 团购网站建站广州中国建设银行网站首页
  • 传统网站设计的缺点wordpress怎么实现社交
  • 网站备案号规则怎么做关于梦想的网站免费的
  • 做网站流量钱谁给专门做团购的网站