南昌网站关键词排名,wordpress view插件,广州番禺区是乡下吗,全网营销是什么意思词云的生成所需库代码实现wordclod参数说明具体实现效果展示所需库
wordcloud, jieba, imageiowordcloud 词云库#xff0c;用来统计文本文档里面出现的高频词汇#xff0c;或者句子#xff0c;以图片可视化的方式显示出来jieba库#xff0c;分割中文的库#xff0c;把较…
词云的生成所需库代码实现wordclod参数说明具体实现效果展示所需库
wordcloud, jieba, imageiowordcloud 词云库用来统计文本文档里面出现的高频词汇或者句子以图片可视化的方式显示出来jieba库分割中文的库把较长的句子分割成有意义的词汇imageio库 读取图片把词云图片以你对应的图片样式显示安装方式
pip install wordcloud, jieba, imageio代码实现
wordclod参数说明
width 词云图片宽度默认400像素height 词云图片高度 默认200像素background_color 词云图片的背景颜色默认为黑色background_colorwhitefont_step 字号增大的步进间隔 默认1号font_path 指定字体路径 默认None对于中文可用font_pathmsyh.ttcmini_font_size 最小字号 默认4号max_font_size 最大字号 根据高度自动调节max_words 最大词数 默认200stop_words 不显示的单词 stop_words{python,java}Scale 默认值1。值越大图像密度越大越清晰prefer_horizontal默认值0.90浮点数类型。表示在水平如果不合适就旋转为垂直方向水平放置的词数占0.9relative_scaling默认值0.5浮点型。设定按词频倒序排列上一个词相对下一位词的大小倍数。有如下取值“0”表示大小标准只参考频率排名“1”如果词频是2倍大小也是2倍mask 指定词云形状图片默认为矩形注意增加参数contour_width和contour_color设置轮廓宽度和颜色 # 轮廓线通过以下代码读入外部词云形状图片需要先pip install imageio安装imageio具体实现
这里拿来诗人舒婷的《致橡树》作为demohttps://zhidao.baidu.com/question/13111198coding
import os
if not os.path.exists(E:\\python\\joy\\wordcloud): # 创建文件夹os.mkdir(E:\\python\\joy\\wordcloud)os.chdir(E:\\python\\joy\\wordcloud)def jieba_deom3(shape, input_txt, output_img):import imageioimport jieba mk imageio.imread(shape)# 五角星形状的词图w wordcloud.WordCloud(maskmk)# 词图对象w wordcloud.WordCloud(width100, height100,scale15, background_colorwhite,font_pathmsyh.ttc, # 针对中文微软雅黑maskmk # imageio读取的形状)# 用jieba分割词txt with open(input_txt, encodingutf-8) as f:txt f.read()text_list jieba.lcut(txt)# 把分割好的词组列表转换为有空格的字符串string .join(text_list)w.generate(string)w.to_file(output_img)passjieba_deom3(wjx1.png, zxs.txt, zxs.png)
# 注意这个形状的图片一定要对不然报错或者是个正方形送上小星星
效果展示 写在最后 诗人也不愿要奉献施舍的爱情不愿作整日为绿阴鸣唱的小鸟不愿作一厢情愿的泉源不愿作盲目支撑橡树的高大山峰。诗人不愿在这样的爱情中迷失自己。爱情需要以人格平等、个性独立、互相尊重倾慕、彼此情投意合为基础。 最后关注点赞收藏 学习地址 https://github.com/TommyZihao/zihaowordcloud