福建省第二电力建设公司网站,营销技巧 第一季,广州seo网络推广员,宁波工程建设信息网这个我其实写过一篇类似的博客#xff0c;但是那个的文件对象是.csv#xff0c;对应到.docx文件的话#xff0c;就不太适用了。如下#xff1a;
Python生成词云-CSDN博客
代码#xff1a;
import jieba
import os
import wordcloud
import numpy as np
from PIL import…这个我其实写过一篇类似的博客但是那个的文件对象是.csv对应到.docx文件的话就不太适用了。如下
Python生成词云-CSDN博客
代码
import jieba
import os
import wordcloud
import numpy as np
from PIL import Image
from docx import Document# 从Word文档中提取文本
doc_path E:\\code\\二十大报告实录.docx
doc Document(doc_path)
txt
for one_pare in doc.paragraphs:txt txt one_pare.text# 读取形状图片
img_path rwujiaoxing.png
img Image.open(img_path)
mk np.array(img)# 配置词云对象参数
w wordcloud.WordCloud(font_pathmsyh.ttc, maskmk, background_colorwhite)# 使用jieba进行分词
words jieba.lcut(txt)
abc .join(jieba.lcut(txt))# 生成词云
w.generate(abc)# 保存词云图像文件
output_path os.getcwd() rcloud0.jpg
w.to_file(output_path)# 显示词云图像
img Image.open(output_path)
img.show()这个容易出错的点就在于img_path。
生成结果