什么是词云图
词云图可以理解为将文本中出现频率较高的单词以视觉化的方式展示出来,从而突出这些单词在文本中的重要性。通过词云图,我们可以快速地了解一段文本或话题的关键词,方便进行分析和总结。
使用Python生成词云图
Python语言在数据可视化方面有着极为出色的表现,其所拥有的丰富的第三方库和模块也使得利用Python进行词云图的制作变得十分简单。
安装wordcloud库
在使用Python进行词云图制作之前,需要先安装wordcloud库。可以通过以下命令在pycharm中进行安装:
pip install wordcloud
导入wordcloud库并生成词云图
在成功安装wordcloud库之后,需要将其导入到程序中:
import wordcloud
接下来,将需要生成词云图的文本载入程序中,通过wordcloud库的相关函数进行处理生成词云图:
from wordcloud import WordCloud, STOPWORDSimport matplotlib.pyplot as plttext = ".......(待输入)"stopwords = set(STOPWORDS)wordcloud = WordCloud(background_color="white", stopwords=stopwords).generate(text)plt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")plt.show()
上述程序中,background_color为背景颜色,stopwords是停用词,WordCloud库的.generate()函数用于生成最终的词云图。以上程序在运行之后即可看到生成的词云图。
优化词云图效果
通过默认生成的词云图我们会发现,词云图效果并不是很理想。接下来我们就从几个方面来对词云图进行优化。
使用更好的字体
默认情况下,Python所生成的词云图所采用的字体可能并不够美观,而且可能会出现乱码的情况。我们可以去一些网站下载一些比较漂亮的字体文件,然后将其放入程序可调用的路径当中,接着在代码中指定字体即可:
font_path = 'C:/windows/fonts/msyh.ttf'wordcloud = WordCloud(font_path=font_path, background_color="white", stopwords=stopwords).generate(text)
设置词云图大小
默认情况下生成的词云图的大小可能会比较小,因此需要我们设置一下其大小:
width = 800height = 600plt.figure(figsize=(width/100.0, height/100.0))
使用自定义背景图片
我们可以将某张图片作为背景,并以此形成我们的词云图。生成词云图程序代码如下:
from PIL import Imageimport numpy as npmask = np.array(Image.open("background.png"))wordcloud = WordCloud(background_color="white", mask=mask, font_path=font_path, stopwords=stopwords).generate(text)
总结
在Python编程环境中,利用WordCloud库可以很方便的实现词云图的制作。通过调整字体、大小和背景等效果,可以让词云图的效果更加美观和专业。而且,通过良好的词云图制作,我们可以轻松地了解一个话题或文本的核心内容和关键词。
免费领取208个最新网创项目+10000G热点网创类资源!添加 微信:Bao6705 备注:资料!
小宝微信号
扫一扫加微信好友
微信公众号
扫一扫关注公众号