当前位置: 首页 > 编程笔记 >

使用python实现个性化词云的方法

丁鹏鹍
2023-03-14
本文向大家介绍使用python实现个性化词云的方法,包括了使用python实现个性化词云的方法的使用技巧和注意事项,需要的朋友参考一下

先上图片


词云图

需要模板

pip install jieba
pip install wordcloud

还需要安装另外两个东西这两个我也不太懂借鉴百度写上去的

pip install scipy
pip install matplotlib

因为用ubuntu系统所有没有windows那么麻烦,也没有那么多报错

看到好多人制作自己的词云有没有一丝丝的激动啊,有激动就要马上去做,冲动才是第一创造力。

jieba是一款很恨很好用的中文分词模板

jeiba中文文档

至于wordcloud没有中文文档不过咱会猜啊,英文不好咱们可以猜啊,查看源代码猜。

先把我全部代码贡献上来

#-*-coding:utf-8—-*-
import jieba.analyse
from wordcloud import WordCloud,ImageColorGenerator
from scipy.misc import imread
import matplotlib.pyplot as plt

class wc:
  def __init__(self,txt_file,img_file,font_file):
   self.f = open(txt_file,'r')
  self.txt = self.f.read()
   self.f.close()
  self.tags = jieba.analyse.extract_tags(self.txt,topK=100)
  #topK说白了就是返回几个关键词
  self.text = ' '.join(self.tags) #把分词链接起来,加空格因为英文靠空格分词
  self.img = imread(img_file)
  self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80)
###直接在这里进行猜###
#font_path指的是字体文件路径,因为wordcloud自带的字体不支持中文所以我们要指定一个字体文件,否者输出的图片全是框框
#background_color 默认是黑色 我设置成白色
#max_words最大显示的词数
#mask 背景图片
#max_font_size 最大字体字号
  self.word_cloud = self.wc.generate(self.text)

  def show_wc(self):
  #img_color = ImageColorGenerator(self.img)
    plt.imshow(self.word_cloud)
#可以通过 plt.imshow(self.wc.recolor(color_func=img_color))使图片颜色跟字体颜色一样
    plt.axis("off")
    plt.show()


if __name__=='__main__':
  mywc = wc('sanwen.txt','out.png','font.ttc')
  mywc.show_wc()


使用wc.recolor(color_func=img_color)

 类似资料:
  • 本文向大家介绍python 实现敏感词过滤的方法,包括了python 实现敏感词过滤的方法的使用技巧和注意事项,需要的朋友参考一下 如下所示: 测试结果: 1) 敏感词 100个 2) 敏感词 1000 个 从上面的实验我们可以看出,在DFA 算法只有在敏感词较多的情况下,才有意义。在百来个敏感词的情况下,甚至不如普通算法 下面从理论上推导时间复杂度,为了方便分析,首先假定消息文本是等长的,长度为

  • 本文向大家介绍Python绘制词云图之可视化神器pyecharts的方法,包括了Python绘制词云图之可视化神器pyecharts的方法的使用技巧和注意事项,需要的朋友参考一下 自定义图片生成词云图的多种方法 有时候我们会根据具体的场景来结合图片展示词云,比如我分析的是美团评论,那么最好的展示方法就是利用美团的logo来做词云图的底图展示,下面我们就介绍几种常用的方法! 根据喜爱的图片生成词云轮

  • 本文向大家介绍使用Python生成200个激活码的实现方法,包括了使用Python生成200个激活码的实现方法的使用技巧和注意事项,需要的朋友参考一下 题目:使用 Python 生成 200 个不重复的激活码 编写思路 # 激活码一般是由26个大写字母和10个数字任意组合而成 # 长度为12位或者16位的居多激活码 # 一个激活码里的字符是可以重复的,而且必须要保证激活码是不能重复的 测试用例 #

  • 本文向大家介绍Android实现个性化的进度条,包括了Android实现个性化的进度条的使用技巧和注意事项,需要的朋友参考一下 1.案例效果图 2.准备素材 progress1.png(78*78) progress2.png(78*78) 3.原理 采用一张图片作为ProgressBar的背景图片(一般采用颜色比较浅的)。另一张是进度条的图片(一般采用颜色比较深的图片)。进度在滚动时:进度图片逐

  • 本文向大家介绍python用类实现文章敏感词的过滤方法示例,包括了python用类实现文章敏感词的过滤方法示例的使用技巧和注意事项,需要的朋友参考一下 过滤一遍并将敏感词替换之后剩余字符串中新组成了敏感词语,这种情况就要用递归来解决,直到过滤替换之后的结果和过滤之前一样时才算结束 第一步:建立一个敏感词库(.txt文本) 第二步:编写代码在文章中过滤敏感词(递归实现) 运行结果: 以上就是本文的全

  • 本文向大家介绍利用jquery实现实时更新歌词的方法,包括了利用jquery实现实时更新歌词的方法的使用技巧和注意事项,需要的朋友参考一下 前言 最近自己写了个移动端音乐播放器,用了很多框架,也踩了很多坑,感觉比较复杂的就是计算歌词实时播放了,所以想着大概给整理了一下,分享出来,有问题的话朋友们可以指出,有需要的朋友们也可以学习学习。 布局 (歌词都是后台数据获取,方便理解我把所有歌词都一一列出来