Python是一种面向对象的解释型计算机程序设计语言,语法简捷而清晰具有脚本语言中最丰富和强大的类库。它被称为“胶水语言”,能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在一起。其在工业和科研上获得了广泛的使用。
可以用其来做数据分析和可视化,做网站、爬取数据、写脚本等。
词云是指突出中心的词组群,是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
词云的原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示出词汇,生成图片,形成由词汇组成类似云的彩色图形。
一般使用Python的wordcloud扩展包制作词云,也可以将任意图片作为词云轮廓对词云进行定制。但其代码需要有python基础的专业人士编写,对普通大众较为复杂。
环境 :python3.6.2,window10
python包:wordcloud、matplotlib,用pip安装,打开命令窗口,输入pip install matplotlib 回车,安装好后再输入pip install wordcloud回车即可成功安装。
将词云分析的对象存储为一个文本文件。
在安装好的运行环境下,输入正确的Python代码运行
秀友百科词条内容均由网友提供,仅供参考。如发现词条内容有问题,请联系管理员。