介绍一款文本分析工具
介绍
发现一款小工具——集搜客的文本分析检索。可以用来做一些简单的文本探索。如果有不懂技术的同学,可以利用起来。
试用了下,这款工具可以用来做:
根据研究主题,选取主题词,并且分析给出词性以及词频;
根据词频制作词云;
将文本进行分词处理;
根据主题词,制作出社会网络关系图;
切分文本句子,进行情感化分析,将每一句文本,按照中性、正面、负面分类划分;
输出相关 Excel,根据需求进一步分析。
产品页面截图如下:
案例
将电商产品评论案例数据集导入,输出部分结果。分别是词云图、词频情况、情感分析趋势、关系网络图。
案例数据集说明(本文只是展示产品功能,所以源数据不提供):
数据源:电商产品用户评论数据;
数据量:668 条数据;
数据字段:序号、评论正文;
数据展示。
接下来根据业务要求,选择对应的主题词(这一步需要手动选择)。根据选择的主题词,集搜客的文本分析检索会生成选中词的词频数量以及词云。结果展示如下:
然后会根据主题词,分析对应关联词(图本身为动态,这里只是截图主要演示和「功能」高度关联的主题词):
然后可以对每一条评论进行情感化分析,进行定性判断,分别判断情感倾向,找出评论中的正面词、负面词、程度词、否定词。如果数据量较小,拿到结果可以直接使用 Excel 进行可视化展示,如果数据量较大,并且有另外的探索需求,可以使用一些 Python 相关库来进行数据分析。
结合情感倾向,使用直方图了解情感趋势。这款电商产品,在高频词中,比较多的差评。证明差评内容集中。但是在整体评论趋势上,多数评价内容是属于中性和正面评价。
整体使用下来,感觉这款工具是一款文本分析辅助工具,可以使用工具做一些基本分析,然后做常用的文本处理预准备。想在工作中应用起来,还需要结合业务分析目的,以及和其他分析工具配合使用。
版权声明: 本文为 InfoQ 作者【黄大路】的原创文章。
原文链接:【http://xie.infoq.cn/article/b31373dfcd6068f0a24364b41】。文章转载请联系作者。
评论