大数据文本挖掘和分析
最近刚刚入职一家做大数据文本分析的公司,如果从官方网站提供的内容来看,就是提供语言文本语义理解,然后进行分析和研判,从而提供决策增值服务的内容。
对于大数据的利用一方面是数据收集,从网络上获得大量的公开数据,应该还是以文字材料为主,然后进行数据清理、分词、文本分析,通过数据挖掘得到文本内容中隐含的信息。
公司里面对于训练营第 12 周提到的一些大数据技术也有使用,但是对我来说,可能更多的应用层面,而不是技术层面,也就是说要理解用户的需求,然后用现有的技术来实现。
其实我觉的虽然现在短视频非常的火热,也包括视频和图像识别以及分析,但是最终可能还是要落实到文本的分析。我的理解,如果是做图像分析,最终也需要将图像的内容和属性整理成文本,然后再做进一步的处理。
目前主要应该是针对中文内容。
版权声明: 本文为 InfoQ 作者【escray】的原创文章。
原文链接:【http://xie.infoq.cn/article/ce34e85731e1c5d6ccb7999e9】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论