基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC 指数三个指数
基于新浪微博海量用户行为数据、博文数据数据分析:包括综合指数、移动指数、PC 指数三个指数
项目介绍
微指数是基于海量用户行为数据、博文数据,采用科学计算方法统计得出的反映不同事件领域发展状况的指数产品。
微指数对于收录的关键词,在指数方面提供微博数据层面的指数数据,包括综合指数、移动指数、PC 指数三个指数。
项目举例以‘中兴’这一关键词为例,要求获取中兴的三个指数数据。微指数的数据收录时间有范围,范围表现在:
1)整体趋势:2013-03-01-至今
2)移动趋势:2014-01-06-至今
3)PC 趋势:2014-01-06-至今
本例子设定 start_date = '2016-05-29',end_date = '2018-05-29', 原始结果如下:
1.原始综合指数

2. 原始移动/pc 指数

实现流程
复制代码
执行
复制代码
3.效果展示
将得到的数据文件,进行本地可视化,效果如下:
3.1 综合指数

3.2 移动指数

3.3 PC 指数

3.4 指数对比

5.总结
1、微指数的采集难度介于百度指数与阿里指数之间,两个特点:1)指数有 js 动态请求而成,可以通过构造请求,解析获得。2)无需用户登录。
2、微指数收录的日期比阿里指数要广,较百度指数要窄,但基于微博这一层面得到的数据,对于相关研究还是有一定新意的。
项目链接跳转
更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。


版权声明: 本文为 InfoQ 作者【汀丶人工智能】的原创文章。
原文链接:【http://xie.infoq.cn/article/e45792ec9b014359b94d3a860】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论