第十三周作业
1. 你所在的行业,常用的数据分析指标有哪些?请简述。
公司主要业务是AI-智能语音方向,落地的场景是智能语音客服(包括 IVR、外呼、质检、坐席辅助、语音语义标注等),简单来说就是:
用机器人模拟客服拨打电话来进行营销、回访、催收 等;
或者用机器人模拟客服接听客户的电话,进行信息登记,QA,下单 等等;
主要关心的数据分析的指标:
并发数(同时拨打或者接听电话的坐席数量)
接通率(外呼场景,用户接听电话的占比)
呼损率(外呼场景,呼叫损失的占比)
转化率(外呼场景,通过系统产生的意向客户占比)
转人工率(IVR场景,需要人工参与解决的占比)
语音识别准确率 & 语义识别准确率 & 语音合成满意度
2. Google搜索引擎是如何对搜索结果进行排序的?(请用自己的语言描述PageRank算法)
目的:网页排名(根据关键词与网页内容的相关程度来返回搜索结果)
PageRank核心思想:
如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高
如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高
PageRank分析:
(1)假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。
PR(A) = PR(B) + PR(C) + PR(D)
(2)实际上,B除了链接到A,还链接到C,C只链接到A,而D除了链接A,还链接到C和D,所以在计算A的PR值时,B只能投出1/2的票,C投出全票,D只能出1/3的票,所以A的PR值总和应为:
PR(A) = PR(B)/2 + PR(C)/1 + PR(D)/3
用L表示网页对外链接数:
PR(A) = PR(B)/L(B) + PR(C)/L(C) + PR(D)/L(D)
(3)存在没有出链的网页,不满足 Markov 链的收敛性,所以我们强制他对所有的网页都有出链
PR(A) = PR(B)/2 + PR(C)/4
(4)网页只对自己出链,或者几个网页的出链形成一个循环圈,实际上浏览网页的人有一个确定的概率会输入网址直接跳转到一个随机的网页,假设跳转到每个网页的概率是一样的。
PR(A) = α(PR(B)/2)+ (1 - α)/ 4
(5)最终的计算公式
α 一般取值 0.85
参考:
https://www.jianshu.com/p/e6401638af48
https://blog.csdn.net/u013007900/article/details/88961913
评论