情感分析 | AI 没有“心”,却能“读心”
电影《X 战警》中,X 教授具有心灵感应和精神控制的能力,而能读懂人心的机器便与此相似。教会机器去辨别和理解人类的情感和语言,这样的技术被称为情感分析。
互联网技术发展至今,人们的任何消费行为都可以通过网络进行信息共享。而商家也在利用这些信息做着重要的商业决策和营销方案。任何正面或负面的信息都左右着消费者的购买意向。
情感分析技术可以通过对好评及差评进行归因,帮助商家加强产品的迭代和优化。这其中,更有效的数据便成为让机器能够读懂人类情感的关键。优质的数据可以更好地教导机器去理解人类的意图,从而精准满足用户需求。
Q1 什么是情感分析?
情感分析也被称为情感分类、意图挖掘,通过提取特定的词或短语来判断一条内容是正面、负面还是中立。相对于客观事实,情感是主观的表达方式,用来描述一个人对某个特定话题的感受。情感分析的主要目的便是分析受众对某些产品、事件、人物或言语的看法。
在文本中,情感可以用两种不同的方式来表达。它可以是显性的,就是直接表达意见(例如:”这条裙子真好看”);或是隐性的,即文本暗示意见(例如:”我的裙子去年被撑坏了”)。而大多数情感分析研究的重点是显性情感,因为这类情感更容易被发现和分析。
情感分析通常涵盖两个方面:
· 情感极性:分析情感的方向(是正面还是负面?)
· 情感强度:情感程度由高到低
Q2 如何做情感分析的数据标注?
NLP 标注、实体标注和文本标注是情感分析中常见的数据标注方式。通过这一类的数据标注,能够训练机器读懂人类的情感,并在下次判断中对不同的情感进行分析。一条条文本、音频或语音数据,通过基于人工智能的情感分析模型被机器理解,再让机器去试图理解人类。
很多情感分析项目中牵扯到大量的文本标注。简单直白的显性文本类似“咖啡真好喝”可以要求标注人员直接标注出“正面”、“负面”或是“中立”;而涉及到隐性文本时则会有些复杂。因此,如果遇到如“讽刺”、“反讽“等情绪的表达时,标准就显得尤为重要,这将直接影响项目的进展周期和数据交付的质量。
为了尽可能地减少人为错误,标注团队需要经过严格的培训和考核。特别是在情感分析的相关场景下,往往没有明确的对错或答案,因此很难衡量其准确性。此时,严谨的项目章程和标准、规范化的标注流程和质检,可以改善标注过程中遇到的一系列疑难。
Q3 如何获取情感分析的数据?
企业对消费者洞察的需求日益增长,这使得快速增长的情感分析技术正在为改善客户体验发挥巨大作用,甚至将在未来颠覆大量的行业。自然语言处理 (NLP) 技术使计算机能够阅读文本、理解语音,对其进行解释和总结,并判定其中的情绪。NLP 是包括情感分析等许多 AI 解决方案的推动力,它需要大量经过灵活处理、标记和清洗后的训练数据加以训练。
澳鹏 Appen 数十年来深耕语言学领域,积累了丰富的专业经验。我们的语言学家全程参与到人机交互 AI 的设计、开发和调整之中,帮助企业洞察用户行为的因果关系及相应的解决方案。目前,澳鹏 Appen 已助力众多行业领先的零售/电子商务、金融、保险、医疗、交通等企业成功落地了 NLP 项目。
我们为模型开发提供大量高质量的训练数据,帮助构建能够理解人类文本和语音并提取其中含义的智能系统,可应用于多种 AI 场景,例如聊天机器人、语音助手、搜索相关性等。我们在数据标注过程中内置了机器学习辅助功能,并采用严格的质检流程规范,在提高数据采集和标注生产率的同时,亦保障准确性及交付率。
我们提供的相关服务主要包括:
文本标注 (NER、POS)
通过连接关系中的命名实体或词性来扩展 NLP 标签。
文本分类(情感、意图、内容)
通过了解和分析客户的搜索意图和互动对话内容来增加更有价值的对话机会。
实体提取
突出显示和分类相关实体,并从大量文本中提取关键信息来训练模型,从而提高模型的认知能力。
搜索结果评估
通过使用该数据训练模型并返回与用户查询最相关的搜索结果,可以对搜索结果进行排名并改善用户体验。
文本评估和后期编辑
借助我们的多语言专家来评估 NLP 模型(例如机器翻译模型和其他序列模型)所生成文本的自然性和相关性。
音频标注
将音频切分为层、讲话者和时间戳,以用于音频语音识别和其他音频模型。
音频转录
将语音音频转录为文本,或验证机器生成的转录。利用内置 NLP 模型来提高转录质量和效率。
音频分类
使用声音分类或话语分类,根据语言、方言、语义和其他特性对音频进行分类。
澳鹏(中国)人工智能辅助数据标注平台,集成多样标注工具箱、覆盖各种标注场景。马上扫描下方二维码,与我们的专家咨询落地方案,更可获得免费试标注机会!
*文中部分图片来源于网络
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/fe0de84f49707ab06ad9d0d9a】。文章转载请联系作者。
评论