0 人感兴趣 · 3 次引用
在NLP领域,自然语言通常是指以文本的形式存在,但是计算无法对这些文本数据进行计算,通常需要将这些文本数据转换为一系列的数值进行计算。那么具体怎么做的呢?这里就用到词向量的概念。
本篇主要介绍常见的词向量模型有矩阵分解、SkipGram、Glove、高斯嵌入。
本篇介绍了独热编码和词向量的特点,以及如何通过词向量转为句子向量的方法。因独热编码存在明显的稀疏性,在进行计算单词的相似度时,欧式距离和余弦相似度计算均没办法对其进行有效的计算。词向量为此提出了解决方案。
公众号【后台技术汇】
某某某技术有限责任公司架构师
行动就在当下。
🏆 InfoQ写作平台-签约作者 🏆
提供全面深入的云计算技术干货