写点什么

语言模型

0 人感兴趣 · 9 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/8a/8aa8eadf4380a1e636e13538c4652618.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

增强型语言模型——走向通用智能的道路?

大规模语言模型可能并不只受限于『语言』,而是能在非常广阔的其他领域有所应用。

https://static001.geekbang.org/infoq/0c/0c6a6ff75d98f5890c5d3be90eb10b7f.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里正式加入 ChatGPT 战局,“通义千问”上线后表现如何?

ChatGPT发布后,数月间全世界都对AI的能力有了新的认知,现在又多了一位选手了!阿里版类ChatGPT突然官宣正式对外开放企业邀测,由达摩院开发,名为“通义千问” 顾名思义,阿里正式加入ChatGPT战局!这个阿里版ChatGPT“通义千问”,究竟实力几何?

https://static001.geekbang.org/infoq/cb/cb5e5a2f227f6dc1e068bfd732680a95.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIGC 的隐私安全问题及隐私保护技术 | 社区征文

Chatgpt的风靡,也让其背后LLM(大型语言模型)技术中的数据隐私保护问题进一步受到关注。作为国内隐私计算行业领军者,京东科技全程深度参与了「4大报告+3大标准」的编写研制工作,取得丰硕成果。

EasyNLP 发布融合语言学和事实知识的中文预训练模型 CKBERT

本⽂简要介绍CKBERT的技术解读,以及如何在EasyNLP框架、HuggingFace Models和阿里云机器学习平台PAI上使⽤CKBERT模型。

https://static001.geekbang.org/infoq/3c/3ca0bbdd394858dc6d3cb75f7db6daa2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

跟我读论文丨 Multi-Model Text Recognition Network

语言模型往往被用于文字识别的后处理阶段,本文将语言模型的先验信息和文字的视觉特征进行交互和增强,从而进一步提升文字识别的性能。

带你认识传统语音识别技术

摘要:隐马尔可夫链HMM模型自从1980年代被用于语音识别以来,一直都是实际语音识别系统的主流方法。

https://static001.geekbang.org/infoq/13/137e651640f6808b34365aaee55e49b6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何有效使用预训练语言模型

学术论坛·第六期我们有幸邀请到南加州大学硕士生、云智慧智能研究院算法实习生蔺同学,为我们介绍NLP是如何走向了prompt与adapter,在讲述prompt与adapter的原理、具体实现方法及优点后,还对它们进行了区分对比。下面让我们一起来学习吧~

论文解读丨文本行识别模型的再思考

​​摘要:本文研究了两个解码器(CTC[1]和 Transformer[2])和三个编码器模块(双向LSTM[3]、Self-Attention[4]和GRCL[5]),通过大量实验在广泛使用的场景和手写文本公共数据集上比较准确性和性能。

语言模型_语言模型技术文章_InfoQ写作社区