写点什么

LLM模型

0 人感兴趣 · 19 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/fe/fe9891c237bbb0effc9089c3963b99ff.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【论文解读】让我们逐步验证

本文简要介绍了大模型热门论文“Let’s Verify Step by Step ”的相关工作。近年来,大型语言模型在执行复杂的多步骤推理的能力上有了显著的提高。然而,即使是最先进的模型也会经常产生逻辑错误。

https://static001.geekbang.org/infoq/3a/3a8616b89a22e768250c52c3cb22abed.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

第 53 期|GPTSecurity 周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。

reptimeAI + Xinference 联合方案:高效部署并监控你的 LLM 应用

如何能高效地持续监控 LLM 应用的运行表现,而又不增加额外的开发复杂度?在这些问题上,GreptimeAI 和 Xinference 提供了切实可行的解决方案。

https://static001.geekbang.org/infoq/be/be6edf418de1cb2049a3bdbf20e0c4a8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

QAnything 本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。

https://static001.geekbang.org/infoq/26/269c1f22004d11a5453a7db3afad1bc0.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

FlagData 2.0:全面、高效的大模型训练数据治理工具集

用户头像
mr.well
01-21

数据是大模型训练至关重要的一环。数据规模、质量、配比,很大程度上决定了最后大模型的性能表现。无论是大规模的预训练数据、精益求精的SFT数据都依托于一个完整的“获取-准备-处理-分析”数据流程。然而,当前的开源工具通常只专注于流程中的某一环节,很少

https://static001.geekbang.org/infoq/85/857aa0f569fc5edac41b39f9db9fc342.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

拆解全景,解锁未来——深度分析大模型六大领域及五大应用解决方案

用户头像
SEAL安全
2023-12-13

在本篇文章中,我们将带您首先通过解读 LLM 的全景图,深入探讨了 LLM 的六个关键领域,随后提出五种主要方案以解决企业在这一技术领域面临的挑战,引领您深入了解 LLM 的技术脉络,为探索和应用这一技术提供一些思考与指导。

https://static001.geekbang.org/infoq/6a/6aa1265fce4a98aa288a74764899a8eb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

昇腾 CANN 7.0 黑科技:大模型推理部署技术解密

针对大模型推理场景,CANN最新发布的CANN 7.0版本有机整合各内部组件,支持大模型的量化压缩、分布式切分编译、分布式加载部署,并在基础加速库、图编译优化、模型执行调度等方面针对大模型进行极致性能优化。

云智慧联合北航提出智能运维(AIOps)大语言模型及评测基准

随着各行业数字化转型需求的不断提高,人工智能、云计算、大数据等新技术的应用已不仅仅是一个趋势。各行业企业和组织纷纷投入大量资源,以满足日益挑剔的市场需求,追求可持续性和竞争力,这也让运维行业迎来了前所未有的挑战和机遇。

大模型在金融监管科技中的应用价值

随着人工智能技术的不断发展,自然语言处理技术也在不断进步。其中,信息抽取技术作为自然语言处理的重要组成部分,已经被广泛应用于各个领域。在金融监管科技领域,信息抽取技术的应用同样非常重要。

https://static001.geekbang.org/infoq/84/84e52f9a38e4de57af15e827635b31da.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

多模态 GPT-V 出世!36 种场景分析 ChatGPT Vision 能力,LMM 将全面替代大语言模型? | 京东云技术团队

LMM将会全面替代大语言模型?人工智能新里程碑GPT-V美国预先公测,医疗领域/OCR实践+166页GPT-V试用报告首发解读

阿里云大语言模型(LLM)实战训练营,火热开营中!

简介:大语言模型实战训练营已正式开营,汇集阿里云、黑马程序员多位AI领域资深技术专家手把手带您快速实现大语言模型从入门到应用落地!完成课程学习任务更有机会领取LAMY钢笔、小米充电宝、双肩包等精美礼品,快来一起学习体验吧~

https://static001.geekbang.org/infoq/30/307fd2982f0831d12cae21dbf39cbb6c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ChatGenTitle:使用百万 arXiv 论文信息在 LLaMA 模型上进行微调的论文题目生成模型

ChatGenTitle:使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

https://static001.geekbang.org/infoq/b9/b91879851bb41a5b2266b48cc98dd33b.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LangChain:打造自己的 LLM 应用 | 京东云技术团队

LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。

https://static001.geekbang.org/infoq/f5/f5a8e8cfaf36ae1eda32f2429ec79831.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大语言模型的预训练 [6]:思维链 (Chain-of-thought,CoT) 定义原理详解、Zero-shot CoT、Few-shot CoT 以及在 LLM 上应用| 社区征文

大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用| 社区征文

LangChain Java-the Java implementation of LangChain

用户头像
HamaWhite
2023-06-21

It's the Java implementation of LangChain, for building applications with LLMs through composability.

https://static001.geekbang.org/infoq/57/579c82ebfd04549182b75d8bc0103bb3.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ChatGPT 小型平替之 ChatGLM-6B 本地化部署、接入本地知识库体验 | 京东云技术团队

本文期望通过本地化部署一个基于LLM模型的应用,能让大家对构建一个完整的应用有一个基本认知。包括基本的软硬环境依赖、底层的LLM模型、中间的基础框架及最上层的展示组件,最终能达到在本地零编码体验的目的。

LLM模型_LLM模型技术文章_InfoQ写作社区