LLM模型
0 人感兴趣 · 19 次引用
- 最新
- 推荐
【论文解读】让我们逐步验证
本文简要介绍了大模型热门论文“Let’s Verify Step by Step ”的相关工作。近年来,大型语言模型在执行复杂的多步骤推理的能力上有了显著的提高。然而,即使是最先进的模型也会经常产生逻辑错误。
第 53 期|GPTSecurity 周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
reptimeAI + Xinference 联合方案:高效部署并监控你的 LLM 应用
如何能高效地持续监控 LLM 应用的运行表现,而又不增加额外的开发复杂度?在这些问题上,GreptimeAI 和 Xinference 提供了切实可行的解决方案。
FlagData 2.0:全面、高效的大模型训练数据治理工具集
数据是大模型训练至关重要的一环。数据规模、质量、配比,很大程度上决定了最后大模型的性能表现。无论是大规模的预训练数据、精益求精的SFT数据都依托于一个完整的“获取-准备-处理-分析”数据流程。然而,当前的开源工具通常只专注于流程中的某一环节,很少
云智慧联合北航提出智能运维(AIOps)大语言模型及评测基准
随着各行业数字化转型需求的不断提高,人工智能、云计算、大数据等新技术的应用已不仅仅是一个趋势。各行业企业和组织纷纷投入大量资源,以满足日益挑剔的市场需求,追求可持续性和竞争力,这也让运维行业迎来了前所未有的挑战和机遇。
大模型在金融监管科技中的应用价值
随着人工智能技术的不断发展,自然语言处理技术也在不断进步。其中,信息抽取技术作为自然语言处理的重要组成部分,已经被广泛应用于各个领域。在金融监管科技领域,信息抽取技术的应用同样非常重要。
阿里云大语言模型(LLM)实战训练营,火热开营中!
简介:大语言模型实战训练营已正式开营,汇集阿里云、黑马程序员多位AI领域资深技术专家手把手带您快速实现大语言模型从入门到应用落地!完成课程学习任务更有机会领取LAMY钢笔、小米充电宝、双肩包等精美礼品,快来一起学习体验吧~
ChatGenTitle:使用百万 arXiv 论文信息在 LLaMA 模型上进行微调的论文题目生成模型
ChatGenTitle:使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型
LangChain:打造自己的 LLM 应用 | 京东云技术团队
LangChain是一个框架,用于开发由LLM驱动的应用程序。可以简单认为是LLM领域的Spring,以及开源版的ChatGPT插件系统。
LangChain Java-the Java implementation of LangChain
It's the Java implementation of LangChain, for building applications with LLMs through composability.
ChatGPT 小型平替之 ChatGLM-6B 本地化部署、接入本地知识库体验 | 京东云技术团队
本文期望通过本地化部署一个基于LLM模型的应用,能让大家对构建一个完整的应用有一个基本认知。包括基本的软硬环境依赖、底层的LLM模型、中间的基础框架及最上层的展示组件,最终能达到在本地零编码体验的目的。