写点什么

大模型

0 人感兴趣 · 509 次引用

  • 最新
  • 推荐

大模型微调提升 AI 应用性能

随着人工智能技术的不断发展和普及,越来越多的领域开始应用AI技术来解决实际问题。

魔搭×函数计算:实现大模型快速部署,加速 AI 应用落地

本文将介绍魔搭与函数计算结合,如何帮助开发者简化大模型从选型到生产部署的过程,实现一键式部署,降低技术门槛,加速AI应用的快速落地。

大模型 Chatbots 评估新视角:结合定性与程序方法的实践探索

本文将从定性和程序方法两个角度出发,探讨Chatbots评估的新视角,并结合实践经验提供可操作的建议和解决方法。

GLM 国产大模型训练加速:高效性能与成本优化的实践

本文将介绍GLM国产大模型在训练过程中的性能优化,通过OneFlow框架实现的高效训练和显存节省,使得模型训练成本大大降低,为深度学习领域的实际应用提供了新的突破。

LLaMA 2 语言大模型的微调策略:LoRA 与全参数选择

本文将深入探讨LLaMA 2语言大模型在微调过程中,选择LoRA技术与全参数方法的优缺点,并结合实际应用场景,为开发者提供有价值的建议。

https://static001.geekbang.org/infoq/21/2158c6ab468c114670b6cec15822d9c9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数栈 +AI:数栈 V6.2 创新发布,让数据开发更智能

数栈V6.2的完整介绍来啦!新版本在稳定性、性能和信创安全方面有了长足的进步,还融合了生成式AI技术,数据开发的各个环节得到了显著优化和智能化升级,让数据开发更智能、更省心。

利用飞桨与文心大模型重塑大宗商品数字供应链

随着数字化时代的深入发展,大宗商品行业正面临前所未有的转型挑战。在这一背景下,数链科技凭借其深厚的技术积累和对行业的深刻理解,利用飞桨深度学习平台和文心大模型技术,打造出一款大宗商品数字供应链系统。

文心大模型“你说我画”:PaddleHub 与 PaddleSpeech 的协同实践

在人工智能领域中,自然语言处理和计算机视觉是两个非常活跃的研究方向。随着深度学习技术的发展,这两个领域之间的交叉融合产生了许多令人兴奋的应用场景。其中,“你说我画”就是这样一个结合自然语言处理和计算机视觉技术的创新应用。

https://static001.geekbang.org/infoq/56/568c9d16ef503b3fcf4e393a4a59d7fb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

NL2SQL 进阶系列 (5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集 BIRD-SQL 解读

NL2SQL进阶系列(5):论文解读业界前沿方案(DIN-SQL、C3-SQL、DAIL-SQL)、新一代数据集BIRD-SQL解读

Open WebUI 大模型对话平台:适配 Ollama 的实践与探索

本文介绍了Open WebUI大模型对话平台如何适配Ollama模型,并提供了实际操作建议,帮助读者更好地理解和应用相关技术。

文心大模型 ERNIE-Tiny:轻量化技术的全面解读

本文将重点介绍文心大模型ERNIE-Tiny,它通过轻量化技术实现了高效、精准的性能,为实际应用带来了全新的可能性。我们将深入探讨其技术特点、实际应用场景以及未来发展趋势,帮助读者更好地理解和应用这一前沿技术。

聊聊大模型的屏蔽词工程

在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模型(基于ChatGLM3)大多数时候返回空,继续正

https://static001.geekbang.org/infoq/21/216f1308d367512b6cc83aa50c964e7b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

NL2SQL 进阶系列 (4):ConvAI、DIN-SQL 等 16 个业界开源应用实践详解 [Text2SQL]

NL2SQL进阶系列(4):ConvAI、DIN-SQL等16个业界开源应用实践详解[Text2SQL]

Hugging Face 推出全新代码大模型:支持 80+ 编程语言,集成 VSCode

随着人工智能技术的不断发展,代码大模型成为了近年来备受瞩目的技术热点。作为自然语言处理领域的领军企业,Hugging Face近日推出了一款全新的代码大模型,该模型支持80+种编程语言,并与VSCode进行了集成,为用户提供了前所未有的代码智能支持和编程体验。

从零开始学习大模型

随着人工智能技术的快速发展,大模型已成为许多领域的热门话题。然而,大模型的创建并不是一件容易的事情。在本文中,我们将从零开始学习如何创建一个大模型,帮助读者掌握大模型的创建过程。

https://static001.geekbang.org/infoq/3e/3eb979900aaeb0f62bcba78339d81a85.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

NL2SQL 进阶系列 (3):Data-Copilot、Chat2DB、Vanna Text2SQL 优化框架开源应用实践详解 [Text2SQL]

NL2SQL进阶系列(3):Data-Copilot、Chat2DB、Vanna Text2SQL优化框架开源应用实践详解[Text2SQL]

AI+BI,欢迎数据分析进入大模型时代

中关村科金在AI+BI领域的探索和创新正是基于这样的背景。既打破了传统BI的局限性,实现了数据分析和交互的智能化、自动化,也提高了数据分析的效率,降低了数据分析的门槛,使得更多的业务人员能够轻松上手,利用数据驱动业务决策。

智能助力:大模型自动填写工单准确率达 95%

大模型智能填单作为一种新兴的技术应用,未来随着应用边界不断拓展,将进一步改变企业的运营方式和效率。而中关村科金一直坚持探索前沿人工智能技术与千行百业应用场景的落地融合,力求打破技术应用瓶颈,为客户提供最优质、最智能的解决方案。

三大能力升级!大模型开启智能客服新篇章

大模型为智能客服开启了服务升级的新篇章,是企业在数字化时代提高服务质量和效率的重要途径。通过大模型的深度学习能力和智能客服的自动化处理能力,企业能够实现快速、高效的知识构建和管理,提高客户满意度和忠诚度。

https://static001.geekbang.org/infoq/42/4272e9011a0cc06ea94b1d92e903fd31.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

在全球科技竞争加剧的情况下,软件工具链的发展成为国家信息安全与科技创新的关键。如何利用AI大模型推动软件工具链发展,加速软件研发,成为当前的研究热点。

百度 Create AI 开发者大会剧透丨用好三大 AI 神器 ,人人都是开发者

程序员会消失,真的吗?大模型的下一站是什么?开发者的机会在哪里?什么才是最好用的AI应用开发工具?在4月16日举办的2024百度Create AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏将就这些备受瞩目的问题一一进行解答。

为什么向量数据库在 RAG 中至关重要?

用户头像
Zilliz
04-11

什么是向量数据库?一个专业的向量数据库究竟是如何运转的?它又是如何为产业赋能的?开箱即用的云原生向量数据库该怎么用?

深度解析大模型推理框架:原理、应用与实践

本文将简明扼要地介绍大模型推理框架的原理、应用领域和实践经验,帮助读者理解并应用这一复杂的技术概念。通过生动的语言和实例,我们将揭示大模型推理框架如何在实际应用中发挥作用。

https://static001.geekbang.org/infoq/21/2158c6ab468c114670b6cec15822d9c9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

袋鼠云春季发布会圆满落幕,构建 Data+AI 新质生产力

4月10日,以“Data+AI,构建新质生产力”为主题的袋鼠云春季发布会圆满落幕。大会中,袋鼠云带来了一系列“+AI”的数字化产品与最新行业沉淀,旨在将数据与AI紧密结合,打破传统的生产力边界,赋能企业实现更高质量、更高效率的数字化发展。

https://static001.geekbang.org/infoq/ff/ff8dd5267354800e81e2a7c9461d90e0.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大模型工程化落地,足够细分的优质数据是关键

Gartner中国企业人工智能趋势浪潮3.0指出,中国企业正在将人工智能项目从原型转向生产。

智能制造与 AI 大模型

本文介绍了AI大模型在智能制造领域的应用及其重要性。AI大模型通过强大的计算和数据分析能力,优化了生产过程,提高了生产效率和质量。同时,AI大模型还推动了生产线的自动化和协同化,以及产品设计和开发的创新。

大模型分布式训练并行技术

在深度学习领域,大模型的训练通常需要使用大量的数据和计算资源。为了提高训练效率,数据并行成为一种常见的分布式训练策略。本文将深入解析数据并行的原理、应用场景和优势,为读者提供实际应用的建议。

https://static001.geekbang.org/infoq/7d/7d0488c59f626bfc1584c03f99809851.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

NL2SQL 基础系列 (2):主流大模型与微调方法精选集,Text2SQL 经典算法技术回顾七年发展脉络梳理

Text-to-SQL(或者Text2SQL),顾名思义就是把文本转化为SQL语言,更学术一点的定义是:把数据库领域下的自然语言(Natural Language,NL)问题,转化为在关系型数据库中可以执行的结构化询语言(Structured Query Language,SQL),因此Text-to-SQL也可以被

大模型_大模型技术文章_InfoQ写作社区