写点什么

大模型

0 人感兴趣 · 265 次引用

  • 最新
  • 推荐

从内容生产到企业经营,大模型将如何改变数字营销?

用户头像
中关村科金
19 小时前

​在数字营销领域,大模型技术同样拥有极大的想象空间,而营销所具有的诸多独特性质因与大模型特性高度匹配,让我们更有理由相信,通过大模型加持后的数字营销,将带来更为爆发式的价值提升。

当前最高 4+ 级!大模型能力获信通院标准符合性验证

用户头像
中关村科金
19 小时前

中关村科金领域大模型凭借功能丰富度及性能的优越性,顺利完成中国信通院可信AI模型能力部分的标准符合性验证,并获得当前最高评级4+级,是首批获得该级评分的对话式AI企业。

大模型训练引领 AI 新时代

随着科技的快速发展,人工智能领域日新月异,不断刷新我们的认知。近日,加州大学伯克利分校的科研团队带来了一项重磅成果——对话模型Koala。这款模型拥有亿级别的参数,经过8个A100的训练,将开启AI新时代。

大模型训练中错误数据集的影响及应对策略

在人工智能的浪潮中,神经网络以其强大的计算能力和模式识别能力,成为了研究和实践的热点。然而,神经网络训练过程中的一个关键问题,即错误数据集对模型结果的影响,值得我们深入探讨。

大模型训练中 CPU 高负载与 GPU 低使用率的优化策略

CPU和GPU的使用率是我们必须关注和优化的重点。然而,很多情况下,我们会发现CPU使用率经常达到100%,而GPU的使用率却远远低于这个数值。

https://static001.geekbang.org/infoq/e0/e006909920f526e77c28dd7c3c592d36.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

2023 总结对 AI 的总结和展望

今天是AI最火的一年,从年初的时候OpenAI一下子火起来了,大家都在测试ChatGPT的智力如何,能力如何,各种视频铺天盖地的。各种测评视频大量散布在网络上面,一开始我只是认为他只是一个聊天小助手比较智能,跟普通的聊天机器人没有特别大的差别,所以也就没

技术人年度回顾:大模型驱动的变革与影响

对于普通用户而言,大模型接触到的其实就是一个简单的问答对。在chatgpt4和文心一言这样的产品里面,用户的理解其实就是简单的问一个问题,得到一个答案这么简单,在类似文心,格,Stable Diffusion等类似的产品里面,就是输入一段特定描述,生成符合描述的图

https://static001.geekbang.org/infoq/5a/5a2b2503df7b25aaa54beb6c939e9c45.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从 MLOps 到 LMOps 的关键技术嬗变

本文整理自 2023 年 9 月 3 日 QCon 全球软件开发大会 2023 · 北京站 —— 从 MLOps 到 LMOps 分论坛的同名主题演讲。

https://static001.geekbang.org/infoq/8a/8a11033c803d9cd2bf6c884e229aec16.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深入解析 LLaMA 如何改进 Transformer 的底层结构

本篇文章将以LLaMA 模型为例,介绍大语言模型架构在Transformer 原始结构上的改进,并介绍Transformer 模型结构中空间和时间占比最大的注意力机制优化方法。

利用 Prompt 提升大模型微调性能

近年来,随着深度学习技术的快速发展,大型预训练模型(如GPT-3、BERT等)在各种自然语言处理任务中取得了显著的性能提升。然而,这些大模型往往需要大量的计算资源和时间进行训练,这使得其在实际应用中可能并不总是可行。

利用 Prompt,高效调教大模型

在人工智能(AI)的领域,大模型是当今的热门话题。这些巨大的模型,如GPT-4,BERT,T5等,以其令人印象深刻的性能和功能,正在改变我们处理各种任务的方式。然而,训练这些大模型需要大量的计算资源和时间,这使得它们难以在所有情况下都变得实用或可及。

大模型训练中 batch 的作用

在深度学习和神经网络训练中,Batch是一种重要的概念,它不仅影响了模型的训练速度,还对模型的最终表现有着重要影响。然而,从更高角度理解batch的作用,我们需要深入探讨其背后的理论和实践。

利用大模型训练提升 AI 性能

在深度学习和人工智能领域,预训练模型是一种经过大量数据训练的模型,可以用于各种不同的任务。这些预训练模型可以在云端或开源软件库中找到,它们已经经过优化和调整,可以在各种不同的应用中使用。

最大 Prompt 模板库助力 AI 应用

随着人工智能技术的不断发展,大模型已经成为了AI领域的重要趋势之一。作为国内领先的AI技术提供商,百度智能云始终致力于为用户提供最前沿、最实用的AI技术和应用体验。

掌握 Prompt 工程,开启 AI 大模型新时代

人工智能(AI)领域正在快速发展,各种专业术语和黑话也层出不穷,使得新入行的人往往感到无所适从。特别是在涉及到AI大模型的领域,一些关键概念如提示工程(prompt)、向量工程(embedding)和微调工程(fine-tune)更是晦涩难懂。

Prompt 创新引领对话系统未来

随着人工智能技术的快速发展,自然语言处理领域中的对话系统成为了研究热点。千帆大模型平台的海量Prompt模板库,给该领域带来了前所未有的变革和影响。本文将重点探讨千帆大模型平台的海量Prompt模板库的三个主要特点及其实践意义。

https://static001.geekbang.org/infoq/1d/1d12f3cf1708c4bd52b2e73bec679a56.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

直播预告丨电商内容营销的 AIGC 式进化

大模型时代, “应用变了”:电商内容营销的AIGC式进化以大模型为动的 AIGC 应用指数级迭代在各应用领域,不同的任务需求、数据集、算法,带来了巨大的AIGC应用差异。在电商内容营销领域,最终用户关注什么?

高效微调大模型的新方法

随着自然语言处理(NLP)领域的不断发展,Transformer模型在各种任务中取得了显著的成功。然而,随着模型规模的增大,训练时间和计算资源成为了一个瓶颈。

大模型训练的得力助手

随着人工智能技术的不断发展,大模型已经成为了AI领域的重要趋势之一。作为国内领先的云计算服务提供商,百度智能云也不断升级其千帆大模型平台.

https://static001.geekbang.org/infoq/14/14173fc406449c3db2011c7b1526fa02.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

向“创新者”升阶,程序员当下如何应对 AI 的挑战 | 京东云技术团队

随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。

金融大模型的微调实战

随着人工智能技术的快速发展,金融大模型场景的应用已经变得日益重要。这种技术趋势不仅为金融行业提供了前所未有的机遇,同时也带来了一系列挑战。

开源大模型与微调策略概览

随着人工智能技术的不断发展,大型语言模型(LLM)在自然语言处理领域中扮演着越来越重要的角色。近年来,开源 LLM 大模型以及相关的微调策略已经成为了 NLP 领域的研究热点。

https://static001.geekbang.org/infoq/fe/fea169b07e3192d6251514c2b17ca7ed.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大模型技术的发展与实践 主赛道:技术人的 2023 总结

大型语言模型,也称大语言模型、大模型(Large Language Model,LLM;Large Language Models,LLMs) 。

https://static001.geekbang.org/infoq/9d/9df0e03e475dcdb5ea9af0b21143906a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AI 与自然语言

2023 转眼即将结束,今年诞生了数不清的 AI 产品。代码提示领域的 Copilot, CodeWhisperer; 自然语言与 SQL 相结合的 SQL Chat, ai2sql; 教育领域发力的 Q-Chat, Roleplay。所有的这些 AI 产品,目前的主流交互方式都是基于提示词。那我们思考一下,如果提示

https://static001.geekbang.org/infoq/c9/c9258d88df4039ab6f3d8d9c90e26ec2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

初见腾讯混元大模型,请多指教|社区征文

用户头像
法医
12-01

混元者,元气未分,混沌为一,元气之始也!混元无所不包,无所不有,意思就是形容内容丰富,应有尽有,从名称来看,腾讯对于混元大模型是寄予厚望的。想必大家对大模型并不陌生,自从去年OpenAI发布ChatGPT以来,我们对于大模型的智能感到震撼,国内大模型的

https://static001.geekbang.org/infoq/af/aff886725db416f9541c1bea97471031.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

直播预告丨大模型如何在健康医疗中挖出大大的花?

大模型时代,“应用变了”:大模型如何在健康医疗中挖出大大的花?

https://static001.geekbang.org/infoq/40/4094c520a25ba16410b7f99f88c02681.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

和鲸科技与国科环宇建立战略合作伙伴关系,以软硬件一体化解决方案促进科技创新

双方将深化合作,充分发挥在产品和市场方面的互补优势,为企事业单位数智化转型升级提供更先进、高效的软硬件一体化解决方案。

结合 RNN 与 Transformer 的强大模型

随着深度学习技术的不断发展,序列建模在自然语言处理、语音识别、文本生成等领域的应用越来越广泛。在这个过程中,循环神经网络(RNN)和Transformer模型成为了两种非常重要的架构。

一键部署,高效私有化大模型

随着人工智能技术的快速发展,大模型在各个领域的应用越来越广泛。然而,对于许多企业和机构来说,使用公有云上的大模型服务往往会带来一些安全和性能问题。、

https://static001.geekbang.org/infoq/0f/0ff5b33d3b745c474770d722064626b0.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

聊一聊大模型 | 京东云技术团队

本文对大模型从原理及结构上做了简单的介绍,希望能给各位在了解大模型的路上提供一些帮助。个人经验有限,说的不对的地方还请及时提出宝贵的意见,也可以联系本人线下讨论。下期会结合我们在财富领域训练大模型的经验写一篇偏实践的文章出来。

大模型_大模型技术文章_InfoQ写作社区