大模型
0 人感兴趣 · 259 次引用
- 最新
- 推荐

2023 总结对 AI 的总结和展望
今天是AI最火的一年,从年初的时候OpenAI一下子火起来了,大家都在测试ChatGPT的智力如何,能力如何,各种视频铺天盖地的。各种测评视频大量散布在网络上面,一开始我只是认为他只是一个聊天小助手比较智能,跟普通的聊天机器人没有特别大的差别,所以也就没
利用 Prompt 提升大模型微调性能
近年来,随着深度学习技术的快速发展,大型预训练模型(如GPT-3、BERT等)在各种自然语言处理任务中取得了显著的性能提升。然而,这些大模型往往需要大量的计算资源和时间进行训练,这使得其在实际应用中可能并不总是可行。
利用 Prompt,高效调教大模型
在人工智能(AI)的领域,大模型是当今的热门话题。这些巨大的模型,如GPT-4,BERT,T5等,以其令人印象深刻的性能和功能,正在改变我们处理各种任务的方式。然而,训练这些大模型需要大量的计算资源和时间,这使得它们难以在所有情况下都变得实用或可及。
大模型训练中 batch 的作用
在深度学习和神经网络训练中,Batch是一种重要的概念,它不仅影响了模型的训练速度,还对模型的最终表现有着重要影响。然而,从更高角度理解batch的作用,我们需要深入探讨其背后的理论和实践。
利用大模型训练提升 AI 性能
在深度学习和人工智能领域,预训练模型是一种经过大量数据训练的模型,可以用于各种不同的任务。这些预训练模型可以在云端或开源软件库中找到,它们已经经过优化和调整,可以在各种不同的应用中使用。
最大 Prompt 模板库助力 AI 应用
随着人工智能技术的不断发展,大模型已经成为了AI领域的重要趋势之一。作为国内领先的AI技术提供商,百度智能云始终致力于为用户提供最前沿、最实用的AI技术和应用体验。
掌握 Prompt 工程,开启 AI 大模型新时代
人工智能(AI)领域正在快速发展,各种专业术语和黑话也层出不穷,使得新入行的人往往感到无所适从。特别是在涉及到AI大模型的领域,一些关键概念如提示工程(prompt)、向量工程(embedding)和微调工程(fine-tune)更是晦涩难懂。
Prompt 创新引领对话系统未来
随着人工智能技术的快速发展,自然语言处理领域中的对话系统成为了研究热点。千帆大模型平台的海量Prompt模板库,给该领域带来了前所未有的变革和影响。本文将重点探讨千帆大模型平台的海量Prompt模板库的三个主要特点及其实践意义。

直播预告丨电商内容营销的 AIGC 式进化
大模型时代, “应用变了”:电商内容营销的AIGC式进化以大模型为动的 AIGC 应用指数级迭代在各应用领域,不同的任务需求、数据集、算法,带来了巨大的AIGC应用差异。在电商内容营销领域,最终用户关注什么?
高效微调大模型的新方法
随着自然语言处理(NLP)领域的不断发展,Transformer模型在各种任务中取得了显著的成功。然而,随着模型规模的增大,训练时间和计算资源成为了一个瓶颈。
大模型训练的得力助手
随着人工智能技术的不断发展,大模型已经成为了AI领域的重要趋势之一。作为国内领先的云计算服务提供商,百度智能云也不断升级其千帆大模型平台.
金融大模型的微调实战
随着人工智能技术的快速发展,金融大模型场景的应用已经变得日益重要。这种技术趋势不仅为金融行业提供了前所未有的机遇,同时也带来了一系列挑战。
开源大模型与微调策略概览
随着人工智能技术的不断发展,大型语言模型(LLM)在自然语言处理领域中扮演着越来越重要的角色。近年来,开源 LLM 大模型以及相关的微调策略已经成为了 NLP 领域的研究热点。

大模型技术的发展与实践 主赛道:技术人的 2023 总结
大型语言模型,也称大语言模型、大模型(Large Language Model,LLM;Large Language Models,LLMs) 。

初见腾讯混元大模型,请多指教|社区征文
混元者,元气未分,混沌为一,元气之始也!混元无所不包,无所不有,意思就是形容内容丰富,应有尽有,从名称来看,腾讯对于混元大模型是寄予厚望的。想必大家对大模型并不陌生,自从去年OpenAI发布ChatGPT以来,我们对于大模型的智能感到震撼,国内大模型的


和鲸科技与国科环宇建立战略合作伙伴关系,以软硬件一体化解决方案促进科技创新
双方将深化合作,充分发挥在产品和市场方面的互补优势,为企事业单位数智化转型升级提供更先进、高效的软硬件一体化解决方案。
结合 RNN 与 Transformer 的强大模型
随着深度学习技术的不断发展,序列建模在自然语言处理、语音识别、文本生成等领域的应用越来越广泛。在这个过程中,循环神经网络(RNN)和Transformer模型成为了两种非常重要的架构。
一键部署,高效私有化大模型
随着人工智能技术的快速发展,大模型在各个领域的应用越来越广泛。然而,对于许多企业和机构来说,使用公有云上的大模型服务往往会带来一些安全和性能问题。、

聊一聊大模型 | 京东云技术团队
本文对大模型从原理及结构上做了简单的介绍,希望能给各位在了解大模型的路上提供一些帮助。个人经验有限,说的不对的地方还请及时提出宝贵的意见,也可以联系本人线下讨论。下期会结合我们在财富领域训练大模型的经验写一篇偏实践的文章出来。

基于神经网络的大模型在自然语言处理中的应用前景展望
随着人工智能技术的不断发展,自然语言处理技术也日益成熟。基于神经网络的大模型在自然语言处理中发挥着越来越重要的作用,取得了显著的进展和卓越的成就。
LLM 模型参数助力多模态大模型高效训练
随着人工智能技术的快速发展,多模态大模型在各种应用领域展现出了巨大的潜力。然而,其训练过程存在着计算资源消耗大、训练时间漫长等问题,这限制了其在实际场景中的应用。


大模型的未来是垂直领域大模型
大模型应用向领域垂直化发展的趋势,是否有其必然性?又或者垂直领域大模型也只是大模型众多应用尝试中的一种,也要在千军万马中努力争取成为挤过独木桥的幸存者?本文就是尝试在这个角度做一些讨论。