人工智能
155 人感兴趣 · 2062 次引用
- 最新
- 推荐
未来已来!探索 AI 医疗与低代码开发平台:引领健康浪潮的科技巨潮
近年来,随着数智时代的到来,人工智能(AI)技术正以前所未有的速度快速发展,对各个行业产生了深远的影响,尤其是医疗行业。AI医疗技术的发展为人们提供了前所未有的医疗解决方案,带来了许多创新的机会与挑战。现代医疗领域正迎来一场革命,而低代码开发平
AI 开源:国际化开发潮流与低代码平台的崛起,探析其积极影响
随着人工智能(AI)技术的迅猛发展,AI开源背景下的国际化开发正逐渐成为一股势不可挡的潮流。
探秘华为云盘古大模型:AI for industries 的身体力行
大模型是新一轮AI发展的核心,其已在推进产业智能化升级中已表现出巨大潜力,并将在未来三年里形成风起云涌之势。
预约直播 | 展心展力 MetaApp:基于 DeepRec 的稀疏模型训练实践
阿里云AI技术分享会第十一期《基于DeepRec的稀疏模型训练实践》将在2023年7月5日晚18:00开启直播,精彩不容错过。
AI 药物研发大赛培训来啦!清华博导讲解,高分基线等你来 Fork!
首届全球AI药物研发算法大赛,将由清华大学药学院、百度飞桨、百度智能云和临港实验室共同主办,并得到中国药学会等单位大力支持,快来火速报名!
强化学习从基础到进阶 -- 案例与实践含面试必知必答 [9]:稀疏奖励、reward shaping、curiosity、分层强化学习 HRL
实际上用强化学习训练智能体的时候,多数时候智能体都不能得到奖励。在不能得到奖励的情况下,训练智能体是非常困难的。例如,假设我们要训练一个机器臂,桌上有一个螺丝钉与一个螺丝起子,要训练它用螺丝起子把螺丝钉栓进去很难,因为一开始智能体是什么都不
【开发者福利】教你 3 步薅到免费 GPU 算力!
好消息,阿里云机器学习平台PAI推出免费送算力的新活动啦!包含V100、A10、T4等机型,可直接跑Jupyter Notebook,也可以直接训练部署现在大火的Stable Diffusion、ChatGLM-6B等模型!
清微智能 TX5368A 与飞桨完成Ⅱ级兼容性测试,助力全行业智能化升级
近日,清微智能的高性能视觉芯片TX5368A与飞桨完成Ⅱ级兼容性测试(基于Paddle2ONNX工具)。测试结果显示,双方兼容性表现良好,整体运行稳定。这是清微智能加入“硬件生态共创计划”后取得的又一阶段性成果。
强化学习从基础到进阶 - 常见问题和面试必知必答 [8]:近端策略优化(proximal policy optimization,PPO)算法
强化学习从基础到进阶-常见问题和面试必知必答[8]:近端策略优化(proximal policy optimization,PPO)算法
强化学习从基础到进阶 -- 案例与实践 [7.1]:深度确定性策略梯度 DDPG 算法、双延迟深度确定性策略梯度 TD3 算法详解项目实战
OpenAI Gym中其实集成了很多强化学习环境,足够大家学习了,但是在做强化学习的应用中免不了要自己创建环境,比如在本项目中其实不太好找到Qlearning能学出来的环境,Qlearning实在是太弱了,需要足够简单的环境才行,因此本项目写了一个环境,大家感兴趣的话
强化学习从基础到进阶 - 常见问题和面试必知必答 [7]:深度确定性策略梯度 DDPG 算法、双延迟深度确定性策略梯度 TD3 算法详解
深度确定性策略梯度(deep deterministic policy gradient,DDPG):在连续控制领域经典的强化学习算法,是深度Q网络在处定性”表示其输出的是一个确定的动作,可以用于连续动作环境;“策略梯度”代表的是它用到的是策略网络,并且每步都会更新一次,其是一
强化学习从基础到进阶 -- 案例与实践 [7]:深度确定性策略梯度 DDPG 算法、双延迟深度确定性策略梯度 TD3 算法详解
离散动作与连续动作是相对的概念,一个是可数的,一个是不可数的。 如图 7.1 所示,离散动作和连续动作有几个例子。在 CartPole 环境中,可以有向左推小车、向右推小车两个动作。在 Frozen Lake 环境中,小乌龟可以有上、下、左、右4个动作。在雅达利的 Pong
“息壤”引领首个算力互联互通验证平台建设,天翼云开启算力互联网新纪元!
6月21日,“2023算力互联互通大会”在北京召开。天翼云基于自主研发的云操作系统、紫金DPU、算力分发网络平台“息壤”等能力,作为算力互联互通验证平台的设计方、核心建设者、资源提供者与标准制定者,充分展现了跨服务商、跨架构、跨地域的算力互联互通能力
实践讲解强化学习之梯度策略、添加基线、优势函数
本文将从实践案例角度为大家解读强化学习中的梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)。
和鲸助力中国大学生计算机设计大赛国赛作品评审标准落实研讨会召开,专家平台首发布
6月16日至19日,中国大学生计算机设计大赛国赛作品评审标准落实研讨会(第一期)在天津召开,本次会议由中国大学生计算机设计大赛组委会主办,南开大学承办,和鲸社区参与协办。
沐曦与百度飞桨完成兼容性测试,助力计算机视觉应用发展
近日,沐曦集成电路(上海)有限公司(以下简称“沐曦”)的曦思®N100人工智能推理GPU与百度飞桨完成 I 级兼容性测试。测试结果显示,双方兼容性表现良好,整体运行稳定。这是沐曦自2022年9月加入“硬件生态共创计划”后的阶段性成果。
李彦宏:AI 原生应用比大模型数量更重要
6月26日,百度创始人、董事长兼首席执行官李彦宏出席“世界互联网大会数字文明尼山对话”,发表了题为 《大模型重塑数字世界》 的演讲。
强化学习从基础到进阶 - 常见问题和面试必知必答 [6]:演员 - 评论员算法(advantage actor-critic,A2C),异步 A2C、与生成对抗网络的联系等详解
优势演员-评论员(advantage actor-critic,A2C)算法:一种改进的演员-评论员(actor-critic)算法。
强化学习从基础到进阶 - 案例与实践 [6]:演员 - 评论员算法(advantage actor-critic,A2C),异步 A2C、与生成对抗网络的联系等详解
在REINFORCE算法中,每次需要根据一个策略采集一条完整的轨迹,并计算这条轨迹上的回报。这种采样方式的方差比较大,学习效率也比较低。我们可以借鉴时序差分学习的思想,使用动态规划方法来提高采样效率,即从状态 开始的总回报可以通过当前动作的即时奖励
报名开启!2023 大模型应用创新挑战赛来啦
百度飞桨重磅推出2023大模型应用创新挑战赛,给你平台和机会,助你迈出大模型应⽤开发实战的第一步,用你的大模型技术构建创新应⽤,征服这个时代。
如何驯化机器狗读懂人类手势,手把手教你!
“中国软件杯”大学生软件设计大赛-智能四足机器狗电力巡检系统开发赛项区域赛即将来临!如何驯化机器狗读懂人类手势?开发者来教你!
强化学习从基础到进阶 - 常见问题和面试必知必答 [5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit)
策略(policy):在每一个演员中会有对应的策略,这个策略决定了演员的后续动作。具体来说,策略就是对于外界的输入,输出演员现在应该要执行的动作。一般地,我们将策略写成 。