写点什么

地平线征程6

0 人感兴趣 · 89 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/56/56c33d837a6ff2826f7461a3680e391d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

征程 6 | 多任务 不同帧率 部署方案

推理多任务模型时,可能会有不同任务分支 部署不同帧率的需求,例如 BEV 动态任务 20 帧,静态任务 10 帧这种情况。

https://static001.geekbang.org/infoq/ba/ba38c815383d6a9108f779f373132212.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

三种 Badcase 精度验证方案详解与 hbm_infer 部署实录

在模型结构优化与部署量化过程中,开发者往往会遇到一个关键任务:​基于历史 Badcase 数据验证模型精度变化​,确保模型修改不会引入明显性能退化。 这类验证常见于感知、预测、行为识别等任务,尤其在客户交付或精度回归过程中十分关键。

https://static001.geekbang.org/infoq/14/14a9324c27dbebb7cbc45b2f54f5028c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大模型 | VLA 初识及在自动驾驶场景中的应用

VLA (Vision Language Action)是一种多模态机器学习模型,结合了视觉、语言和动作三种能力,旨在实现从感知输入直接映射到控制动作的完整闭环能力。VLA 强调一体化多模态端到端架构,非感知规控的模块化方案。

https://static001.geekbang.org/infoq/00/0097fb538bc7e8b0de194c0ec58524d3.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

新版 perf 文件解读与性能分析

本文将深入解读新版 perf 文件的核心内容,并结合实例分析性能优化策略。

https://static001.geekbang.org/infoq/14/14a9324c27dbebb7cbc45b2f54f5028c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

手撕大模型 | MQA 和 GQA 原理解析

随着大模型功能的不断强化,其容量也在增加,当前的 KVCache 技术已经不能满足发展需要了,所以,各种针对于 KVCache 优化的技术应时而生。

https://static001.geekbang.org/infoq/25/25879742ccae91c4ef0cf2a097807d4d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

模型插入 NV12 预处理节点精度问题排查流程

本文提供一套标准化的快速排查方案,旨在缩短问题定位周期,降低对开发节奏的干扰。

https://static001.geekbang.org/infoq/14/14a9324c27dbebb7cbc45b2f54f5028c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

手撕大模型|FlashAttention 原理及代码解析

FlashAttention 是一种专为 Transformer 优化的高性能注意力机制。它能显著加速训练和推理,同时减少内存占用,广泛应用于 LLaMA、GPT-NeoX、PaLM 等大模型中。

https://static001.geekbang.org/infoq/25/25879742ccae91c4ef0cf2a097807d4d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

工具链部署实用技巧 7|模型设计帧率推理时耗时与带宽分析

如何让模型按设计帧率运行,同时实时监测模型推理耗时和带宽使用情况?

https://static001.geekbang.org/infoq/ba/ba38c815383d6a9108f779f373132212.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

征程 6E/M|多 camera 场景示例

本 sample 提供全链路场景 1V,4V,7V 使用演示,实现单路及多路 VIO 接入,逐级经过 ISP、PYM、BPU、CODEC 模块处理。

https://static001.geekbang.org/infoq/fc/fc956a6a88593d578a979c3c38b33d03.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

地平线具身智能算法 H-RDT 斩获 CVPR 2025 RoboTwin 真机赛冠军

在CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名)

https://static001.geekbang.org/infoq/7b/7bf34cd80b30ccd53922589432951309.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

理想汽车智驾方案介绍 3|MoE+Sparse Attention 高效结构解析

稀疏注意力(Sparse Attention)与混合专家架构(MoE)是提升大模型效率与性能的核心技术。

https://static001.geekbang.org/infoq/7b/7bf34cd80b30ccd53922589432951309.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

理想汽车智驾方案介绍 2|MindVLA 方案详解

MindVLA 主要包括空间智能模块、语言智能模块、动作策略模块、强化学习模块

https://static001.geekbang.org/infoq/05/058f99f50965723252b1949573878a77.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLM 中增量解码与模型推理解读

在 GPT 系列模型生成对话回复、文章续写等场景中广泛应用了增量解码

https://static001.geekbang.org/infoq/17/176ea9726badf26687180a7bc4768ae0.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

征程 6 | PTQ 精度调优辅助代码,总有你用得上的

在模型编译的时候,往往会出现各种各样的报错,一起来看看如何解决吧!

https://static001.geekbang.org/infoq/05/058f99f50965723252b1949573878a77.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLM 中 token 简介与 bert 实操解读

LLM 是一种基于上下文预测下一个 token 的概率分布的模型

https://static001.geekbang.org/infoq/25/25879742ccae91c4ef0cf2a097807d4d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

征程 6|工具链部署实用技巧 6:hbm 解析 API 集锦

本帖将详细介绍和整理用于 hbm 模型验证和检查的 API,助大家理解使用,保障模型部署顺利。

https://static001.geekbang.org/infoq/fc/fc956a6a88593d578a979c3c38b33d03.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

开发者说|RoboTransfer:几何一致视频世界模型,突破机器人操作泛化边界

近日,地平线、极佳科技与中国科学院自动化研究所等单位提出RoboTransfer,基于扩散模型的视频生成框架,可以用于扩充机器人策略模型的训练数据。

地平线征程6_地平线征程6技术文章_InfoQ写作社区