Baihai IDP_Baihai IDP技术文章

Baihai IDP

0 人感兴趣 · 29 次引用

关注

最新
推荐

https://static001.geekbang.org/infoq/9c/9c0cb3d79950aa022c3f134be1ab9767.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AI 深度研究（Deep Research）原理解析

Baihai IDP

07-09

编者按：当你在使用 ChatGPT、Claude 或 Perplexity 时，是否好奇过为什么它们不仅能够回答你的问题，还能主动挖掘相关信息、交叉验证事实性信息，甚至提出你没想到的关联问题？为什么同样是 AI，有些只能机械地重复训练数据，而有些却能进行真正的“D

程序员 AI LLM Baihai IDP DeepResearch

https://static001.geekbang.org/infoq/ba/bad65f61a05fde78ccdb097bf8a5c618.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

我对 AI 写作的一些思考：Writing in the Age of LLMs

Baihai IDP

07-02

编者按：当你收到一篇由 AI 完成的文章时，是否也有过这样的困惑：内容看似专业严谨，读起来却总觉得缺少什么？明明语法正确、逻辑清晰，为什么就是无法抓住读者的注意力？

人工智能 AI Baihai IDP AI 写作

https://static001.geekbang.org/infoq/01/0187d5d14079d8025754dbf7c4e34cac.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

The AI Moat Pyramid：构建不可复制的 AI 护城河

Baihai IDP

06-27

编者按：我们今天为大家带来的文章，作者的观点是：真正的 AI 护城河需要系统性地构建六层递进式能力，从技术底座到战略壁垒，缺一不可。

人工智能 AI LLM Baihai IDP

https://static001.geekbang.org/infoq/a7/a770c9d2ac4b581f6251f5008f11d234.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OCR 识别质量如何影响 RAG 系统的性能？有何解决办法？

Baihai IDP

06-11

编者按：当我们谈论检索增强生成（RAG）系统的性能瓶颈时，大多数人会关注模型架构、向量数据库优化或检索、生成策略，但是否有人深入思考过一个更基础却被忽视的问题：光学字符识别（OCR）的质量究竟在多大程度上制约着整个 RAG 系统的表现？

AI OCR LLM Baihai IDP 检索增强生成

https://static001.geekbang.org/infoq/15/15ff5a957f7fd7a6a3c94e5a93f5ab32.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLMs.txt：让大模型更懂你的 Web 文档

Baihai IDP

04-11

编者按：当你向 AI 助手询问 API 细节时，它是否经常被文档中的导航栏、样式表等无关内容干扰，给出模棱两可的答案？AI 助手已成为开发者不可或缺的得力助手。然而，它们在处理网站内容时往往受限于有限的上下文窗口，加上 HTML 页面中大量非核心内容的干扰

程序员 AI LLM Baihai IDP GenAI

https://static001.geekbang.org/infoq/3c/3cbffc89de1884a366c6adde2415bda5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

「DeepSeek-V3 技术解析」：无辅助损失函数的负载均衡

Baihai IDP

04-02

编者按：在混合专家模型（MoE）的实践中，负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数，不仅增加了训练的复杂度，还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上，一直苦苦追寻着一

AI LLMs Baihai IDP MoE 混合专家模型

https://static001.geekbang.org/infoq/c4/c44d6049630125857db679d922b7f5c3.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

为什么大模型在 OCR 任务上表现不佳？

Baihai IDP

03-28

编者按：你是否曾经用最先进的大语言模型处理企业文档，却发现它把财务报表中的“$1,234.56”读成了“123456”？或者在处理医疗记录时，将“0.5mg”误读为“5mg”？对于依赖数据准确性的运营和采购团队来说，这些问题不仅影响工作效率，更可能导致财务损失、

程序员 AI OCR LLMs Baihai IDP

https://static001.geekbang.org/infoq/4e/4ead34980210ced787f8093e948b6b24.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何高效地为「推理模型」编写最佳提示词？万字长文介绍

Baihai IDP

03-14

编者按：如何有效地为推理模型编写最佳提示词？对于 OpenAI 推出 O1 和 O3-mini 等这些专为深度推理而设计的模型，传统的提示词工程技巧是否仍然适用？

AI 推理模型 LLMs Baihai IDP 提示词

https://static001.geekbang.org/infoq/f4/f4c67c89f941cade313eef79cdba7074.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

后 DeepSeek R1 时代：从资本壁垒到技术普惠

Baihai IDP

03-05

编者按： AI 落地又一次迎来拐点了吗？当模型蒸馏技术能以零头成本复刻顶尖 AI 性能，传统巨头的商业壁垒是否已形同虚设？

程序员 AI LLMs Baihai IDP DeepSeek

https://static001.geekbang.org/infoq/c4/c484244109e334ac4de6f6c7f93aa948.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何正确看待 AI 的推理能力？走出人类中心主义

Baihai IDP

02-21

编者按：人工智能真的能“推理”吗？我们是否正在用过于狭隘的人类思维，限制了对 AI 推理能力的认知？我们今天为大家带来的文章，作者的观点是：AI 的推理能力不应被简单地用“人类中心主义”的标准来否定。文章重点揭示了三个关键内容：

程序员 AI 大模型 LLMs Baihai IDP

https://static001.geekbang.org/infoq/41/410ace9d4afec635c153e03571b07cac.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

多 Agent 协作，效果如何评估？

Baihai IDP

02-20

编者按：在构建基于大语言模型的应用时，你是否遇到过这样的困扰：多个 AI Agent 协同工作时，如何确保它们的表现符合预期？如何有效监控它们之间的互动质量？这些问题不仅影响着产品的性能，更直接关系到用户体验的好坏。

程序员 AI Baihai IDP AI Agents 智能体评估

https://static001.geekbang.org/infoq/8c/8cc4200ce96f9ed73c86aa8e4b1b3afa.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

为什么大语言模型难以处理长上下文？从 Transformer 到 Mamba

Baihai IDP

02-08

编者按：大语言模型真的能像人类一样高效处理海量信息吗？我们今天为大家带来的这篇文章，作者揭示了大语言模型在长上下文处理中的技术挑战与未来发展路径。

程序员 AI LLMs Baihai IDP long context

解锁 AI 潜力：AI 在销售领域的应用案例 (非 Chatbot)

Baihai IDP

2024-12-30

编者按：在人工智能技术日益普及的今天，企业如何有效地利用 AI 创造价值，而不仅仅停留在开发 Chatbot 的层面？我们今天为大家分享的这篇文章，作者的观点是：企业应该将 AI 应用于解决具体的业务问题，而不是仅仅追随 AI Chatbot 的潮流。

程序员 AI chatbot Baihai IDP

https://static001.geekbang.org/infoq/7b/7bcc3c4dd302891d9d452c92e8d4c1f9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

我从 2024 年的 LLM 应用开发实践中学到了什么？Part 1

Baihai IDP

2024-12-27

编者按： "为什么明明选择了最先进的大语言模型，构建的 AI 产品却总是无法达到预期效果？" —— 这大概是今年众多技术团队都在苦恼的问题。从选择合适的商业场景，到组建专业团队，再到技术架构设计，每一步都充满挑战。一个错误的决策，可能导致数月的努力

程序员 AI LLM Baihai IDP GenAI

https://static001.geekbang.org/infoq/ac/ac236aef544bf7bcb72a568431617261.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Chatbot 不是“万金油”：企业级生成式 AI 如何真正创造价值

Baihai IDP

2024-12-27

编者按：企业在引入生成式 AI 时，是否陷入了盲目追随聊天机器人的误区，如何真正发挥 AI 的价值潜力？

程序员 AI chatbot Baihai IDP GenAI

https://static001.geekbang.org/infoq/5c/5c1c2aac431c2e63e91adbf98bd46728.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLM 分布式训练六大关键技术介绍

Baihai IDP

2024-12-13

编者按：本文聚焦于分布式去中心化神经网络训练技术，作者系统阐述了在大规模模型训练中提高硬件使用效率的创新方法。

AI gpu LLMs Baihai IDP

https://static001.geekbang.org/infoq/27/2796b4c7d84550f582d7478a70e99bb5.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从 Llama 1 到 3.1：Llama 模型架构演进详解

Baihai IDP

2024-11-25

编者按：面对 Llama 模型家族的持续更新，您是否想要了解它们之间的关键区别和实际性能表现？本文将探讨 Llama 系列模型的架构演变，梳理了 Llama 模型从 1.0 到 3.1 的完整演进历程，深入剖析了每个版本的技术创新，还通过实际实验对比了 Llama 2 和 Llama

程序员 AI LLM llama Baihai IDP

https://static001.geekbang.org/infoq/50/50810c167785619bc2af60974b81715f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AI 像人一样操控电脑：多模态 AI Agents 和屏幕交互新范式

Baihai IDP

2024-11-20

编者按：未来我们与计算机的交互方式将发生怎样的变革？当 AI 能像人类一样自如地操控电脑和手机，我们的工作方式会有什么改变？

程序员 AI LLMs Baihai IDP AI Agents

https://static001.geekbang.org/infoq/7d/7d22c4e7b168da4ac357f574515f6b30.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Llama 3.2 Vision & Molmo：多模态开源生态系统基础

Baihai IDP

2024-11-01

编者按：视觉功能的融入对模型能力和推理方式的影响如何？当我们需要一个既能看懂图像、又能生成文本的 AI 助手时，是否只能依赖于 GPT-4V 这样的闭源解决方案？

程序员 AI Baihai IDP Llama 3.2 Vision Molmo

https://static001.geekbang.org/infoq/89/8907fab2d143cf1c416d591f0f7ec3ac.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

怎样在 10k 个 H100 GPU 上训练模型？

Baihai IDP

2024-10-28

编者按：怎样在 10,000 个 H100 GPU 上训练大模型？如何充分利用每一块 GPU 的算力？如何在这个复杂的 GPU 网络中高效传递数据？当不可避免的硬件故障发生时，又该如何快速恢复训练进度？我们今天为大家带来的文章中，作者为我们揭示了应对这些挑战的关键策

程序员 AI gpu LLMs Baihai IDP

https://static001.geekbang.org/infoq/b2/b21c4902352d86bd75df2a9cdeb6b1bd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG vs 长上下文 LLMs：谁主沉浮？

Baihai IDP

2024-10-16

编者按：随着大语言模型（LLMs）的上下文窗口不断扩大，您是否开始思考：我们还需要花费大量时间和资源来构建复杂的检索增强生成（RAG）系统吗？

程序员 AI LLMs rag Baihai IDP

https://static001.geekbang.org/infoq/52/5238dd3ec4eb61af4c78f74f30a5c64b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

对 AI 产品定价模式的新思考：基于人数 or 工作量？

Baihai IDP

2024-09-26

编者按：传统的基于用户数量的定价模式是否还适用于AI产品？我们今天为大家带来的这篇文章中，作者提出：AI 产品应该采用基于工作量的定价模式，而非传统的基于用户数量的定价方式。

程序员 AI LLMs Baihai IDP 企业 9 月 PK 榜

https://static001.geekbang.org/infoq/71/71f631f12a739c8b1ad2f62099118b33.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

快速理解 GraphRAG：构建更可靠、更智能的 Chatbot

Baihai IDP

2024-09-24

编者按：传统的检索增强生成（RAG）技术在处理需要深入理解实体关系的问题时常常力不从心，那么有什么新的技术可以突破这一限制吗？

程序员 AI 白海科技 Baihai IDP 企业 9 月 PK 榜

https://static001.geekbang.org/infoq/5a/5a5cf397bba941cba1d897756a69652c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

化“腐朽”为“神奇”：5 种 RAG 优化技术应对千奇百怪的 Query

Baihai IDP

2024-09-11

编者按：您是否曾经遇到这样的情况：明明构建了一个功能强大的 RAG 系统，但用户却频繁抱怨“找不到想要的信息”或“返回的结果不够准确”？这是许多 RAG 应用开发者面临的共同挑战。

程序员 AI rag Baihai IDP 企业 9 月 PK 榜

https://static001.geekbang.org/infoq/40/40a9de906654e2b69b148905de0bca6c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从工程师视角看 “Multi-Agent as a Service (MAaaS)”

Baihai IDP

2024-08-28

编者按：目前 AI Agents 在各行各业的应用前景广阔，越来越多的企业开始尝试部署 AI Agents ，然而如何在企业生产环境中有效部署和管理 AI Agents，是工程师们面临的一大挑战。你是否曾面临这样的困惑：如何确保 AI Agents 在生产环境中稳定可靠地运行？如何

AI LLMs 企业号 8 月 PK 榜 Baihai IDP AI Agents

https://static001.geekbang.org/infoq/50/50754314ec33ef0ab7df4057b737ed3d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

理性看待、正确理解 AI 中的 Scaling “laws”

Baihai IDP

2024-08-17

编者按：LLMs 规模和性能的不断提升，让人们不禁产生疑问：这种趋势是否能一直持续下去？我们是否能通过不断扩大模型规模最终实现通用人工智能（AGI）？回答这些问题对于理解 AI 的未来发展轨迹至关重要。

AI LLMs 企业号 8 月 PK 榜 Baihai IDP GenAI

https://static001.geekbang.org/infoq/9e/9ef41666fc8c2810b24012774e3abf00.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

相同的 LLM 在「不同 GPU 上」会产生不同输出？为什么？

Baihai IDP

2024-08-09

编者按：在大语言模型(LLMs)的部署及其相关的算力扩容过程中，更换 GPU 是否也可能会对模型的输出产生重大影响？这个问题的答案对于确保 LLMs 在不同硬件环境下的一致性和可靠性至关重要。

AI gpu 企业号 8 月 PK 榜 Baihai IDP GenAI

https://static001.geekbang.org/infoq/4e/4e37d6b771b51e1e81739f514472295a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Mistral AI vs. Meta：两大 Top 开源模型的对比

Baihai IDP

2024-03-20

编者按：随着大模型的不断升级和参数量的持续扩大，越来越多人开始重视大模型存在的硬件资源要求高、碳排放量较大等问题。如何在保持模型性能的同时，降低计算成本和资源消耗，成为了业界一个迫切需要解决的问题。

程序员 AI LLM 白海科技 Baihai IDP

https://static001.geekbang.org/infoq/a2/a245a26d26a0f5cda02cd4e939916197.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

微调语言模型前，需要考虑这三个关键方面

Baihai IDP

2023-09-18

编者按：随着大语言模型(LLM)的迅速发展，越来越多团队希望针对特定领域进行模型微调。但是实践运用中总是存在一些困难，直接应用并不总是能达到理想效果。

AI LLM 白海科技大模型微调 Baihai IDP

创作场景

Baihai IDP

推荐作者

推荐标签