写点什么

RAG 评估

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/c6/c6e06d8cba747bb80dd961e83decc12c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)

编者按: 随着大语言模型应用从简单的文本生成,发展到复杂的多轮对话机器人、检索增强生成(RAG)系统乃至智能体(Agent),我们应如何科学、有效地评估它们的性能,确保其稳定可靠?

RAG 评估_RAG 评估技术文章_InfoQ写作社区