LLM应用评估
0 人感兴趣 · 1 次引用
- 最新
- 推荐

LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
编者按: 随着大语言模型应用从简单的文本生成,发展到复杂的多轮对话机器人、检索增强生成(RAG)系统乃至智能体(Agent),我们应如何科学、有效地评估它们的性能,确保其稳定可靠?
0 人感兴趣 · 1 次引用
编者按: 随着大语言模型应用从简单的文本生成,发展到复杂的多轮对话机器人、检索增强生成(RAG)系统乃至智能体(Agent),我们应如何科学、有效地评估它们的性能,确保其稳定可靠?