【AI面试八股文 Vol.3.2:LLM 工作流程】从 BPE 到自回归生成:Token、采样、KV Cache 如何决定成本与效果_AI_计算机魔术师_InfoQ写作社区