【AI面试八股文 Vol.3.1:Transformer 核心结构】Attention、GQA、RoPE 与 KV Cache:大模型骨架到底怎么跑起来_AI_计算机魔术师_InfoQ写作社区