为什么 Transformer 能够并行处理序列,而 RNN 必须串行处理?位置编码有什么作用?_人工智能_知识浅谈_InfoQ写作社区