千亿参数“一口闷”？大模型训练必备四种策略_人工智能_OneFlow