大模型微调实战：利用INT8/FP4/NF4量化技术提升性能与效率_深度学习_百度开发者中心