层出不穷的大模型技术,真的助力研发了吗?
每当有新技术崛起时,都会有很多人蜂拥而上,生怕错过了新技术带来的红利。但人们往往也比较容易犯一个错误,那就是为了用新技术而用新技术,最终导致新技术是接上了,但却落不了地。所以,当大模型技术兴起时,我们不仅要热情拥抱,也要冷静看待,关于如何构建实实在在可以提升研发效能的工具,我认为有以下两个方向可以考虑:
解决痛点。我们可以结合实际研发场景去分析当下还存在哪些痛点,而大模型技术刚好可以搞定这些需求。以解决痛点为出发点,最大的优势就是更容易落地,工具解决了用户的痛点,用户自然很接受去使用工具。而随着痛点被解决,研发效能也自然得到了提升。
创造性赋能,这个方向更多是结合大模型技术的优势,去寻找它能够产生创造性赋能的地方,这个方向相比解决痛点的难度要大很多,要选对赋能的方向。要是不小心选错了就容易出现问题中表述的情况,但如果选对了,这个方向带来的提升往往是跨越式的、生产力跨代级别的变革,是解决痛点带来的提升所不可比拟的。
新技术发展的初期,我们可以先从第一条路入手,快速通过解决问题,将新技术落地,并提升研发效能。而随着落地的过程我们也不断去思考、快速尝试,找到第二条路,也就是创造性赋能的方向,实现研发效能的跨代提升。至于这些工具能否提高研发效率,主要取决于它们的实际效果,如果效果足够好,应该能够节省开发者很多时间。而影响工具使用效果的主要因素有两个,一是大模型的基础能力,二是对提示词中包含信息的控制和优化。截至目前,GPT-4 的实际效果仍然是“独一档”,它具备的推理和解决问题的能力显著强于其他大模型,而开源模型本地私有部署和调优的效果距离实用还有比较大的距离。
大模型的潜力能否充分发挥出来,还取决于我们提示词中是否提供了必需且有效的信息。例如 debug 或者写测试用例,需要将与错误或被测函数有关的代码都带入提示词,大模型才有可能给出有效的回答。这部分工作如果完全交由工具或者 AI 去做,效果往往时好时坏,最好能够由人参与或者给出一些判断。
可以说,如何选取和提炼给大模型的信息,是我们用好大模型的“必修课”。就像你给一位实习生安排任务,需要说清楚任务及其依赖的上下文,信息过多或者过少都会影响实习生的表现。我们在职业发展过程中需要学习如何成为优秀的 mentor 或者 manager,今天也需要学习如何管理和利用大模型的能力。
本文整理自《研发效能100问》,原作者:彭云鹏 百度代码团队代码经理、任晶磊 思码逸创始人兼 CEO
评论