科学吃瓜!华为否认抄袭阿里,这次我站华为

大家好,这里是程序员晚枫,全网同名。
上周难得在热搜多次看到了有关开源大模型的消息,而且都和华为有关。
一次是周一:华为、百度同日宣布开源,背后是何战略?另一次是本周末:华为盘古团队否认抄袭通义千问 参数相似之争引热议。
而且最近:大模型、开源、免费等信息也着实火热,国产大模型之间互相抄袭,也是第一次听说。

**这次大家跟我一起用通俗的解释,吃这次科技的大瓜。**🍉
先说一下结论:我个人认为,目前的证据还无法证明华为是抄袭的。
事件梳理
先看一下事情的始末:
以下是关于我让大模型整理的**“华为盘古团队否认抄袭通义千问”**事件的脉络梳理,逻辑还是基本可靠。

抄袭事件被热议后,华为团队也发了一个声明:

我从头到尾看下来:依我愚见,我认为关于相似性的争议点,需要进一步证明和解释;而关于抄袭代码的争议点,纯属无稽之谈。
争议点分析
此次事件中,最具争议的有 2 个部分,我用红色的点标记出来了,这里有个印象,下面详细解释:
外界质疑华为抄袭了阿里的开源代码。
华为盘古大模型和阿里千问大模型,存在算法上的相似性。
我通过目前已有的证据判断:第 1 点纯属外行的无理取闹,第 2 点目前还不能当作确凿的证据。
1、华为的代码里有阿里千问的 logo 文字
这一点也是被炒的最火热的:

但其实懂开源技术的都知道:千问本身是开源的,而且使用的是相当宽松的 Apache2.0 协议。
开源意味着:阿里通义大模型,在自己的代码里写明了任何人都可以使用我的代码,也可以在我的代码基础上进行修改,但是要保留我的名字。
更通俗的理解:阿里写了一本只有 50 个字的字典,并且声明了任何人都可以在阿里字典的基础上,修改或者新增字词,但要留下阿里这个原始作者的名字。
然后华为遵循这一开源约定,在使用千问代码的基础上做了修改,并且保留了 Qwen 的 logo 文字。
这一点不仅不应该批评华为,**还应该给华为点赞!**因为很多人用了开源软件,是不会遵守开源规定,保留原作者信息的。
2、算法相似性
两个模型的算法存在相似性高达 0.927,可以理解为:
同一套试卷,阿里和华为都解出来了,而且解题速度差不多,分数也差不多。但是阿里几个月前参加的考试(发布大模型),华为是近期参加的(发布大模型)。
但是从目前已有的证据来看,我们只能看到他们的解题结果,并没有看到他们到底是怎么解题的。
所以,并不能以此确定后者就抄袭了前者。
除非可以证明,他们的解题过程也是相同的,例如:是否有阿里的人跳槽到华为,并且参与了这个大模型的开发?或者直接拿出他们抄袭的记录。
否则指责华为抄袭阿里,就好像
高考出分的第一天,只看了一眼榜单,就指责两个考了 693 分和 690 分的人是互相抄袭的一样。
只会让人觉得莫名其妙,无法让人信服。
而且之前的视频里我也给大家讲过,阿里的千问模型去年就已经登顶过某知名大模型排行榜,也一直是国内外大模型学习的榜样,例如
前段时间大火的 DeepSeek,其实也参考了阿里千问大模型。
华为作为后起之秀,参考千问这个优秀的行业实践,也是符合常识的常规操作?
写在后面
从 2 年前各家推出大模型开始,接连走过了从闭源到开源的路程。
能把大模型开源给用户,是一种展示自身技术的方式,本身就证明了各个大厂对自家大模型的自信。
但是开源的过程中,存在一些合规和舆情风险,后面的文章里我会给大家分析更多的开源争议案例。

版权声明: 本文为 InfoQ 作者【程序员晚枫】的原创文章。
原文链接:【http://xie.infoq.cn/article/fd5f2b675f4d4364a3369b78d】。文章转载请联系作者。
评论