写点什么

科学吃瓜!华为否认抄袭阿里,这次我站华为

作者:程序员晚枫
  • 2025-07-07
    重庆
  • 本文字数:1319 字

    阅读完需:约 4 分钟

科学吃瓜!华为否认抄袭阿里,这次我站华为

大家好,这里是程序员晚枫,全网同名。


上周难得在热搜多次看到了有关开源大模型的消息,而且都和华为有关。


一次是周一:华为、百度同日宣布开源,背后是何战略?另一次是本周末:华为盘古团队否认抄袭通义千问 参数相似之争引热议


而且最近:大模型开源免费等信息也着实火热,国产大模型之间互相抄袭,也是第一次听说。


image.png


**这次大家跟我一起用通俗的解释,吃这次科技的大瓜。**🍉


先说一下结论:我个人认为,目前的证据还无法证明华为是抄袭的。

事件梳理

先看一下事情的始末:


以下是关于我让大模型整理的**“华为盘古团队否认抄袭通义千问”**事件的脉络梳理,逻辑还是基本可靠。


image.png


抄袭事件被热议后,华为团队也发了一个声明:


image.png


我从头到尾看下来:依我愚见,我认为关于相似性的争议点,需要进一步证明和解释;而关于抄袭代码的争议点,纯属无稽之谈。

争议点分析

此次事件中,最具争议的有 2 个部分,我用红色的点标记出来了,这里有个印象,下面详细解释:


  • 外界质疑华为抄袭了阿里的开源代码。

  • 华为盘古大模型和阿里千问大模型,存在算法上的相似性。


我通过目前已有的证据判断:第 1 点纯属外行的无理取闹,第 2 点目前还不能当作确凿的证据。

1、华为的代码里有阿里千问的 logo 文字

这一点也是被炒的最火热的:


image.png


但其实懂开源技术的都知道:千问本身是开源的,而且使用的是相当宽松的 Apache2.0 协议。


开源意味着:阿里通义大模型,在自己的代码里写明了任何人都可以使用我的代码,也可以在我的代码基础上进行修改,但是要保留我的名字。


更通俗的理解:阿里写了一本只有 50 个字的字典,并且声明了任何人都可以在阿里字典的基础上,修改或者新增字词,但要留下阿里这个原始作者的名字。


然后华为遵循这一开源约定,在使用千问代码的基础上做了修改,并且保留了 Qwen 的 logo 文字。


这一点不仅不应该批评华为,**还应该给华为点赞!**因为很多人用了开源软件,是不会遵守开源规定,保留原作者信息的。

2、算法相似性

两个模型的算法存在相似性高达 0.927,可以理解为:


同一套试卷,阿里和华为都解出来了,而且解题速度差不多,分数也差不多。但是阿里几个月前参加的考试(发布大模型),华为是近期参加的(发布大模型)。


但是从目前已有的证据来看,我们只能看到他们的解题结果,并没有看到他们到底是怎么解题的。


所以,并不能以此确定后者就抄袭了前者。


除非可以证明,他们的解题过程也是相同的,例如:是否有阿里的人跳槽到华为,并且参与了这个大模型的开发?或者直接拿出他们抄袭的记录。


否则指责华为抄袭阿里,就好像


高考出分的第一天,只看了一眼榜单,就指责两个考了 693 分和 690 分的人是互相抄袭的一样。


只会让人觉得莫名其妙,无法让人信服。


而且之前的视频里我也给大家讲过,阿里的千问模型去年就已经登顶过某知名大模型排行榜,也一直是国内外大模型学习的榜样,例如


前段时间大火的 DeepSeek,其实也参考了阿里千问大模型。


华为作为后起之秀,参考千问这个优秀的行业实践,也是符合常识的常规操作?

写在后面

从 2 年前各家推出大模型开始,接连走过了从闭源到开源的路程。


能把大模型开源给用户,是一种展示自身技术的方式,本身就证明了各个大厂对自家大模型的自信。


但是开源的过程中,存在一些合规和舆情风险,后面的文章里我会给大家分析更多的开源争议案例。


image.png


发布于: 刚刚阅读数: 2
用户头像

C++开发,开源项目:python-office 2020-10-09 加入

还未添加个人简介

评论

发布
暂无评论
科学吃瓜!华为否认抄袭阿里,这次我站华为_华为_程序员晚枫_InfoQ写作社区