写点什么

两会代表热议采用 ChatGPT 指导论文写作:防范抄袭的探索与思考

作者:蓝海大脑GPU
  • 2023-03-16
    北京
  • 本文字数:6418 字

    阅读完需:约 21 分钟

两会代表热议采用ChatGPT指导论文写作:防范抄袭的探索与思考
小logo.png

人工智能 | AGI | AIGC

深度学习 | API | GPT-4


随着深度学习、高性能计算、数据分析、数据挖掘、LLM、PPO、NLP 等技术的快速发展,ChatGPT 得到快速发展。ChatGPT 之所以引起关注,在于它作为一个大模型,有效结合了大数据、大算力、强算法。


在最近的两会上,众多代表都参与到关于 ChatGPT、关于人工智能的讨论中,纷纷建言献策,表达对于这一颠覆性创新的关注。此外,政府工作报告中首次以“大力发展”来表述数字经济,人工智能、元宇宙等作为数字经济的重要组成部分,或将迎来崭新的发展局面。政府工作报告指出,2023 年要大力发展数字经济,加快传统产业和中小企业数字化转型,着力提升高端化、智能化、绿色化水平,提升常态化监管水平,支持平台经济发展。



如何推进智能大模型建设


今年的两会建议、提案中,ChatGPT、人形机器人、自动驾驶等关乎未来科技发展方向的词汇高频出现。根据科技部数据,有 6 名代表和 287 名委员提出关于“加强基础研究”的建议,有 60 件以上的提案、建议与科技人才相关。另外,多位网络安全、工业制造领域代表委员也提出关于保护数据安全、数字经济发展等核心关键性建议。


同时,周鸿祎提出应设立多个国家级人工智能大模型的长期开源项目,打造开源众包的开放创新生态,针对多条技术路线以开源模式设立多个国家级长期项目,以大型科技企业+重点科研机构为龙头,引导高校、科研机构和创新型企业形成多个技术路线的创新生态群。



加快推进我国认知智能大模型建设,让每个人拥有 AI 助手。为此,刘庆峰提出六点针对性建议:


一、建议重视认知智能大模型研发,形成以领军企业为主体产学研合作的创新体系,加速跟进和追赶国际前沿水平。


二、支持认知智能大模型技术的行业示范应用,推动认知智能大模型在教育、医疗、办公、人机交互和 AIGC 领域的价值落地。


三、进一步加大支持人工智能国产软硬件技术底座,让大模型建设和运行在国产化的存储、算力、操作系统等基础平台上,中国认知智能大模型只有在国产技术底座上发展才能有自主可控的大未来。


四、建设认知智能大模型公共算力平台,设立使用平台的揭榜挂帅机制,让更多科研院所和科技创业企业也有机会站到国家公共算力平台上进行模型训练和算法创新。



五、构建国家数据资源平台,汇聚认知智能大模型所需要的基础性数据,在依法合规基础上搭建数据共建共享机制,支持战略科技力量站在国家数据资源的平台上加速认知大模型的研发和产业化;


六、鼓励产业基金参照 OpenAI 和微软等股东的投资协议模式,积极探索更有利于创业团队和核心技术骨干为梦想长期奋斗的股权投资协议模式,构建更好的科技创投生态和创新创业环境。


GPT-4 催化更多

应用场景落地


ChatGPT 是 OpenAI 于 2022 年 11 月 30 日推出的对话式 AI 模型,是其 GPT 系列的全新力作,功能更全面更类人,应用空间潜力更广泛。从技术上讲,ChatGPT 的推出意味着基于语言的 AI 底层技术 NLP 取得了重大进展,并激发了 AI 的其他领域实现更高效的 Transformer 并产生更像人类的 RLHF 算法。在应用方面,GPT 升级助推 AIGC 发展。到 2025 年 AIGC 渗透率有望提升至 10%,到 2030 年市场规模或突破万亿。 


算法、数据和算力是 AI 大模型训练的基础。推荐关注基础设施相关标的:科大讯飞、海天瑞声、TLS 等。ChatGPT 的推出,推动了基于文本类的 AI 向文本生产、智能批阅等应用领域的渗透。同时,其训练模式的改进对整个 AIGC 的发展具有广泛的意义。推荐关注相关领域布局:微软、Meta、百度、阅文集团、中文在线、粉笔等。


一、ChatGPT:突破式的 GPT 系列新作,技术更好,应用更广


ChatGPT 是一种对话式 AI 模型,可根据用户输入的文本自动生成回复内容。2022 年 11 月 30 日,OpenAI 发布了一种新的对话式 AI 模型 ChatGPT。该模型简单易用,只需索要 ChatGPT 文本即可完成回答问题、编写代码和生成文本等指令。


ChatGPT 的功能包括:交互、基于交互的文本/代码生成、信息检索等。在实际应用中,ChatGPT 等文本 AI 可以帮助字幕行业完成智能内容创作,一定程度上替代搜索引擎。



ChatGPT 使用示意

ChatGPT 是 GPT-3 和 GPT-4 之间的过渡版本。GPT 即 Generative Pre-trained Transformer,是解决 NLP(自然语言处理)任务的训练模型之一。训练好的模型基于 Transformer 架构(具有自注意力机制,可以捕捉句子中的上下文关系),可以根据给定的文本预测下一个单词的概率分布,从而产生人类可以使用的自然语言。ChatGPT 从 GPT-3.5 模型微调而来。Chat 强调其为了对话进行了优化,具有记忆能力,可以完成连续性对话。从 GPT-1 到 ChatGPT,使用更精密的训练模型和更海量的训练数据,其功能越来越全面,性能越来越接近人类。



ChatGPT 受到了前所未有的关注。2022 年 12 月 5 日,ChatGPT 用户数仅上线 5 天就突破 100 万,而 GPT-3 达到这一用户规模用了将近 24 个月。ChatGPT 应用广泛,潜在市场规模相当大。以过往版本 GPT-3 为例,截至 2021 年 3 月,上线 9 个月的 GPT-3 已经拥有 300+应用客户,涵盖智能客服、教育与科研、游戏、搜索引擎等。由于更好的性能和更高的关注度,ChatGPT 及其背后的 GPT-3.5 的应用空间有望比 GPT-3 更广阔。


二、ChatGPT 应用示例


1、Viable:帮助公司分析客户反馈

借助 GPT-3,Viable 将大量非结构化数据转换为可读的自然语言报告,包括客户投诉、表扬、请求和问题。GPT-3 将 Viable 总结客户反馈的准确性从 66% 提高到 90%,从而为公司产品决策提供信息。



2、Elicit:人工智能研究助理

Elicit 从大量研究论文中找到与研究问题最相关的摘要,然后应用 GPT-3 总结论文关于该问题的主张。GPT-3 使结果更易于理解(改进 24%)、更准确(改进 17%)和整体更好(改进 33%)。



3、Fable Studio:VR 游戏工作室

在 VR 游戏《墙中狼》中,Fable Studio 借助 GPT-3 打造了虚拟伴侣角色 Lucy,可以实现与人们自然对话,加深玩家与游戏角色之间的情感纽带。



4、Algolia:搜索引擎

Algolia 将 GPT-3 与其先进的搜索技术相结合,帮助出版商和客户以自然语言查询问题的答案。在对 210 万篇新闻文章测试 GPT-3 后,Algolia 以 91% 或更高的准确率准确回答了问题。



三、ChatGPT 仍有改进空间


目前,有时会生成不正确或无意义的信息;可能会有违反伦理道德的回答;由于其训练数据库仅基于 2021 年(并非基于实时数据),因此答案可能已过时等。


1、ChatGPT 的不足之处


1)缺乏人类的情感和判断力

尽管 ChatGPT 理解自然语言和提供一些基本的响应,但缺乏人类的情感和判断力。不能像人类一样感受到情感或理解文化差异,也不能像人类一样透彻地理解复杂的人际关系。



2)数据偏差

ChatGPT 通过大量的文本数据进行训练的,这意味着回答有可能受到训练数据的偏见和缺陷的影响。如果数据集本身存在问题或有限,那么回答也可能会受到限制。



3)知识更新的滞后性

ChatGPT 是在 2021 年训练的,所以知识库可能滞后于当前时事和最新的研究成果。


2、预计 GPT-4 效果更优、成本更低,催化更多应用场景落地


生成式预训练模型 GPT-4 预计将于 2022 年 12 月至 2023 年 2 月发布。GPT-4 相比于当前的文本模型会有大幅改进:


1)规模提升

训练数据量、token 数、模型参数量均有所提升,从而优化模型性能。



2)图灵测试

此前一些 AI 模型仅部分能力通过图灵测试,而 GPT-4 有望完全通过图灵测试。



3)成本下降

通常模型训练成本随着模型规模提升而提升,但 GPT-4 的训练成本或显著低于 GPT-3,控制在 100 万美元的范围内,从而降低 AI 技术的使用门槛。 



4)GPT-4 的推出对商业应用的潜在影响

  • 模型能够生成更有“温度”的文字,对应 AI 客服、AI 心理咨询、营销文本等场景;

  • 模型能够生成更加“专业”的文字,对应金融、医学、新闻、工业等垂直行业应用。


四、OpenAI:ChatGPT 的源头公司


在 AGI(通用人工智能)愿景的驱动下,OpenAI 的 AI 能力全面。OpenAI 当前模型几乎涉及所有需要解决自然语言/代码的理 解/生成任务的领域,其 API(Application Programming Interface,应用程序编程接口,编程人员可以通过 API 调用相关代码,而无需掌握代码本身)包括文本、代码、图像等五大类,可以用于完成自然语言问答、聊天、Python/SQL 代码标注 /修改、食谱创作等具体任务。



OpenAI 当前 API 主要应用领域


ChatGPT

国内外发展状况


一、谷歌:面对 ChatGPT 构成的威胁,注资 3 亿美元投资竞品 Anthropic


ChatGPT 发布后,谷歌 CEO 在公司内部发布了“红色警报”,敦促团队解决 ChatGPT 对公司搜索引擎业务构成的威胁,同时批准了将 AI 聊天机器人加入谷歌搜索引擎的计划。2 月 4 日,谷歌向竞争对手 ChatGPT 产品 Anthropic 注资 3 亿美元,谷歌将获得约 10%的股权。


Anthropic 开发了一款名为 Claude 的智能聊天机器人,据称可与 ChatGPT 相媲美(仍未发布)Anthropic 和 Open AI 渊源颇深,其联合创始人曾担任 OpenAI 研究副总裁。



聊天机器人 Claude 据称可与 ChatGPT 相媲美


二、微软:OpenAI 的最大投资方,开始利用 ChatGPT 提高产品竞争力


微软将 ChatGPT 视为新一代技术革命,正在将 ChatGPT 集成到其 Bing 搜索引擎、Office 全家桶、Azure 云服务、Teams 程序等产品中。微软近期宣布推出视频会议及远程协作平台的高级付费版 Microsoft Teams Premium,订阅者可享用 OpenAI GPT 提供支持的大型语言模型技术,用 AI 自动生成会议笔记,此举或对 Zoom、谷歌会议等平台形成巨大冲击。



集成了 ChatGPT 的新版 Bing 曾短暂上线,搜索框类似一个聊天框


三、亚马逊:ChatGPT 受到重点关注,已广泛运用在各种工作职能中


ChatGPT 已被亚马逊用于各种不同的工作职能,包括回答面试问题、编写软件代码和创建培训文档等。Slack 的公司员工表示,亚马逊 Amazon Web Services(AWS)的云部门已经成立了一个小型工作组,以更好地了解人工智能对其业务的影响。



四、美国新媒体巨头 Buzzfeed 踩准 ChatGPT 风口,两天内股价飙升 3 倍


1 月 29 日,美国新媒体巨头 Buzzfeed 宣布计划使用 ChatGPT 帮助内容创作。其股价一夜之间上涨近 120%,两天内上涨超过 300%。成交量超过 4.38 亿股(其月均成交量不足 2500 万股)。消息公布后,同类公司股票成交量也创历史新高:C3.AI 本月成交量突破 7200 万股,为去年 6 月以来最高;语音 AI 软件公司 SoundHound AI 成交量约 6450 万股,接近月均值的三倍。



Buzzfeed 宣布计划采用 ChatGPT 协助内容创作后,股票成交量暴涨


五、Stability AI:Stable Diffusion 大热, Open AI 在图片生成 AI 大有可为


Stability AI 与 Open AI 有着相同的创业理念:打造开源 AI 项目,推动 AI 发展,其成功证明 Open AI 图片生成领域同样大有可为。该公司的开源模型 Stable Diffusion 可以根据文字生成图像,只需几秒钟即可生成高分辨率、高清图像,而且不失真实性和艺术性。



Stability AI 有着与 Open AI 相同的创业理念,其成功证明 Open AI 在图片生成领域同样大有可为


六、Jasper:采用同类底层技术,进一步证明 ChatGPT 的巨大商业潜力


Jasper 的自动化文案平台,其底层技术为 OpenAI GPT-3,成立仅 18 个月就达到了 15 亿美元的高估值。IBM、Autodesk 等巨头都是 Jasper 的付费用户,这足以证明 ChatGPT 底层技术具有巨大的商业潜力。ChatGPT 出现后,其技术领先性和受欢迎程度对 Jasper 产生了强烈的影响。



相比 ChatGPT 的免费开源,Jasper 需要付费使用


七、国内厂商(百度 &腾讯):高度关注 ChatGPT,积极探索前沿技术


1、百度

1 月 10 日,百度宣布将升级百度搜索的“生成式搜索”能力,以智能回答用户的搜索查询;2 月 7 日,百度宣布将于 3 月完成旗下 ChatGPT 产品的内测并对外开放项目名称为文心一言(ERNIE Bot)百度表明生成 AI 与搜索引擎相辅相成。据路透社报道,百度计划在 3 月份推出类似于 ChatGPT 的服务对话 AI 作为独立应用 ,之后再逐步进入搜索引擎中。



百度研发的 ChatGPT 产品“文心一言”将于 3 月份问世


2、腾讯

2 月 3 日,腾讯公布一项人机对话专利,能够实现机器与用户之间自然且顺畅的沟通。



腾讯发布相关专利,积极涉足 ChatGPT 领域


人工智能不仅需要巨大的投资,更需要庞大的用户数据基础,只有互联网巨头才有能力做出伟大的产品。国外是微软、谷歌、亚马逊,国内互联网巨头如百度、腾讯潜力最大;与国外巨头相比,国内巨头投入大量资金和人力成本来快速发展人工智能技术。


ChatGPT 与教育的关系


作为一个智能对话模型,ChatGPT 可以为学生、教师、家长等提供教育相关的帮助和服务。以下是 ChatGPT 与教育的关系的一些例子:


一、答疑解惑

ChatGPT 可以回答学生们的问题,例如数学、历史、文学等各种学科。学生可以通过与 ChatGPT 的对话,获得即时的解答和理解。


二、学习辅导

ChatGPT 可以为学生们提供学习辅导和支持,帮助他们克服学习难点。例如,ChatGPT 可以向学生们提供阅读理解或者作文方面的指导和建议。


三、语言学习

ChatGPT 可以为学习外语的人们提供语言学习辅助。学生可以通过与 ChatGPT 的对话,提高听、说、读、写等方面的语言能力。


四、教学辅助

ChatGPT 可以为教师们提供教学辅助,例如教学资料、试卷题目、教学方法等。教师们可以通过与 ChatGPT 的对话,获得更多的教学资源和灵感。


五、个性化教育

ChatGPT 可以根据不同学生的需求和学习习惯,提供个性化的教育服务。例如,ChatGPT 可以向学生们推荐适合他们的学习资源和课程内容,帮助他们更好地掌握知识和技能。


总的来说,ChatGPT 作为一个智能对话模型,可以为学生、教师、家长等提供教育方面的帮助和支持,帮助他们更好地学习和教学。


怎么看待 ChatGPT

帮助大学生写论文


作为一个自然语言处理模型,ChatGPT 可以作为高校大学生写论文的一个有用工具。在论文写作过程中,ChatGPT 可以为学生提供多种帮助,包括以下几个方面:


一、理清思路

在论文写作的过程中,学生有时候会遇到思路不清、难以展开的情况。ChatGPT 可以帮助学生迅速生成一些相关内容,帮助学生更好地理清思路,拓展论文思路。


二、补充资料

在写论文时,学生可能会遇到需要引用某些资料或者补充相关背景的情况。ChatGPT 可以根据学生提供的关键词或者问题,迅速生成相关内容,帮助学生更好地丰富自己的论文。


三、语言表达

论文的语言表达是非常重要的一部分,好的语言表达能够让论文更加生动、易读、易懂。ChatGPT 可以帮助学生优化语言表达,提供更好的句式和表达方式。


需要注意的是,ChatGPT 虽然可以提供一定的帮助,但并不能完全代替学生自己的思考和劳动。在使用 ChatGPT 的过程中,学生需要对生成的内容进行筛选和修改,确保其符合论文的要求和自己的思路。


总之,ChatGPT 可以为高校大学生写论文提供帮助,但是需要注意使用的方式和方法,保证论文的质量和原创性。


总结


近年来,学术界抄袭问题时有发生,严重影响了学术研究的质量和学术诚信。因此,在两会代表的热议中,有不少代表提出了关于防范抄袭的探索与思考的议题。本文将探讨如何利用 ChatGPT 指导论文写作,以及如何通过这种方式防范抄袭。


ChatGPT 是一种基于自然语言处理技术的人工智能模型。它可以理解人类语言的规则和语法,并生成符合语言规范的文本。在论文写作过程中,ChatGPT 可以作为一种强有力的工具,帮助作者避免抄袭。


一、ChatGPT 可以作为一个参考工具,帮助作者查找和了解相关的研究文献和领域知识。作者可以输入一些关键词或问题,让 ChatGPT 自动生成相关的论文或答案,以此来拓宽自己的研究视野。通过这种方式,作者可以更好地了解自己的研究方向,并更好地定位自己的研究问题。


二、ChatGPT 还可以帮助作者生成论文草稿。在撰写论文时,作者可以将自己的思路和想法输入到 ChatGPT 中,让它自动生成一些段落或句子。这些生成的段落或句子可以作为作者论文草稿的基础,帮助作者更好地组织自己的论文结构和内容。同时,由于这些段落或句子是由 ChatGPT 生成的,因此作者可以更好地避免抄袭的风险。


三、ChatGPT 可以帮助作者检查论文的抄袭情况。在完成论文之后,作者可以将自己的论文与相关文献或其他来源进行比对,以确保自己的论文没有抄袭。ChatGPT 可以帮助作者快速地检测论文中是否存在重复或抄袭的内容。如果 ChatGPT 检测到了抄袭情况,作者可以及时修改和完善自己的论文,以避免不必要的风险和损失。


总的来说,ChatGPT 可以作为一种有力的工具,帮助作者防范抄袭。通过 ChatGPT,作者可以更好地了解相关研究文献和领域知识,更好地组织论文结构和内容,更好地检查论文的抄袭情况。当然,ChatGPT 并不能完全取代作者自己的思考。

用户头像

还未添加个人签名 2021-11-25 加入

深度学习GPU液冷服务器,大数据一体机,图数据库一体机

评论

发布
暂无评论
两会代表热议采用ChatGPT指导论文写作:防范抄袭的探索与思考_人工智能_蓝海大脑GPU_InfoQ写作社区