澜舟科技 AIGC 再进一步,推出澜舟论文助写 LPA,用 AI 帮助写好英文论文
继澜舟科技日前推出「熊猫小说家」小程序,用 AI 书写你的故事 之后,澜舟今日又基于其自研的强大的孟子轻量化模型技术推出帮助中国学生、老师、研究者撰写专业英文论文的神器:澜舟论文助写(Langboat Paper Assistant,简称 LPA),将 AIGC 的能力和应用推向一个新的技术高度。AI 文本生成技术除了可以脑洞大开帮你写小说,在严谨的论文助写方面也是表现非凡的。
论文写作:一项重要且具有挑战的任务
据报道,近 3 年来全世界每年平均发表 175 万篇自然科学学术论文,其中来自中国机构的论文数量超过 40 万篇/每年。随着中国国际影响力和科技能力的提升,中国机构的论文发表数量快速上升,以 AI 领域为例,自 2010 年以来,中国机构发表了超过 25 万篇 AI 论文,是美国发表 AI 论文数量的 4.5 倍,远远超过美国、印度、英国和德国的总和。(来源:2022 剑桥 AI 全景报告)
撰写论文,对每一位学生、教师和科研工作者来说都是必然要经历的。从立项、调研、试验、撰写论文、反复推敲、论文提交到最后被录用,成功发表一篇高质量论文,整个过程不仅锻炼了论文写作者的研究素质,也令人充满成就感。高水平的论文不仅仅意味着作者的成就,也丰富了自然、社会、科学的知识宝库。当然,不可免俗,发表高水平论文也确实关系到个人毕业、找工作、升职和今后远大的职业发展前途。
一篇高质量的论文,除了考验立项能力、实验能力之外,一个研究者的论文撰写能力也是极其重要的。论文的立意谋篇、遣词造句、开篇结尾、总结展望等各个方面都需要千锤百炼。
而很多时候,我们需要用英文撰写国际会议和期刊论文,由于英文非母语,中国研究者更是觉得困难重重。现在的办公系统所提供的拼写检查、语法检查等功能,仅是对你写出的句子和文章进行后编辑提供帮助。但是更多人的痛点是怎么把我脑海激荡的若干词组织成一个好的句子,既要全面准确地体现我的思想,还要用词把握精准,句子使用优雅得体,合乎行业规范。另外一个痛点是,写了一句话之后,不知道如何接下一句话。
每当看到写作高手的文章,看人家的用词之流畅、文笔之简洁、论证之合理、前后脉络之天衣无缝,不禁啧啧称赞,徒有羡慕的份。有心者拿小本子记下来,以后自己写论文时参考之。
彼时,我们就在想,能不能用 AI 做一个英文论文助手,可以辅助做以下的工作:
组句。你输入几个关键词,它会帮你组织成一个合理的句子,供你参考;
续写。你输入一句话,它会推荐你接下来怎么写,通过生成的句子给你推荐用词、句型和调子。
除了这两件事情,其他的什么拼写检查、语法检查、同义词替换、翻译等等,这些一般办公软件都有的功能,你原来习惯用什么可以接着用。
想用户所想,LPA 主要聚焦了用户的最痛点:
怎么组句;
怎么接着写。
作为第一步,这次发布的版本是面向 NLP 领域的 LPA。我们今后将陆续发布更多领域的 LPA,最终覆盖所有科技、人文领域。今后也将提供插件,方便作者在其熟悉的编辑环境里使用,敬请期待!
如何使用 LPA
LPA 的核心目标是帮助作者提供论文风格建议,以及基于 AI 生成写作例句供作者参考。作者基于 AI 生成的例句可以进行修改,最终形成自己的句子。
目前 LPA 仅提供了用于自然语言处理技术领域的英文论文助写。有两种助写功能:
基于用户提供的关键词生成完整句子;
根据前文,生成下一个句子,供作者参考。
关键词组句
第一步:先点击建议按钮,用户可以输入自己已经想好的内容,以关键词的形式进行输入。
第二步:点击 Recommend 按钮,澜舟论文助写工具会基于这些关键词并以顶会论文的风格进行建议和组织,帮助作者快速将已有想法转化成更规范的文字。
第三步:用户选择使用助写生成的内容或者再次生成,然后编辑使用。
续写推荐
第一步:用户直接撰写或者把写好的文章开头复制粘贴到编辑页面中,点击续写按钮或者快捷键续写。
第二步:LPA 工具会结合自然语言处理顶会论文的写作风格给出建议信息,用户来选择是否使用此段文字或者再次推荐,并且在此基础上编辑后使用。
写作的过程中,用户可以通过快捷键的方式快速与算法进行协同创作,大大提升了写作效率,
技术解析
LPA 产品的能力来自于澜舟科技孟子轻量化预训练模型技术体系。在技术实现上,以孟子预训练模型作为基础,并基于可控学习和续写学习方法构建了组句和续写推荐模型,主要采用了如下技术:
轻量化生成模型。针对基于生成式的例句推荐任务,为了加快模型推理速度,澜舟在孟子预训练模型的基础上,利用语言学知识和知识蒸馏的方法,获取更加轻量化的高性能生成模型,最终模型仅 10 亿规模参数。通过轻量化训练技术,加快模型推理速度、降低部署成本。
更加多样化的例句风格推荐效果。为了保证生成推荐例句风格的多样性,澜舟研发了轻量化微调的风格可控生成模型,插入不同参数对不同写作风格进行一定的区分学习,如摘要风格、引言风格、总结风格等,同时共享大部分模型参数,减少模型参数量。
基于关键词进行可控的例句推荐。基于可控文本生成技术,将关键词作为可控元素,训练模型生成体现关键词信息的例句。澜舟科技研发了可插拔的可控生成模型,分别构建可控元素编码模块和文本生成模块,以更好实现基于关键词的可控性,同时更好利用预训练模型的生成能力。
基于续写进行快捷的例句推荐。采用自回归结构的语言模型,基于前文训练模型预测下一个词,同时加入惩罚重复生成的训练目标,避免生成和前文相似的例句。
多任务联合学习。利用一个神经网络模型,将风格选择、关键词可控、续写等任务联合建模,通过多任务联合学习实现知识共享,同时进行一定的参数区分,从而可以保证各个任务的性能。
基于随机采样的解码方法生成多样化例句。采用自回归生成方式,模型逐词生成整个例句,在基于采样的解码方法中,每一个时刻从置信度较高的前 N 个词语中随机采样,得到当前词,因此,不同的上文会使模型预测出不同的下一个词语。具体地,当生成长度为 L 的句子时,会有 N 的 L 次方组合,通过随机性,可以使得模型每次生成的句子都不一样,从而避免了和已有例句的重复问题。
在论文助写这个垂直场景,通过可控学习,用户可以提供关键词引导模型推荐符合用户期望的例句,使得模型推荐内容更加贴近用户需求;通过多任务联合学习,最终可以通过一个模型实现可控推荐和续写推荐的能力,从而有效降低模型部署成本。
声明:LPA 提供的两个功能关键词组句和续写推荐均是利用孟子模型动态生成句子。注意它不是到一个论文库里面检索已有的发表文章的句子,因此不会存在抄袭问题。同时,不要指望 AI 帮你把一篇论文从头到尾臆造出来。LPA 系统生成的句子的目的仅仅是给作者推荐用词和句型,作者必须根据自己的思路对句子进行编辑修正以最佳地体现自己要表达的内容。
展望
澜舟科技自 2021 年开始孵化以来,一直从事 AIGC 的研发,开发了一套业界领先的可控文本生成技术。至今,澜舟科技完成了一系列的令人瞩目的创新。按照时间顺序,包括:
营销文案生成,用 AI 写出风格多样的营销文案。2021 年底通过与数说故事子公司容徽合作推出了 contentnote 智能文案;
网文创作助手,通过关键词生成句子、续写、渲染,可支持现代文和文言文。近日与中文在线合作,助力提升网络文学创作者的写作效率与体验;
熊猫小说家小程序,日前发布。借助 AI 写作,通过朋友圈接龙方式完成一个微小说,体现普通人写作的满足感,获得与朋友互动带来的乐趣;
本次发布的 LPA 则用 AIGC 技术帮助中国作者写好英文论文。
除了文本生成,我们正在开发基于孟子技术的新一代多模态预训练模型技术,改进目前的图片生成。澜舟将
通过文本生成和图片生成所构成的全面的 AIGC 能力体系,有力地支持广大用户从事图文并茂的创作。
图片生成 demo 链接:https://cognitive.langboat.com/product/text-image-generation
LPA 已经在澜舟科技的认知智能平台上线,用户注册后即可免费使用。目前仅支持自然语言处理方向,未来将扩展到全科技领域。
LPA 访问地址:https://acl.langboat.com/
目前产品仍处于公开测试阶段,我们欢迎大家加入我们的用户群及时反馈您的建议。
扫码加入用户群👇
结束语
根据教育部统计,2022 年中国高校毕业生数量首次突破 1000 万达到 1076 万;今年 8 月,有国外媒体发文称:在自然科学领域,中国机构发表的论文数量占全球数量比例为 23.4%,被引述最多的前 1%论文中,占比 27.2%,无论在数量还是质量上,均已成为世界第一。(来源:日本经济新闻社,NIKKEI)
中国正在快速从科研大国走向科研强国,在这个历史进程中,澜舟科技希望通过 LPA 为广大学生和科研人员提供帮助,提升他们的英文写作能力,帮助中国的科技成果走向世界,为国争光。
澜舟科技的愿景是成为新一代认知智能技术和产品的领导者。澜舟科技秉持用户至上、团队合作、创新进取、止于至善的价值观,用精湛的认知智能技术赋能社会、企业和个人。
未来,我们的 LPA 也将逐渐拓展到更多的人群和更多的语言,让全世界的用户都享受到澜舟 AIGC 的能力。
版权声明: 本文为 InfoQ 作者【澜舟孟子开源社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/cf7785657cc9dbb60238a8049】。文章转载请联系作者。
评论