写点什么

低代码和大模型:企业如何训练自己的内容审核平台?

  • 2024-06-11
    北京
  • 本文字数:3754 字

    阅读完需:约 12 分钟

引言

海量数据在网络中接连涌现,如何高效且准确地分析这些数据,确保媒体内容的合规性,已成为一个亟待解决的问题。

得益于人工智能技术的快速发展和深入应用,融合了大模型的低代码平台越来越多。低代码平台通过提供预构建的模块和可视化的开发环境,更好地理解技术实现的逻辑,能有效促进业务与技术之间的沟通协作,提高项目成功率。为了抓住大模型的新机遇,应对内容审核的挑战,很多企业正在训练自己专属的内容审核平台。

一、背景

1.低代码平台

低代码平台(Low-Code Platform)是一种基于图形化编程和可视化建模的应用开发平台。这种平台的核心理念是“少写代码”,通过提供一套易于使用的开发工具和环境,帮助开发人员快速构建应用程序。

对于企业而言,低代码平台彻底改变了传统的应用开发模式。它不仅可以更快地响应市场需求,支持与多种外部系统和服务的集成,使公司在竞争中保持优势;还能让非技术人员也参与开发,让业务人员直接构建和修改应用,提高团队协作效率,确保数据安全。

2.大语言模型

大语言模型(Large Language Model)是一种基于海量文本数据训练的深度学习模型,能够捕捉语言的复杂性和微妙之处,现在被很多企业视为未来发展的关键。

大语言模型正快速在各行各业中拓展应用范围,为人类提供更加智能化和个性化的服务。相较于传统语言模型,LLM 有更大的参数规模和更强的表示能力,支持多种语言处理和翻译,能更准确地理解语义、处理复杂句子结构和语言表达,有利于扩展业务场景、提升服务质量。

二、结合大模型构建一个低代码内容审核平台

低代码平台与大模型相结合,可以充分利用大模型的自然语言处理能力和低代码平台的快速开发优势,实现高效、准确的内容审核和管理,代表着企业在内容审核领域开启了智能化和高效化的重要一环。

企业如何结合大模型构建一个低代码内容审核平台?主要流程如下:

Step 1 需求分析和规划

1.明确业务需求:确定目标用户,同时分析用户需要审核的内容类型、审核标准、审核流程等;

2.技术可行性评估:设计主要功能模块,评估企业现有的技术资源是否支持大模型和低代码平台的集成。

Step 2 选择大模型和低代码平台

1.选择大模型:根据业务需求,选择功能匹配、延展性强的大模型;

2.选择低代码平台:选择一个稳定、易用、AI 能力强的低代码平台。

Step 3 搭建平台

1.接入数据:将需要审核的内容数据接入低代码平台,确保数据的准确性和安全性;

2.配置组件:利用低代码平台的可视化开发工具,设计用户界面和交互元素,配置工作流;

3.集成大模型能力:通过 API 或内置插件集成大模型功能,实现自动化和智能化的内容审核。

Step 4 测试和优化

1.功能测试:对平台的具体模块、集成效果进行全面测试,确保审核的响应准确性;

2.用户测试:邀请部分用户试用平台,测试系统的连贯性等细节,收集反馈并改进;

3.性能优化:根据测试结果和最新数据,对模型进行优化,提升审核速度和稳定性。

Step 5 部署和运维

1.部署到生产环境:准备好服务器、存储等基础设施,将平台正式上线;

2.日常运维:监控平台的运行状态,及时处理可能出现的问题;

3.系统升级:根据业务需求、政策变化和技术发展情况,定期更新系统功能和安全措施。


结合大模型构建一个低代码内容审核平台,能让企业缩短开发周期、降低技术门槛,提升系统的智能化水平,最终实现运营效率和业务能力的提升。

三、案例分析

随着网络教育培训的快速发展,内容质量和安全性成为企业核心竞争力的重要部分。可是传统的内容审核方式存在效率低下、误判率高等问题,因此,结合大模型构建低代码内容审核平台成为教育培训行业的当务之急。

1.需求分析

(1)内容识别准确:能准确判断暴力、违法等内容,且可以区分教育培训行业的专业术语和正常表达,避免误判。

(2)企业数据安全:提供严格的权限控制机制,防止用户上传的行业机密内容数据泄露或被非法获取。

(3)审核流程优化:能简化流程,利用大模型对课程内容和评论区进行初步筛选和判断,实现内容的自动分类和标签化,支持并发审核,提高整体审核效率。

(4)生成数据报告:记录并分析审核数据,包括审核时长、通过率、违规内容类型等信息,报告应清晰直观、可视化,便于了解审核情况、优化审核策略。

(5)界面易于操作:平台界面应简洁明了、易于操作,提供友好的错误提示和帮助文档,既可以降低用户的学习成本,又能快速解决使用过程中的问题。

(6)可定制和维护:具备良好的可扩展性,以便在根据变化的业务需求进行功能扩展和升级。此外,应提供清晰的代码结构和文档支持,便于开发人员进行维护和优化工作。

2.部署方案

以某大厂的内容审核为例,我们来看看常规情况下,企业怎么结合低代码和大模型来训练自己的内容审核平台

(1)API

a.创建应用

应用是调用 API 服务的基本操作单元,可以基于应用创建成功后获取的 API Key 及 Secret Key,进行接口调用操作,及相关配置。


填写完毕后,即可点击「立即创建」,完成应用的创建。点击左侧导航中的「应用列表」,可以进行应用查看:


创建完毕应用后,平台将会分配此应用的相关凭证,主要为 AppID、API Key、Secret Key。调用 API 接口时,可以使用这些凭证,进行 Access Token(用户身份验证和授权的凭证)的生成。


b.调用服务

调用 AI 服务相关的 API 接口有两种调用方式,两种不同的调用方式采用相同的接口 URL。区别在于请求方式鉴权方法不一样,请求参数和返回结果一致。

调用方式一 请求 URL 数据格式

向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用 POST)。百度 AI 开放平台使用 OAuth2.0 授权调用开放 API,调用 API 时必须在 URL 中带上 Access_token 参数。Access_token 是用户的访问令牌,承载了用户的身份、权限等信息。

grant_type: 必须参数,固定为client_credentials

client_id: 必须参数,应用的API Key

client_secret: 必须参数,应用的Secret Key

https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=Va5yQRHlA4Fq5eR3LT0vuXV4&client_secret=0rDSjzQ20XUj5itV6WRtznPQSzr5pVw2&
复制代码

获取 Access_token 有三种方式:通过代码的形式获取,使用网页调试工具获取,在线调试工具。具体可参考Access Token获取

POST 中参数按照 API 接口说明调用即可。

例如图像审核 API,使用 HTTPS POST 发送:

https://aip.baidubce.com/rest/2.0/solution/v1/img_censor/v2/user_defined?access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074
复制代码

调用方式二 请求头域内容

在请求的 HTTP 头域中包含以下信息,API 认证机制 authorization 必须通过百度云的AK/SK 生成:

  • host(必填)

    x-bce-date (必填)

    x-bce-request-id(选填)

    authorization(必填)

    content-type(必填)

    content-length(选填)

作为示例,以下是一个标准的图像审核的请求头域内容:

POST /rest/2.0/solution/v1/img_censor/v2/user_defined HTTP/1.1accept-encoding: gzip, deflatex-bce-date: 2015-03-24T13:02:00Zconnection: keep-aliveaccept: */*host: aip.baidubce.comx-bce-request-id: 73c4e74c-3101-4a00-bf44-fe246959c05econtent-type: application/x-www-form-urlencodedauthorization: bce-auth-v1/46bd9968a6194b4bbdf0341f2286ccce/2015-03-24T13:02:00Z/1800/host;x-bce-date/994014d96b0eb26578e039fa053a4f9003425da4bfedf33f4790882fb4c54903
复制代码

(2)私有化部署

内容审核私有化部署服务,将审核模型和审核平台部署至本地服务器或私有云环境,为企业提供高隐私性强实时性的内网审核服务,可供局域网内的设备进行调用,尤其适用于保密性强的业务场景。

a.申请私有化部署包

登录内容审核控制台,进入私有服务部署管理页面,发起申请。

b.业务沟通

提交私有化部署申请后,工作人员将在 3 个工作日内与企业取得联系,沟通业务需求,确认需求后将制作下发部署包。

c.安装部署

下载获取部署包之后,工作人员将协助企业在本地环境上安装部署及测试使用。

(3)方案优势

  • 数据隐私:满足无网、弱网、专网等多种网络需求,满足内部数据与公网隔离的私密性需求;

  • 能力全面:20+ 款模型部署包、 2 款 SaaS 平台(内容审核/人机审核),均可支持私有化部署,支持对图像、文本、音频、视频等媒体形式进行审核,满足不同业务场景的各类审核需求;

  • 性能强劲:具备高并发、高吞吐、低时延等能力,且算法卓越,识别速度业界领先,毫秒级响应,可应对各种实时性业务需求;

  • 效果领先:依托百度深厚的深度学习技术、以及海量数据积累,审核模型识别准确率高,效果行业领先;

  • 服务专业:首次部署可提供上门驻场服务及专家培训,正式购买后一年内提供免费维保服务和 1 对 1 答疑支持。

3.结果

接入上述内容审核平台的 API 后,某教培公司优化了内容审核流程,只需简单地描述输入即可完成配置,降低了技术难度和成本。同时,以大模型为底座,该公司的内容审核程序可以识别出行业专有名词,服务可用性高达 99.9%以上,可视化的审核报告简单易读,大幅提高了审核的效率和质量。

这样,不仅帮助某教培公司确保了数据内容的安全性和合规性,还提升了企业的品牌形象和竞争力,有利于扩展教育培训的业务范围。

四、未来展望

能快速响应市场需求、支持企业个性化定制、开发方式更灵活的内容审核平台,将会逐渐成为主流。未来的内容审核会快速向大模型和低代码迈进,提升教育培训等行业的竞争力,实现多方共赢。

发布于: 22 分钟前阅读数: 5
用户头像

还未添加个人签名 2024-04-30 加入

还未添加个人简介

评论

发布
暂无评论
低代码和大模型:企业如何训练自己的内容审核平台?_网络安全_爱AI的猫猫头_InfoQ写作社区