写点什么

合合信息亮相 WAIC 大会—推动 AI 鉴伪技术革新,打造可信数字世界【人工智能大会最新 AI 安全技术成果】

作者:申公豹
  • 2025-08-05
    辽宁
  • 本文字数:7158 字

    阅读完需:约 23 分钟

一、引言

相信很多程序员和我一样之前很少关注 AI 技术带来的安全问题,可能更多的是关注技术本身的创新和应用,尤其是在提高工作效率、提升智能化程度等方面的潜力。往往沉浸于技术如何改变生活、优化流程、推动行业发展的讨论中,而忽视了 AI 技术的另一面——伪造和篡改的风险。


好像从 GPT 问世以来,AI 技术的发展更加迅猛了,现在的这些大模型智能体,极大地降低了图像、视频等数字内容的生成门槛,为信息传播与内容创作带来了前所未有的便利。从早期的 PS 图像处理软件,到如今强大的生成式大模型,内容的伪造与篡改变得愈发简单且隐蔽。这些高度逼真的伪造内容正日益威胁着社交媒体生态的真实性,冲击金融系统的安全防线,甚至对公共安全构成严峻挑战。


面对这一全球性难题,合合信息在本次世界人工智能大会(WAIC)上惊艳亮相,展示其一系列前沿的 AI 鉴伪技术成果,下面的图片便是合合信息的展台。



从 PS 图像处理软件到大模型生成,AI 的进步使得图像和视频内容的创作变得越来越简便,同时也让篡改手段愈加隐蔽,形式更加多样化。2022 年,合合信息率先在行业内推出了 PS 篡改检测技术。在面对不断升级的 AI 安全威胁时,合合信息持续推动 AI 鉴伪技术的更新与迭代,成功实现了从静态图像到多模态数据鉴伪的技术飞跃。


在本次世界人工智能大会上,我有幸亲眼见证了一系列 AI 鉴伪技术,如人脸视频、AIGC 生成图像以及证件票据中的应用。该技术通过视觉特征分析、图像合理性评估以及多维度交叉验证,帮助公众深入了解 AI 如何精准识别并揭示多模态数据中隐形的伪造痕迹,为大模型的安全性和可信发展提供了有力的防护,下文就一起来看下我在本次大会上学习的 AI 安全的知识吧。

二、AI 鉴伪技术的核心挑战与发展趋势

人工智能在内容生成领域的飞速跃进,如同一把双刃剑,在赋能创作的同时,也极大提升了伪造技术的“段位”,为数字世界的真实性带来了前所未有的挑战。AI 伪造技术的持续升级构成了当前鉴伪领域的首要难题。伪造手段已从依赖传统图像处理软件(如 PS)的局部、显性篡改,全面演进至利用 AI 生成内容(AIGC)技术进行整体、高度逼真的伪造。


虽然现在对人工智能的图片有了文件规定,但是目前的现象依然屡禁不止。



无论是深度伪造(Deepfake)的人脸视频、以假乱真的 AIGC 生成图像,还是经过智能篡改的证件票据,其制作效率、规模化和隐蔽性都达到了新的高度。这种“道高一尺,魔高一丈”的态势,使得伪造内容在视觉上几乎难以被肉眼或传统方法识别,其潜在危害已渗透至社交信任、金融交易、法律证据乃至国家安全等关键领域。



面对日益狡猾和强大的伪造技术,AI 鉴伪技术的发展面临着严峻的核心挑战:如何在浩如烟海且不断进化的多模态数据中,精准、高效地识别出那些刻意隐藏的伪造痕迹?这要求鉴伪技术必须超越简单的表层分析,深入到内容的本质特征。


技术创新是保持领先优势的核心驱动力。作为 AI 安全领域的先行者,合合信息深刻理解技术对抗的紧迫性。自 2022 年率先推出行业领先的 PS 篡改检测技术以来,公司持续投入研发,积极拥抱大模型等前沿技术,不断推动其 AI 鉴伪技术的更新与迭代。这种持续的创新力,使得合合信息成功实现了从早期专注于静态图像篡改检测,到如今能够有效应对复杂多模态数据(如动态视频、AIGC 图像、结构化文档)伪造威胁的技术飞跃,始终保持在 AI 内容安全防护技术发展的前沿阵地。

三、合合信息人脸视频篡改检测技术解析

在数字伪造的诸多形式中,高度逼真的“换脸”(Face Swap)和完全由 AI 生成的人脸视频(如 Deepfake)因其极强的迷惑性和潜在的巨大危害,已成为 AI 安全领域的“头号公敌”之一。这些“数字假面”正被不法分子利用,进行身份冒充、金融欺诈乃至舆论操纵。比如下面 2 个案例,这种现象其实已经在生活中可以遇到了。




面对这一问题,合合信息凭借深厚的技术积累,推出了具备业界领先水平的人脸视频篡改检测技术,并在本次 WAIC 大会上通过生动的互动体验,向公众展示了其如何精准、高效地击穿这些量产的虚假面容。


3.1 直面挑战:从“完美复刻”到“毫秒级擒获”

今年 WAIC 合合信息的 AI 人脸视频鉴伪展台十分挺热闹,我们只需要扫个脸,系统就能迅速生成一个几乎一模一样的“数字面具”。当这张“假脸”和真实的脸一起对比时,肉眼真的很难分清真假。但一旦用合合信息的技术来检测,这些伪造的面具立马露馅。它不仅能快速识别出假脸,还能指出细节上的问题,比如光线不自然、生物特征有些不对,或者有些细节看起来不一致。这些小瑕疵一看就知道,它不是“真货”!


下面是合合信息的 AI 鉴伪机器的展示情况,我们可以感受到其强大的识别能力。



体验的过程非常简便而直观。首先,我们只需要通过摄像头录入任意一个简单动作,比如点头或左右摇头。这一动作可以是自然的身体语言,系统会实时捕捉并进行分析。整个录入过程非常流畅,用户无需做出过多复杂的操作,系统即可快速响应并进入下一步。



接下来,点击“开始变脸”按钮后,用户将看到两个可选的视频模板。通过这些模板,系统会根据用户刚才录入的动作生成不同的虚拟变脸效果。在这个阶段,我们可以选择一个自己喜欢的模板。每个模板会呈现出不同的风格和效果,让体验者可以看到 AI 技术如何精确地模拟出与自己动作相匹配的虚拟视频。



一旦我们选择了模板并生成了 AI 伪造的视频,系统会在极短的时间内完成分析。生成的视频效果非常真实,几乎难以分辨其真实性。在视频生成后,我们只需要选择一个视频,准备将其发送给 AI 鉴别系统进行进一步检测。




在点击“发送给 AI 鉴别”后,合合信息的 AI 人脸视频鉴伪技术便会开始对所选视频进行全面分析。系统利用强大的图像处理技术,迅速检测视频中的每一个细节。短短几秒钟内,就能够发现视频中的一些异常迹象。例如,系统识别到视频的光影效果不自然,纹理上出现了明显冲突,且视频中的五官呈现异常的变形。我们可以看到系统给出 81%的概率判定该视频为伪造视频。



通过这次的实际体验,我们可以清晰地看到合合信息的 AI 人脸视频鉴伪技术在操作上十分简便直观,让用户能够迅速进入 AI 生成视频的鉴别流程。无论是生成虚拟变脸视频,还是利用 AI 鉴伪机器进行深度分析,整个过程不仅高效,而且精准。短时间内,系统就能够精准地识别出伪造视频中的异常细节,比如光影不自然、纹理冲突以及五官不协调等问题。这些细节的检测帮助用户成功辨别出 AI 伪造的内容,为视频鉴别提供了强有力的技术支持。

3.2 多层次方案应对复杂伪造

合合信息技术团队指出,当前合成人脸的技术手段极其多样且快速迭代,传统检测方法在面对新型伪造算法时常常力不从心。为此,团队基于大规模、多样化的数据训练,构建了多层次、多维度的 AI 篡改检测方案:针对最常见的人脸图像交换(Face Swap)伪造,模型能够深入锚定人眼不可见的高级视觉差异。它并非停留在整体判断,而是为图像中的每一个像素点打上真伪概率标签,并精确计算伪造像素的占比,最终为整张图像或视频帧的“真伪概率”进行量化打分。这种精细化的分析极大提升了鉴别的准确性和可解释性。

3.3 应对规模化攻击的实战利器

技术的有效性必须与实用性结合。当前,制作一张“假脸”仅需数秒,诈骗团伙利用工具进行批量换脸攻击,试图以“量”取胜,寻找安全防御的薄弱环节。这种“病毒式”扩散的“数字假面”对检测速度提出了极高要求。



合合信息人脸鉴伪模型的核心优势之一,正是其毫秒级的实时检测能力。该技术能够对视频流进行高帧率、低延迟的实时分析,将检测耗时压缩到极致。这种极高的检测效率,结合其强大的泛化能力和高准确率,使其成为在真实业务场景下对抗规模化伪造攻击的关键防御屏障。

3.4 筑牢安全基石

传统的伪造检测方法通常只能判断一个面部图像是“真”还是“假”,或者简单地输出一个 mask,但它们往往无法解释为什么判定是假的。更进一步,这些方法依赖的单一监督信号(如真假标签)对于多种伪造手段的适应性较差,难以有效应对复杂的伪造技术。


为了解决这个问题,合合信息提出了一种基于 image-mask-caption 的多模态数据集,结合了图像、mask 和文本描述。


通过对多模态数据集的训练,可以微调大规模语言模型(MLLM)和分割模型,使其能够在检测伪造的同时,通过文本描述来辅助定位伪造的具体区域。这样,模型不仅能判断真假,还能明确解释伪造的具体原因,为检测结果提供了更丰富的上下文信息,提升了伪造检测的准确性与可解释性。


合合信息的人脸视频篡改检测技术并不是空想出来的,它在真实场景中表现得非常靠谱,特别是在那些需要高安全保障的金融场合。比如在银行远程开户、进行大额交易确认、线上贷款面签等重要环节,这项技术能够及时识别出伪造的人脸,防止骗子利用假脸进行欺诈。


四、合合信息 AIGC 图像鉴别技术辨别名画真伪

随着生成式大模型(如 MidJourney、Stable Diffusion、GPT-4o 等)能力的突飞猛进,AI 生成内容(AIGC)在图像创作领域展现出令人惊叹的潜力。然而,高度逼真、细节丰富的 AIGC 图像也如同精妙的“数字赝品”,悄然混入信息洪流,其潜在的滥用风险对内容真实性构成了新的维度挑战——传统肉眼观察或基于早期伪造特征的检测手段已难以应对这些“无中生有”却近乎完美的图像。

4.1 世界名画版大家来找茬

之前博主有用生成对抗网络尝试过识别 AIGC 的图片,但准确率不到 20%,苦于没有成型的解决方案最终放弃了。


在本次 WAIC 大会上,合合信息通过一场引人入胜的“世界名画版大家来找茬”互动,直观展示了其 AIGC 图像鉴别技术如何洞穿这些“完美伪作”的隐形破绽。


我们只需选择一幅经典名画图片,开始体验合合信息的 AI 鉴伪功能。此时,系统会根据所选的原名画生成一幅伪造图像,模拟艺术风格和视觉效果。



等待 AI 根据原名画生成伪造的图片。



生成伪造图片后,系统会展示两幅名画供用户选择。用户可以从中挑选一幅图像,提交给合合信息的 AIGC 图像模型进行进一步的鉴别。



如下图在提交后,合合信息的 AIGC 图像鉴别技术便开始对 AI 生成的图像进行分析。系统通过细致地评估图像的视觉特征、透视关系和光影角度等因素,判断其是否符合艺术创作的合理性。同时,技术还结合图像频谱信息,利用辅助模型进行更精确的鉴伪判断,最终实现毫秒级的快速鉴定。



这个名画 AI 鉴伪技术真的很酷!它通过分析图像的视觉特征、透视关系、光影角度等多个方面,能够快速又精准地识别伪造的艺术品。你只需要选一幅名画,系统就能在几毫秒内生成一个假画,并马上进行鉴定。通过这种深度分析,技术不仅能轻松辨别真假,还能通过图像的频谱信息进一步辅助判断。以往我们可能只能依靠专家的经验来鉴定艺术品的真伪,现在就不一样了,可以看出这项技术在艺术鉴定领域的巨大的发展潜力。


面对“完美赝品”,合合信息 AIGC 图像鉴别技术展现出了强大的“火眼金睛”。其核心在于超越肉眼观察的极限,利用先进的大模型技术深入分析图像中人眼无法直接感知的深层信息。


1.多层级 Prompt 特征分析与合理性校验技术不仅仅停留在识别明显的视觉特征,更能通过设计不同角度和深度的分析指令(Prompt),深入解析图像。这包括:


  • 视觉特征深度挖掘: 分析图像纹理、边缘一致性、物体结构等底层视觉模式,寻找 AI 生成特有的“指纹”。

  • 物理与几何合理性判断: 严格校验图像的透视关系、光影角度、物体比例是否符合物理世界规律。例如,检查光源方向是否统一、阴影投射是否合理、物体间空间关系是否自洽。


2.频谱信息深度洞察技术充分利用图像的频域信息(如傅里叶频谱)。AI 生成的图像在频谱分布上往往存在特定的、与自然拍摄图像不同的统计模式,这些模式是人眼无法直接看到的“数字胎记”。



3.毫秒级精准鉴定结合上述多维度分析,合合信息的技术能够在毫秒级别内完成对图像的鉴别,高效应对海量信息的处理需求。经测试,该技术对包括 MidJourney、Stable Diffusion、StyleGAN、GPT-4o 等主流大模型生成的图像具有出色的识别能力,在特定样本集上的鉴定准确率超过 90%。

4.2 应用广泛:守护多元场景的真实性

图像内容安全技术的应用场景非常广泛,涵盖了保险、金融、电商、互联网、社交媒体、教育、医疗、政务等多个领域。在这些行业中,伪造图像的出现常常带来严重的安全隐患,导致欺诈行为屡见不鲜。引入伪造图像检测技术后,可以有效识别和防止这些虚假内容的流通,从而大大减少欺诈事件的发生。


无论是在金融领域对大额交易的身份验证,还是在电商平台防止虚假商品展示,亦或是在社交媒体上识别恶意篡改的图像,伪造图像检测技术都能发挥重要作用。它能够显著提升欺诈检测的效率与准确性,为各行各业提供更为安全、可靠的技术保障,推动各行业朝着更加透明和可信的方向发展。



合合信息 AIGC 图像鉴别技术凭借其广谱鉴别能力、高精度、高速度以及卓越的鲁棒性,为多个关键领域的真实性保驾护航。

五、全能防伪:TextIn 通用篡改检测平台守护数字化时代文档安全

在数字化浪潮席卷全球的今天,纸质文档正加速向电子形态迁移。然而,作为信息传递最广泛载体的文档图像(如证件、合同、发票、财务凭证、机打小票),却也因其易于编辑的特性,成为了最常被篡改的电子媒介之一。


借助简单易得的编辑工具(如 PS),不法分子可轻松伪造关键信息,进行身份冒用、合同欺诈、票据造假等非法活动。这不仅给公民个人带来财产损失、隐私泄露的巨大风险,更对企业构成了长期性、系统性的安全威胁,侵蚀着数字经济赖以生存的信任根基。面对文档篡改这一泛场景、高频发的安全挑战,合合信息推出了其核心技术载体之一——TextIn 通用篡改检测平台,致力于为数字化时代的文档安全提供“全能守护”。

5.1. 展区透视:文档篡改威胁的直观冲击与普遍性

在 WAIC 合合信息展区,TextIn 通用篡改检测平台的互动演示为观众带来了一场关于文档安全的“震撼教育”。参与者可以亲眼目睹,一份看似普通的身份证、发票或合同图像,如何在几秒钟内被数字工具轻易篡改关键信息(如姓名、身份证号、金额、日期或条款)。更令人警醒的是,这些经过精心伪造的文档,仅凭肉眼观察往往难以察觉破绽。


例如,下图所示的短信截图,在经过 TextIn 通用篡改检测平台的分析后,系统能够精准地识别出截图中的链接和时间已被恶意篡改和伪造。



在小票的案例中,平台同样能够精确检测出票号和剩余积分被篡改的痕迹,揭示出其伪造的真相。



随着诈骗案件的频繁发生,身份证照片也常常成为诈骗分子非法篡改的目标,以此骗取财务。在下图中,TextIn 通用篡改检测平台能够迅速分析并揭示身份证的虚假性,准确识别出姓名、籍贯、照片和身份证号均为伪造信息,确保用户不被诈骗。



这种直观的体验,生动揭示了文档篡改门槛之低、隐蔽性之高、危害之大。它并非孤立的个案风险,而是广泛存在于:个人生活、企业经营、社会运行等待场景中。展台的互动体验区清晰地传递出一个信息。在数字世界中,文档篡改的威胁无处不在,亟需高效、智能的技术手段进行识别与防御。

5.2 深度神经网络的泛化力量

TextIn 通用篡改检测平台是合合信息 AI 鉴伪技术在文档安全领域的集大成者,其强大能力源于自研的深度神经网络技术和海量、多样化的数据训练基础。平台的技术突破依托于百万级真实篡改与真实文档样本的训练,赋予了它强大的泛化检测能力,使其能够在各种复杂环境下保持高效、精准的表现。


1.强大的泛化检测能力平台的核心突破在于其“通用性”。与传统的单一文档类型检测方案不同,TextIn 平台能够有效支持数十种常用文档的篡改检测,覆盖范围极其广泛。无论是财务凭证、商业票据,还是身份证明文件和合同协议,平台都能精准识别篡改痕迹。具体包括:


  • 财务凭证:如发票、收据、银行流水、对账单等常见财务文档。

  • 商业票据:如商场机打小票、提货单、物流运单等。

  • 身份证明文件:如身份证、护照、驾驶证、行驶证、港澳台通行证及居住证等。

  • 合同协议:包括合同中的关键条款、签名、印章区域等。


2.精准的篡改定位 TextIn 平台不仅能够判断文档的真伪,更具备精准的篡改定位能力。平台通过深度学习和图像处理技术,能够精确地定位篡改发生的具体区域,例如被修改的数字、替换的图片,甚至是 PS 过的印章或签名。每一处篡改都会以可视化的方式标记出来,确保用户能够直观地查看到文档中篡改的痕迹。例如,在身份证篡改的检测中,平台能清晰标示出修改过的区域,为后续审核和取证提供了明确、直观的依据。


3.毫秒级极速响应在面临企业级海量文档的审核需求时,检测速度至关重要,尤其是在银行、保险等行业,海量文档需要及时处理。TextIn 平台依托高效的算法架构,能够在毫秒级时间内完成单次文档的鉴定,满足高并发、实时性的业务场景需求。这使得平台能够在保证检测精度的同时,极大提升处理效率,确保业务流程的流畅性。


4.工业级可靠精度 TextIn 平台在适配真实业务场景时,经过严格测试,已将误检率(False Positive Rate)控制到一个极低的水平,最低可达千分之一。这种高精度的鉴定能力,不仅能够确保拦截篡改文档,还能最大限度地减少对正常文档的干扰,保障用户体验和业务效率。平台的工业级可靠精度使其能够在实际应用中提供稳定的服务,确保文档安全、减少人工干预,并提升整体业务处理速度。


六、心得

参加 WAIC 大会,亲身体验了合合信息推出的 AI 鉴伪技术后,给我留下了深刻的震撼印象。尤其是在面对目前 AI 伪造技术的快速发展和日益复杂的伪造形式时,合合信息的创新性技术显得尤为重要。



通过现场的互动体验,我亲身感受到了 AI 技术如何以毫秒级的速度识别伪造内容以及合合信息将 AI 鉴伪技术应用于多模态数据的全面防护能力。从静态图像到动态视频,从简单文档到复杂的生成图像,合合信息的技术打破了传统检测方法的局限,凭借深度神经网络技术,成功应对了新型伪造手段的挑战。尤其是在金融、法律等高安全性行业中的应用,展现出其巨大的实用价值。


通过这次 WAIC 大会,让我对 AI 技术的“攻防”模式有了更为直观的理解。本人在大学期间也是专攻安全方向,通过本次的大会内容,让我看到了安全问题在 AI 领域也是很重要的。


作为 AI 安全的先行者,合合信息不仅在技术研发上不断创新,也在实际应用中展现出强大的生命力!感兴趣的程序员们可以体验一下。

发布于: 13 小时前阅读数: 3
用户头像

申公豹

关注

🏆2022年InfoQ写作平台-签约作者 🏆 2023-06-05 加入

还未添加个人简介

评论

发布
暂无评论
合合信息亮相WAIC大会—推动AI鉴伪技术革新,打造可信数字世界【人工智能大会最新AI安全技术成果】_人工智能_申公豹_InfoQ写作社区