【论文速读】| 对大语言模型解决攻击性安全挑战的实证评估

2024-03-27
北京
本文字数：1977 字
阅读完需：约 6 分钟

本次分享论文为：An Empirical Evaluation of LLMs for Solving Offensive Security Challenges

基本信息

原文作者：Minghao Shao, Boyuan Chen, Sofija Jancheska, Brendan Dolan-Gavitt, Siddharth Garg, Ramesh Karri, Muhammad Shafique

作者单位：纽约大学、纽约大学阿布扎比分校

关键词：大语言模型，网络安全，攻击性挑战，CTF 竞赛

原文链接：

https://arxiv.org/pdf/2402.11814v1.pdf

开源代码：

https://github.com/NickNameInvalid/LLM_CTF

论文要点

论文简介：随着大语言模型（LLMs）技术的日益兴起，它们在理解和解决 CTF（Capture The Flag）挑战方面的应用也逐渐增多。然而，尚未有研究对 LLMs 在完全自动化流程中解决 CTF 挑战的有效性进行全面评估。为此，本研究旨在探索 LLMs 在该领域的应用潜力，并设计了两种 CTF 解题流程：人机交互式（HITL）和完全自动化。这两种流程的目的是评估 LLMs 在处理一系列特定 CTF 挑战时的性能，这些挑战通过提供相关问题信息来激发模型的解题过程。通过与人类参赛者在相同挑战上的表现进行对比，研究者观察到 LLMs 的解题成功率已超过普通人类参赛者。本研究全面评价了 LLMs 在解决现实世界中的 CTF 挑战能力，并覆盖了从实际竞赛到完全自动化流程的各个阶段。研究成果不仅支持了 LLMs 在网络安全教育中的应用，同时也为系统性评估 LLMs 在网络安全攻击能力方面的潜力提供了新的研究路径。

研究背景：CTF 挑战赛是网络安全领域一种广受欢迎的竞赛形式，涉及密码学、逆向工程、网络利用等多个领域。随着 LLMs 的出现和进步，研究人员开始探索并解决在此类挑战中的潜力。

研究贡献：

1.评估了六种不同 LLMs 在解决 26 个多样化 CTF 问题上的熟练程度。

2.构建了使用 LLMs 解决 CTF 问题的两种工作流程，并展示了它们的成功率。

3.对 LLMs 在处理 CTF 挑战时遇到的典型短板进行了全面分析，揭示了完全依赖 LLMs 而不进行人类干预的局限性。

引言

近年来，大语言模型（LLMs），已在自然语言处理、编程任务和对话生成等多个领域展现出卓越的性能。本研究旨在探索 LLMs 在网络安全领域，特别是在解决 CTF（Capture The Flag）挑战方面的应用潜力。为此，研究团队在纽约大学举办的 CSAW 竞赛中特别引入了 LLM 攻击挑战。在此过程中，团队收集了参与者利用 LLMs 提供的“提示”来解决一系列 CTF 挑战的相关数据，并在此基础上进行了详尽的分析。通过这项研究，研究者期望能够更深入地理解 LLMs 在网络安全实战中的应用价值和效果。

背景知识

CTF 挑战赛是一种模拟真实世界中的安全漏洞和攻击场景的竞赛。在这类竞赛中，参与者需运用其网络安全知识和技能来识别漏洞、编写利用代码，并最终实现“夺旗”目标。随着大语言模型（LLMs）技术的兴起，研究团队着手研究这些模型是否具备理解和解决这些高度专业化挑战的能力。通过这一探索，旨在评估 LLMs 在网络安全领域的实际应用潜力。

论文方法

理论背景：在探究不同大语言模型（LLMs）在解决 CTF 挑战方面的潜力时，研究者选用了包括 GPT-3.5、GPT-4、Claude、Bard、DeepSeek Coder 和 Mixtral 在内的六种模型。特别地，在涉及人类参与者的研究中，ChatGPT 因其卓越的性能而成为最受青睐的选择。研究成果主要体现在三个方面：首先，通过定量和定性分析，评估了这些模型解决 26 个不同 CTF 问题的能力，发现 ChatGPT 的表现与一般人类 CTF 团队持平；其次，开发并测试了两种基于 LLMs 的 CTF 问题解决流程，并报告了它们的成功比率；最后，深入分析了 LLMs 在应对 CTF 挑战时的常见局限，强调了在没有人类干预的情况下，单纯依赖 LLMs 的潜在风险。

方法实现：通过详细地设计实验流程，研究团队对 LLMs 进行了全面的测试。在 HITL 流程中，参与者需要根据 LLM 生成的输出，提供反馈和指导，以帮助模型更准确地解决问题。而在完全自动化的流程中，LLM 需要独立完成从理解挑战到生成解决方案的整个过程。

实验

实验设置：选择了 GPT-3.5、GPT-4、Claude 等六种 LLMs 进行实验，覆盖了多种 CTF 问题类型，包括密码学、逆向工程、Web 利用等。

实验结果：在解决 CTF 挑战的过程中，ChatGPT 展现出了卓越的性能，能够有效应对多种类型的挑战。相较于人类参与者的平均水平，LLMs 在某些情况下能够带来更高的成功率。尽管如此，研究也揭示了 LLMs 在理解某些特定挑战方面的限制。

论文结论

研究结果表明，LLMs 尤其是 ChatGPT，能够在无需人类干预的情况下，自动解决 CTF 挑战，其解题能力与一般水平的人类 CTF 团队相当。通过对比不同 LLMs 在解决多种 CTF 挑战的表现，本研究突显了 LLMs 在网络安全应用中的潜力，并同时指出了过分依赖 LLMs 可能带来的局限。

此外，本研究通过深入分析 LLMs 在处理 CTF 挑战时的常见不足，例如在复杂逻辑处理和代码生成准确性方面的短板，为未来 LLMs 在网络安全教育和攻击性能力评估中的应用提供了重要参考。尽管 LLMs 已证明其在解决 CTF 挑战方面的潜力，但要实现完全自动化且无需人类干预的水平，仍需对 LLMs 的训练方法和应用策略进行进一步的优化。

原作者：论文解读智能体

润色：Fancy

校对：小椰风

发布于: 刚刚阅读数: 4

云起无垠

关注

定义开发安全新范式 2022-10-14 加入

云起无垠致力于为企业提供自动化安全检测能力，让企业更安全，让安全更智能。

发布

暂无评论

创作场景