《Large Language Models are Few-shot Generators: Proposing Hybrid Prompt Algorithm To Generate Webshell Escape Samples》论文学习

一、INTRODUCTION

Webshell是典型的恶意脚本的一个例子,它利用注入漏洞,让黑客能够远程访问和侵入web服务器,对社会经济和网络安全构成严重威胁。

Webshell的形式多种多样,从允许远程执行用户提供的系统命令的单行代码,到大规模复杂的脚本文件。这些代码也可以用多种编程语言编写,如asp、aspx、php、jsp、pl、py等。

与恶意软件检测的研究类似,webshell的生成和检测是非静态的、对抗性的问题,它们一直在进行一场持续升级的猫鼠游戏。

  • 从攻击者的角度来看,主流的webshell检测工具和引擎如VIRUSTOTAL、WEBDIR+和AVAST经常更新和维护,包含了新webshell的规则和特征,通常在几天甚至更短的时间内完成。这迫使攻击者不断开发新的webshell生成方法,以绕过这些引擎的检测。
  • 在检测方面,研究仍处于初级阶段。缺乏公开可用的基准数据集和用于webshell检测的开源基线方法。大多数使用神经网络或智能算法的模型声称具有高准确率和低误报率。然而,事实是这些模型基本上在私有数据集上进行测试,这些数据集通常只包含几百个或更少的样本,具有明显的恶意特征。即使是最简单的多层感知器(MLP)结构也可以通过过拟合在这类数据集上实现高精度检测。在真实的网络攻击环境中,这些方法的真实性和泛化能力难以保证。对于互联网上有限数量的公开可用webshell库,检测引擎也可以实现高精度检测,基于人工智能(AI)方法的优越性并没有得到充分展示。

实际上,Abdelhakim等人认为AI方法擅长提取webshell中的抽象特征,这些是超越词汇、语法和语义特征的高级特征。这些高级特征有助于揭示通过语法和语义分析无法检测到的webshell中隐藏的方面。然而,与恶意软件对抗样本生成的研究不同,webshell逃逸样本生成的研究仍然是一个空白领域,这是因为现有的webshell绕过策略众多且复杂,并且没有特定的系统方法可供遵循。因此,提出一个webshell逃逸样本生成算法并构建相应的webshell基准数据集,是一项紧迫且极其重要的工作

另一方面,大型语言模型(LLM)和人工智能生成内容(AIGC)技术的蓬勃发展已经在聊天、图像生成等多个领域产生了不可磨灭的影响。作为自然语言处理(NLP)领域的最新成果,LLM已经在上下文推理和语义理解能力上大大领先于早期的神经网络结构(例如LSTM、GRU等)。LLM在各种与代码相关的任务(例如代码生成、渗透测试、漏洞检测、自动程序修复、LLM模糊调整、漏洞修复)中的广泛应用,充分展示了其出色的代码推理能力,使得利用LLM生成webshell逃逸样本成为可能。

提示工程在LLM的垂直研究应用中起着关键作用,旨在探索人类与LLM更好地互动的方式,以充分发挥其性能潜力。尽管与提示工程相关的研究存在争议,反对它的学者认为提示工程过于“神秘”,并加剧了神经网络模型缺乏可解释性的问题。然而,不可否认的是,提示工程中的许多关键技术,如思维链(CoT)、思维树(ToT)、零样本思维链等,已经提高了LLM的推理能力。此外,像语言模型分析(LAMA)探针等技术的应用正在逐渐提高模型的可解释性。在提示工程中的新型研究,如提示微调,已能够在LLM中微调参数,从而简化传统的微调过程。此外,AIGC技术如此“富有创造性”,以至于一个简单的提示就能使LLM生成0-Day webshell。

因此,在这项工作中,我们探索了AIGC支持的webshell逃逸样本生成策略的未探索研究领域。我们提出了层次化和模块化的提示生成算法Hybrid Prompt,并将其应用于不同的LLM模型,以生成多个具有高逃逸能力的webshell样本。实验结果表明,通过Hybrid Prompt算法+LLM模型生成的逃逸样本能以高逃逸率(ER)和生存率(SR)绕过主流检测引擎的检测。

posted @ 2024-03-12 16:04  郑瀚Andrew  阅读(144)  评论(0编辑  收藏  举报