SecGPT 是由 云起无垠 于 2023 年正式推出的开源大模型,专为网络安全场景打造,旨在以人工智能技术全面提升安全防护效率与效果。SecGPT 融合了自然语言理解、代码生成、安全知识推理等核心能力,已成功落地多个关键安全任务场景:

  • 🛠 漏洞分析:理解漏洞成因、评估影响范围、生成修复建议
  • 🧭 日志与流量溯源:还原攻击路径、分析攻击链,辅助事件复盘
  • ⚠️ 异常检测:识别潜在威胁,提升安全感知与响应能力
  • 🎯 攻防推理:服务于红队演练、蓝队分析,支撑实战决策
  • 📜 命令解析:分析攻击脚本,识别意图与高危操作
  • 💬 安全知识问答:团队“即问即答”的知识引擎

模型源码:https://github.com/Clouditera/secgpt
模型下载地址:
HuggingFace: https://huggingface.co/clouditera/secgpt
ModelScope: https://modelscope.cn/models/clouditera/SecGPT-14B
数据集下载地址:https://huggingface.co/datasets/clouditera/security-paper-datasets

SecGPT于 Qwen2.5-Instruct 系列 与 DeepSeek-R1 系列 模型,结合自建安全任务集与安全知识库, 在 8台A100 GPU 集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习, 显著提升模型在安全场景中的理解、推理与响应能力。
其次,构建了一个超大规模、结构完备的网络安全语料库,总量超过 5TB、共计 106,721 个原始文件,其中超过 40% 内容为人工精选与结构化处理。私有数据部分系统整合了具备 70+ 字段 / 14 类结构标签体系 的安全数据资源,经过统一清洗、语义标注与重构,构建出 数百亿 Tokens 级的高质量语料,为大模型深度推理能力提供坚实支撑。下图展示了该语料库的构成维度,整体采集逻辑遵循“理论支撑 — 实战对抗 — 应用落地”三层结构体系:

  • 理论支撑:涵盖法律法规、学术论文、行业报告等权威资料,为模型提供稳固的知识基座;

  • 实战对抗:包括漏洞详情、CTF题库、日志流量、恶意样本与逆向分析等数据,提升模型对真实攻击行为的识别与追踪能力;

  • 应用落地:涵盖安全社区博客、教育培训资料、安全知识图谱与自动化策略,增强模型在安全运营、辅助决策等场景中的适配能力。

    SecGPT 在安全知识问答方面完成了从信息整合到逻辑输出的能力跃迁,具体体现在:

  • 知识覆盖更全面:引入了涵盖法律法规、攻击战术、逆向分析等14类安全知识领域的结构化语料;

  • 答案生成更精准:通过多轮对话控制与语义优化技术,提升了问答对齐率与上下文记忆稳定性;

  • 推理能力更突出:具备多段知识联结与复合逻辑推演能力,能完成如攻击链分析、威胁研判等复杂任务。

渗透能力
SecGPT 能够模拟渗透攻击流程,从信息收集、漏洞利用到提权横向,具备关键工具命令分析、Payload 构造、利用链生成等能力。

日志分析和流量分析能力
在安全日志与网络流量场景下,SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC(Indicator of Compromise),辅助完成事件溯源与告警分类。

** 逆向分析能力**
基于对反汇编、API 调用序列、加壳行为等低层数据的理解,SecGPT 能辅助完成恶意样本的静态分析、特征提取与家族归类,具备一定的逆向辅助解读能力。

代码审计能力

模型部署步骤:

  1. 创建Python 环境(建议 Python 3.10+)
conda create -n secgpt-vllm python=3.10 -y
conda activate secgpt-vllm
  1. 安装 vLLM(需具备 PyTorch + CUDA)
pip install --upgrade pip
pip install vllm
  1. 启动server 服务
CUDA_VISIBLE_DEVICES= xxx(GPU index) \
vllm serve ./secgpt \
  --tokenizer ./secgpt \
  --tensor-parallel-size 4 \
  --max-model-len 32768 \
  --gpu-memory-utilization 0.9 \
  --dtype bfloat16 \

这里.secgpt是指模型下载的地址
4.示例请求

curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "secgpt",
    "messages": [{"role": "user", "content": "什么是 XSS 攻击?"}],
    "temperature": 0.7
  }'

完整已经部署好的项目已经发布在趋动云社区,感兴趣的伙伴可以自行运行查看,连接如下:
https://open.virtaicloud.com/web/project/detail/572261760896618496

如果本地算力不够可以选择趋动云服务,新用户注册可送几十块钱的算力。注册赠送算力链接:https://growthdata.virtaicloud.com/t/u2。其部分算力租赁价格如图:



https://github.com/Clouditera/secgpt?tab=readme-ov-file

posted on 2025-05-07 08:56  苔菜不吃鱼  阅读(1579)  评论(0)    收藏  举报