- BOB半岛·(中国)官方网站面试销售部自我介绍(通用16篇)
- BOB半岛·(中国)官方网站重大升级 SecGPT V20:打造真正“懂安全”的
- BOB半岛人工智能对社会变革产生哪些影响?年轻的朋友你准备好了吗?
- BOB半岛·(中国)官方网站最高法发布首批涉市场准入行政诉讼十大典型案例
联系人: 梦总
手机: 13800000000
电话: 400-123-6789
邮箱: admin@meiguhulan.com
地址: 广东省广州市BOB半岛·(中国)官方网站
BOB半岛·(中国)官方网站重大升级 SecGPT V20:打造真正“懂安全”的
BOB半岛·(中国)官方网站重大升级 SecGPT V20:打造真正“懂安全”的大模型随着GPT-4.5、DeepSeek等新一代大模型的崛起,我们正进入Agentic AI(智能体AI)的时代—— 它不仅能对话,还能思考、执行和协作,正在重塑整个生产力范式:
而这一次,云起无垠没有止步于“能用”,我们在追求“好用”的同时,更关注真正实战可落地的AI安全能力。
从模型训练、数据构建、能力评测,到安全Copilot应用,我们打造出更聪明、更安全、更懂安全的SecGPT 2.0。开源模型可以去github下载使用。
SecGPT融合了自然语言理解、代码生成、安全知识推理等核心能力,已经能够胜任多种关键安全任务:
这些能力不再停留在“能回答”,而是可以被“调用”、“组合”、“协同”执行,支撑起复杂的安全智能任务流。
无论是作为单点智能助手,还是嵌入式任务引擎,SecGPT都已具备强大的适配性、扩展性与安全可控性。
自2023年SecGPT开源以来,大语言模型技术持续突飞猛进。从语言理解到逻辑推理,再到工具调用与多任务协同,行业标准几经更替,迈入智能体(Agentic AI)时代。与此同时,云起无垠也在持续推进商业版安全大模型 SecGPT Pro 的多轮迭代,核心能力已实现代际跃升。
但开源版本仍停留在早期阶段,在语言表达、安全理解与接口兼容性方面逐渐显现出技术边界,难以应对当前复杂多变的安全任务需求。因此,我们决定对SecGPT开源模型进行全面升级BOB半岛·(中国)官方网站,持续回馈全球安全社区,并助推安全智能体在更多场景中的落地与演化。
大语言模型领域的基础设施已经发生底层变动。相比早期模型,新一代模型具备更长上下文处理能力、更高效的注意力机制、结构更清晰的工具调用接口,以及支持Agent工作流的任务控制能力。例如,支持MCP协议、ReAct思维链、Routing插件架构、Function Calling、工具上下文记忆、部署端的量化控制与微调架构等,都已成为安全智能体设计中的“新基础”。
早期模型使用者多集中于问答类任务,例如安全知识普及、命令解析、脚本理解等。这类任务主要依赖语言理解能力,结构相对简单。然而,当安全模型真正进入研发、攻防、运营等实际场景后,任务呈现出明显的结构化、多轮化、工具化趋势:
原有SecGPT模型架构难以完成上述能力组合,仅靠 Prompt 注入或零样本提示远远不够。
尽管DeepSeek、Qwen、LLaMA等开源大模型在通用语言理解、代码生成等任务中取得显著进展,但在安全场景下,它们面临以下结构性瓶颈,尤其在企业级私有部署环境中更为突出:
通用模型训练语料以开放领域为主,严重缺乏如下高价值安全语料:渗透测试日志、攻击链行为样本、系统调用轨迹、漏洞利用(PoC/Exp)、红队审计报告等。这直接限制了其对实战攻防细节的掌握能力。
在漏洞成因理解、系统语境建模、协议行为解析等任务中,通用模型的理解能力多停留在浅层表述,无法进行因果链条建模与深层语义推理,缺乏“攻防语境”下的专业认知。
通用模型未针对安全工具(如模糊测试框架、漏洞扫描器、静态分析引擎等)进行微调和适配,导致在调用第三方接口时经常出现参数配置错误、上下文不匹配、调用逻辑混乱等问题,严重影响任务可执行性和稳定性。
安全任务往往涉及多步推理(理解→分析→调用工具→收集反馈→修复建议),通用模型缺乏对这类“任务链”结构的建模能力,常常出现中途跳跃、逻辑断裂、输出不可收敛等现象,无法胜任复杂工作流调度任务。
当前通用大模型在安全场景中往往表现为“语言流畅但逻辑混乱,表达顺畅但结果失真”。在真实系统环境下,其输出容易出现答非所问、指令不收敛、工具调用失败、上下文错乱等问题,难以支撑企业对安全智能体高可信、高精度、高可控的实际需求。
本轮升级,我们同步发布了1.5B / 7B / 14B三个模型规格,全面适配从低配CPU、本地4090 GPU到企业级多卡集群等多种运行环境,实现大模型能力的普适化落地。更大规模的32B、72B、671B旗舰版也将在后续分批开放,进一步支撑企业级复杂安全任务的多轮推理与智能决策。
我们基于Qwen2.5-Instruct系列与DeepSeek-R1系列基座模型,结合自建安全任务集与安全知识库,在8台A100 GPU集群上持续训练一周以上,完成大规模预训练 + 指令微调 + 强化学习,显著提升模型在安全场景中的理解、推理与响应能力。
训练与验证损失(train/loss 与 eval/loss):二者均呈现出平稳下降趋势,说明模型在训练集与验证集上均持续收敛,未出现过拟合迹象。
学习率曲线(train/learning_rate):采用典型的 Warmup + 衰减策略,有效提升了早期训练的稳定性与收敛速度。
梯度范数(train/grad_norm):整体波动平稳,仅在少数步数存在轻微尖峰,未出现梯度爆炸或消失,表明训练过程健康稳定。
评估表现:eval/runtime与 eval/samples_per_second波动范围小,说明在评估过程中系统资源使用高效,推理吞吐量稳定。
我们已构建了一个超大规模、结构完备的网络安全语料库,总量超过5TB、共计106,721个原始文件,其中超过40%内容为人工精选与结构化处理。私有数据部分系统整合了具备70+字段 / 14类结构标签体系的安全数据资源,经过统一清洗、语义标注与重构,构建出数百亿 Tokens 级的高质量语料,为大模型深度推理能力提供坚实支撑。
下图展示了该语料库的构成维度,整体采集逻辑遵循“理论支撑 — 实战对抗 — 应用落地”三层结构体系:
实战对抗:包括漏洞详情、CTF题库、日志流量、恶意样本与逆向分析等数据,提升模型对真实攻击行为的识别与追踪能力;
应用落地:涵盖安全社区博客、教育培训资料、安全知识图谱与自动化策略,增强模型在安全运营、辅助决策等场景中的适配能力。
为全面评估 SecGPT 的安全实战能力,我们构建了一套覆盖安全证书问答、安全通识、编程能力、知识理解与推理能力的综合评估体系,主要采用以下标准化数据集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
在与原始模型 SecGPT-mini 的对比中,训练后的模型在所有指标上均实现大幅跃升,具体如下:
相较于基础模型 Qwen2.5-Instruct,SecGPT 在所有评测指标上均实现实质性超越,反映出我们在数据构建、微调范式、安全任务精调机制上的整体优化成效:
在CISSP和CS-EVAL等安全类数据集上,SecGPT 在所有参数规模下均表现优于Qwen2.5同规格版本;
本轮升级中,SecGPT在安全知识问答方面完成了从信息整合到逻辑输出的能力跃迁,具体体现在:
推理能力更突出:具备多段知识联结与复合逻辑推演能力,能完成如攻击链分析、威胁研判等复杂任务。
SecGPT 能够模拟渗透攻击流程,从信息收集、漏洞利用到提权横向,具备关键工具命令分析、Payload 构造、利用链生成等能力。
在安全日志与网络流量场景下,SecGPT 能自动识别异常事件、构建攻击链图谱、抽取关键 IOC(Indicator of Compromise),辅助完成事件溯源与告警分类。
基于对反汇编、API调用序列、加壳行为等低层数据的理解,SecGPT能辅助完成恶意样本的静态分析、特征提取与家族归类,具备一定的逆向辅助解读能力BOB半岛·(中国)官方网站。
我们即将发布首份网络安全大模型能力评测与选型报告,围绕威胁情报问答、代码审计、日志分析等典型场景,构建一套系统化、透明且可复现的评测体系,全面对比当前主流模型的能力边界。这份报告不仅为安全技术社区提供清晰的对比依据,也将成为合作伙伴制定Fine-tune策略和智能体架构选型的关键参考材料。
尽管通用大模型在语言理解领域已取得显著进展,但能够真正理解攻击链逻辑、漏洞细节、胜任安全推理与实战辅助的大模型仍然稀缺。 我们将以全栈视角,全面复盘“如何训练一个好用的安全大模型”,包括高质量安全训练数据构建、模型架构调优、多任务对齐训练、能力评测体系设计等关键环节,打通数据→算法→评测的闭环路径,推动安全智能体的实用化落地。
我们正在持续推进SecGPT在CTF解题任务中的自动化能力,目标是实现“理解题意 → 推理思路 → 构造Payload → 完成解题”的闭环流程。
目前模型已在大量真实题目中完成微调,具备初步能力:理解题意与还原考点,自动构造注入、命令执行、ROP等攻击链,解释与变换攻击命令含义,同类题型的迁移泛化表现良好。
下一步,我们将聚焦标准化数据构建、解题评分指标、自动解题Agent原型开发,以及联合社区开展实战挑战验证。CTF场景将成为安全大模型迈向Agent化的典型突破口。
我们正在建设并逐步开放一批具备混合结构、场景标签的高质量安全数据集,覆盖知识问答、代码审计、漏洞挖掘、威胁情报解析、流量分析等关键任务场景。 未来将支持多语言BOB半岛·(中国)官方网站、多模态、多任务协同训练,进一步增强安全大模型的泛化能力和实战适应性。我们诚邀社区、企业、高校共同参与数据共建,共同筑牢安全模型的数据底座。