随着我国对国家级信息安全、关键信息基础设施安全的愈发重视、各行各业对自身业务系统的安全性的愈发重视,近十年来我国开始陆续出现各种形态的网络靶场,以提升安全人员防御技能为目的。国内 2013 年前后出现的类似网络安全培训系统的系统形态,可以说是网络靶场类产品的雏形。在我国,真正意义上的网络靶场行业大约在 2016 年左右才开始萌芽。在此之前,网络靶场更多以高校、科研院所为代表的研究性的项目的形态存在。
初代网络靶场的基础形态:
2016年至2019年,初代网络靶场的形态基本形成。初代靶场的需求来自于以下几个方面:
下一代数字化网络靶场的新需求:
2019 年以后,随着行业、国家对网络安全要求的不断深入,各类针对网络靶场的新需求也逐渐浮出水面。随之而来的是初代基于云计算底层架构实现的网络靶场的局限性也越来越大。
初代网络靶场的局限性:
纵观国内初代网络靶场的技术路线,都离不开云计算系统的影子。使用开源的云计算系统作为网络靶场构建的基础平台,能够大大降低网络靶场的研发投入和技术风险,把更多精力放在应用层的业务逻辑研发。
但到了实现深层次靶场业务研发的时候,其无法实现更加精细粒度的网络仿真,难以实现虚实设备互联,难以扩展出仿真建模技术等,紧紧束缚了网络靶场向行业应用的深水区发展。
网络靶场的联通性,是网络靶场网络仿真性能的一个重要指标。它取决于网络协议栈的还原能力、“网络功能虚拟化设备”适配的能力以及虚实互联的能力。初代网络靶场构建的网络架构往往还停留在“有线局域网”的层面,不具备宏大且灵活的网络仿真架构。
下一代数字化网络靶场的技术路线
随着网络靶场技术的持续发展,同云计算的技术路线分道扬镳是必然的事情。不论哪种云计算平台,归根结底不是为网络靶场业务设计的,用它支撑靶场业务都是非常掣肘的。
走出舒适区,研发自主可控的、适合网络靶场真正业务需求的底层支撑系统,是国内网络靶场厂商的一条必经道路,能让网络靶场能力得到本质提升。
丈八网安作为靶场自研底层的起步者,在产品架构研发过程中,实现了引擎层、中台层、应用层三层架构的完全自主可控以及全部自主知识产权。并在第一时间对自身产品竞赛系统、攻防演练系统、实训系统”、综合网络靶场系统等完成了国产化深度兼容性适配,力求关键技术不“受制于人”。
初代网络靶场通过虚拟机把一个个实际的物理网络节点的功能仿真出来。而仿真技术的一个重要指标是仿真的颗粒度,下一代网络靶场应当能够提供颗粒度可变的仿真能力,在逼真的仿真业务场景中,使用各种虚拟机、甚至物理设备实现对目标基本 1:1 的还原仿真。而在对于逼真度要求不高的业务场景中,我们完全可以使用轻量化的仿真建模技术实现极小成本的模拟仿真。这个理念也促使丈八网安在靶场设计过程中,研发出可大规模仿真业务场景的的轻量化的仿真建模技术,支持100000+节点拓扑构建,便于推演、建档场景构建,快速构建专项技术研究网络,实现可变焦式的仿真建模。
近年来,AI技术给网络安全行业未知安全的检测与处置带来了全新的技术路径。AI 技术在网络靶场中应用的想象空间也很大。
而从当前的最实际应用需求来看,丈八网安认为 AI 技术能够解决的首要问题是为“静态靶场”引入全新的动态要素。
AI 技术的引入,将在流量层面和行为层面让靶场的模拟仿真效果大幅的提升。丈八网安在靶场设计中也引入了人工智能技术,研发前瞻性技术“AI赋能的流量发生”,提供各类高仿真背景流量生成,高度还原正式业务场景。在应用层面,能够实现智能化红方的模拟仿真,为训练提供自动化攻击对手,从从而给靶场环境的状态变化带来可预测性,进而解决企业痛点。
在许多情况下,我们不能用真实的物体去试验来找到网络安全对物理世界所造成的影响,我们可以构建一个使用建模语言来表示真实系统的模型。一方面能够非常灵活的提供参数读取接口,另一方面能够非常方便对接实际采集的数据,为数字孪生技术的应用打下基础。数字孪生指充分利用物理模型、传感器更新等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,结合仿真技术的网络靶场,构建目标网络的完整功能映射,能够使网络靶场更多维度应用。
下一代数字化网络靶场将彻底摆脱掉云计算的影子,在仿真建模、AI、数字孪生等技术的加持下,成为网络安全领域中的一个重要的基础平台系统。网络靶场也将超越传统的技术培训类应用方向,在关键基础设施模拟仿真、网络安全测试评估等重要领域发挥重要作用。
“火天网境®”——下一代数字化网络靶场代表产品
丈八网安2021年推出的下一代数字化网络靶场代表产品“火天网境®”系列——训、演、弈、测,能够满足各行业对网络安全模拟仿真、网络安全攻防对抗、网络安全效能评估、网络安全教学研究、网络安全技能竞技等多维度应用需求。
产品实现了完全自主可控的底层架构开发,率先脱离了传统云计算架构平台的束缚,利用虚拟化、数字建模、链路仿真等技术来实现仿真。达到细粒化、轻量化的仿真技术将仿真效果,引入AI人工智能技术提供智能化攻击链路,结合数字孪生技术进一步加强仿真性。全拼式中台设计,在面向特殊行业用户时,可提供支持大量模组灵活拼装与功能模块定制的服务,根据用户需求定制产品形态,精准解决痛点需求。产品在技术链路上首次实现“多维”网络空间安全模拟技术,不仅能完成传统IT内网的模拟,还能实现无线网、电信网、工控网、物联网等特殊场景的模拟仿真,极大地扩展了网络靶场的应用领域。
丈八网安长期以来在国家第五空间安全事业上勤勉深耕,通过体系化、自主化思维进一步完善的网络安全靶场平台功能。秉承让网络安全仿真及应用的核心技术掌握在国人手中的愿景,构建自主可控的实战化场景仿真模拟系统,提供高还原模拟仿真复现、网络安全环境侦测、网络安全人才培养及人才选拔等多维度、多场景战略构建需求。为下一代数字化网络攻防靶场的发展做出不懈努力,立志成为中国领先的网络安全仿真及应用平台供应商。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。