什么是网络安全就绪?中国企业与全球企业对比的差异意味什么?怎样帮助企业和客户提升网络安全就绪能力?
结合思科最近发布的《网络安全就绪指数》报告和去年12月发布的《安全成果研究报告》可以很好的回答这三个问题。思科大中华区副总裁,安全事业部总经理卜宪录表示,《网络安全就绪指数》是对身份验证、设备、网络、应用负载和数据五大领域,包括19项技术解决方案进行加权,赋予每项不同的权重。
思科大中华区副总裁、安全事业部总经理 卜宪录
既要,也要的安全体系
思科在调查中发现现在客户主要面临三个挑战,第一,不断增加的网络攻击,62%的组织在过去一年内遭受过安全攻击;第二,复杂混合的多云架构,从本地转变到混合多云有一个过程,其中大企业受到的影响是中小企业的3倍;第三,混合办公将继续存在,任何人能够随时随地,以任意设备接入任何应用和数据,导致攻击面成倍扩大且攻击数量增加25%。
如果把这三个挑战融合在一起,对于企业的IT团队可能就是不堪重负,这和之前企业的安全工作已经完全不同。
十年前,企业做安全的中心思想是检测出所有的攻击进行防御,但是在现在的融合的挑战下,如果检测不出所有的攻击,企业应该怎么办?
“安全弹性”的概念也由此产生,企业从试图防御一切攻击,转变到攻击已经发生时,能多快、多大程度恢复运营。《安全成果研究报告》显示,62%的网络安全事件会影响安全弹性,因此96%的高管最关心企业的安全弹性能力。
事前防护和事后恢复已经成为既要和也要的问题,两者被提升到了同一高度,当然最重要的是要把“安全弹性”的意识也提升到同等重要的高度。
安全弹性能力的构建
从整体的安全就绪程度上有两个有意思的现象,一个是成熟期的企业整体占比较低,另一个是超过一半的企业认为自己处在初级或成型阶段,而且中国企业和全球企业在各个阶段的比例非常接近。
卜宪录表示,企业充分意识到了现在的安全挑战,以及自身在安全建设上的进步,对安全弹性能力建设也有了进一步评估。
具体从5大领域看来,第一,身份验证成熟度较低,被认为面临的风险最大,所以在以“零信任”架构为基础构建安全弹性能力时,身份验证的重要性会大幅提升;第二,设备整体成熟度较高,说明在万物互联的环境下企业都部署了相关的解决方案;第三,随着混合多云的出现,网络的边界在消失,网络和安全也在加速融合;第四,应用负载是五大领域中最具挑战也是最不成熟的领域,现在很多应用都出现在业务部门,一系列因素造成了应用负载的就绪程度最低;第五,数据安全相对较好,但基础并不牢固。
《网络安全就绪指数》显示,87%的中国大陆企业预计,网络安全事件将在未来一到两年内对他们的业务造成干扰。
所以构建企业安全弹性的能力已经变得极为重要,思科也从安全弹性的5个维度给出了建议:第一,看到更多:要能够可视化监测整个网络安全的基础架构;第二,预测下一步:拥抱共享智能;第三,采取正确的行动:优先处理最重要的事情,包括持续的“零信任”评估,基于风险的分析等;第四,缩小差距:企业所处的网络环境和外界攻击与威胁也在随时变化,企业没有足够多的预算和团队在所有层面全部推进;第五,日渐强大:编排、自动化、更快地恢复。
向着波峰不断进发
《安全成果研究报告》也重点对比了落后10%企业和领先10%企业的最大差距。卜宪录指出,从波谷的10%跃升至波峰的10%主要有7个成功因素,包括获得高管支持、培养安全文化、储备资源、简化混合环境、最大程度采用“零信任”、扩展检测和响应能力、将安全防护扩展到网络边缘。
思科也给出了实现安全弹性的路线图来应对互联网即网络、云即数据中心、混合办公、安全鸿沟的挑战。卜宪录认为,我们现在能做的就是以不变应万变,提升企业安全弹性能力。
思科拥有一个全新的架构,从用户身份、设备安全、网络安全、云应用和数据五个层面分成三大类别,帮助客户提升构建安全弹性的能力,其中应用了“零信任”的架构,在不同的分类使用了不同的技术。
“生成式AI的兴起,从安全角度会对企业带来新的挑战,企业需要扎扎实实地按照5大领域、7个成功因素去提升安全水准。”卜宪录认为,企业的紧迫性和重要性都需要提高,安全的鸿沟在短期可能会变大,长期还需要进一步观察。
当然企业本身未来也会使用生成式AI,在自身的安全部署上也会发生变化,包括产品研发、客服系统、文案内容等相关配套制度需要尽快更新,否则会造成数据隐私、知识产权、代码安全等甚至是全方位的影响。
现在网络安全行业已经呈现出了网络和安全加速融合、安全厂商加速整合、平台化三个明显趋势。思科在“零信任”、SASE、XDR等几大领域都处在Gartner领导者象限,能够提供全面的视角为客户提供全方位的建议,帮助企业实现安全弹性的能力。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。