至顶网网络与安全频道 11月11日 综合消息: 2009年11月11日,仅有27家商家参与的“淘宝商城促销日”悄然启动。当天5200余万元的销售已经使业内人士一片震惊。然而,当年再大胆的“预言家”恐怕也无法预测仅仅十年后,“双十一”已经成为交易额千亿级的全民购物狂欢。抢折扣券、抢红包、抢特价再到今年的盖楼分享,在“剁手”之余小伙伴们可曾思考过,各种花样翻新的手段背后,潜藏了多少伺机而动的不法分子?一旦稍不留意,“双十一”可能就会演变成财务以及个人信息的“双失意”。
作为一个横跨运营商、金融机构、电商平台再到最终消费者的复杂促销活动。其各个环节都会成为黑客、不法分子的攻击目标。其中最容易受到侵害的,则是安全意识薄弱或者安全防护能力不足的中小型机构与个人用户。Check Point公司在19年初就曾指出,在“信息等于资产”的年代,没有人是绝对安全的。通过Check Point每月发布的恶意软件报告可以看出,如Emotet这样以钓鱼邮件为主要攻击手段的恶意软件仍徘徊在榜单前几的位置。更值得关注的是,随着个人用户对移动设备依赖性的增强,移动设备本身也已经成为被攻击的主要目标之一。今年9月,Check Point研究人员在多款主流Android手机上发现漏洞,该漏洞可使不法分子的钓鱼短信伪装成包括运营商更新通知在内的多种内容,一旦用户进行点击,其手机流量就可能被黑客截获。因此,Check Point安全专家建议,在“双十一”这样大型促销活动期间,用户应保持冷静、谨慎打开促销邮件与短信。此外,通过手机厂商发布的补丁升级操作系统也可以有效抵御攻击。
面对恶意攻击,个人用户常会面临个人信息与财务的双重损失。然而更值得注意的是,当个人用户在工作环境中被钓鱼软件或其他恶意软件攻击时,整个企业网络则都会暴露在不法分子的“掌控”之下。Check Point在对2020年互联网威胁发展趋势分析中指出:尽管电子邮件仍然是头号攻击向量,但网络犯罪分子还利用各种其他攻击向量来诱骗目标受害者,使他们暴露信息。当下网络钓鱼方式不仅可以对手机发起文本短信攻击,甚至可以通过社交媒体和游戏平台上的消息进行扩散。所以,在“双十一”这样促销信息全平台覆盖的特殊时期,个人以及企业受到攻击的可能性将成几何级上升。Check Point安全专家还注意到,一些垃圾邮件攻击活动采用随附恶意 Word 文件下载链接的电子邮件,而另一些则本身包含恶意文档。打开文件时,它将诱使受害者启用文档的宏,然后宏将恶意软件安装至受害者的设备上,并最终对整个网络环境产生威胁。由于中小型企业的安全防护能力有限,使其更容易成为不法分子的攻击目标。2019 年 Verizon 数据泄露调查报告显示,43% 的数据泄露受害者是小型企业,在对中小型企业发起的攻击尝试中,有 63% 获得了成功。Check Point安全专家认为,面对第五代网络威胁,企业的预防能力比“亡羊补牢”的能力更为重要。Check Point刚刚推出面向中小企业的1500系列安全网关由于其出色的防护能力以及简易的部署、管理能力,为抵御最复杂的第五代网络攻击树立了新标杆。
第十个“双十一”大幕将启,保持良好的安全意识、提高自身的安全防护水准,“理智与情感”并重才是每位消费者享受促销红利的同时,保障自身权益不受侵害的不二之道。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。