未被检测到的网络内容抓取爬虫程序对电商行业影响严重
2024年 7月2日 – 负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai Technologies, Inc.,以下简称:Akamai)(NASDAQ:AKAM),近日发布了新一期的《互联网现状》(SOTI) 报告,详细介绍了随着网络内容抓取爬虫程序的激增,许多企业都会面临安全和业务威胁。《侵蚀您的利润:网络爬虫程序对电商行业有何影响》报告发现,爬虫程序流量占整个网络流量的 42%,且 65% 的爬虫程序是恶意的。
由于电商行业依赖于创收型 Web 应用程序,高风险爬虫程序流量对该行业的影响最大。尽管某些爬虫程序对业务是有益的,但网络抓取类爬虫程序却被用于获取竞争情报和开展间谍活动、囤积库存、创建假冒网站以及其他对利润和客户体验产生负面影响的活动。目前尚无法律禁止使用抓取类爬虫程序,而且由于人工智能 (AI) 僵尸网络的兴起,检测它们并非易事,但公司可以采取一些措施来加以缓解。
Akamai 亚太地区及日本安全技术和战略总监Reuben Koh 表示:“每家电商平台都在一定程度上依赖网络爬虫机器人。当这些机器人被滥用时,挑战就出现了,因为它们的功能相似,很难区分好坏。此外,快速发展的爬虫环境使防火墙等传统防御措施失效,这进一步加剧了这一问题。现在,电子商务企业,尤其是作为全球主要商业中心的亚太及日本地区的电子商务企业,比以往任何时候都更需要投资于合适的解决方案。以成功应对恶意机器人发起的不可预测和反复的攻击。这是由于这些企业在实现区域化并扩大客户群的时候,往往会面临更多威胁。”
该报告的主要调查结果如下:
《侵蚀您的利润:网络爬虫程序对电商行业有何影响》研究报告介绍了缓解抓取类爬虫程序的策略,并结合案例研究,说明采取有效防护措施能够显著提升网站的运行速度和效率。此外,该研究报告还指出,在应对这些日益增多的攻击时,必须考虑合规性问题。
今年是 Akamai 发布《互联网现状》(SOTI) 报告 10 周年。 SOTI 系列报告以 Akamai Connected Cloud 收集的数据为基础,提供有关网络安全和 Web 性能形势的专家见解。
好文章,需要你的鼓励
Python通过PEP 810提案正式引入惰性导入功能,允许程序延迟加载导入库直到实际需要时才执行,而非在启动时全部加载。该提案由指导委员会成员Pablo Salgado于10月3日提出并于11月3日获批。新功能采用选择性加入方式,保持向后兼容性的同时解决了社区长期面临的启动时间过长问题,标准化了当前分散的自定义解决方案。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
Valve最新Steam硬件软件调查显示,Linux用户占比达到3.05%,较上月增长0.37个百分点,相比去年同期增长约50%。游戏网站Boiling Steam分析显示,Windows游戏在Linux平台兼容性达历史最高水平,近90%的Windows游戏能在Linux上启动运行,仅约10%游戏无法启动。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。