一般来说,在跳蚤市场能找到扎染T恤、坏掉的台灯和老旧的迪斯科唱片,现在看来,装满敏感数据的存储设备也被加入到这个清单中。
来自荷兰南部城市布雷达的 62 岁技术爱好者兼淘bargain 达人 Robert Polet,在以每个 5 欧元 (约合 5.21 美元) 的价格购买了 5 个 500GB 硬盘后,意外发现了一个容量为 15GB 的敏感医疗记录数据库。
这个对网络犯罪分子来说堪称金矿的发现地点在哪里?显然是在 Weelde 空军基地旁边的跳蚤市场。
他向最先报道这个故事的广播公司 Omroep Brabant 表示:"几周前,我从比利时的 Turnhout 回来。在回家的路上,我因为急需上厕所而在 Weelde (机场) 停了下来。空军基地旁边正好有个跳蚤市场。我去看了看,从一位外国人那里买了 5 个 500GB 的硬盘,每个 5 欧元。"
Polet 是一位终身的电脑发烧友,已经和电脑打交道 30 年了。"这是我的热情所在,也是我的生活,"他告诉记者。当他不在从事残疾人司机的日常工作时,就在捣鼓技术,"经常是免费的,有时候换包烟就行。"
他也是一位热衷的摄影师,这就是为什么他决定低价购买这些跳蚤市场的硬盘——为他的照片和无人机视频获取更多存储空间。
回家后接上硬盘,Polet 发现硬盘中包含医疗数据,包括荷兰版的社会保障号码、出生日期、家庭住址、用药详情以及其他全科医生和药房数据。这些记录来自 2011-2019 年间,主要涉及 Utrecht、Houten 和 Delft 地区的个人信息。
"这真是令人震惊,"他说。"我想'这种事情怎么可能发生'?我或我姐姐的信息很可能就在其中。"
发现这些内容后,Polet 驱车返回跳蚤市场,从同一个人那里购买了剩下的 10 个硬盘。"幸运的是它们还在那里,"他说。
接下来自然要问的问题是,这些数据是如何出现在跳蚤市场的,它们属于哪个组织?
Polet 只查看了一小部分文件——他只检查了总共 15 个硬盘中的 2 个——但这足以推断出受影响的医疗机构是位于 Utrecht 的一个未指明的组织。
该组织告诉 Polet,数据来自曾经位于布雷达的 Nortade ICT Solutions,该公司现已倒闭。The Reg 注意到,其相关网站已经失效。这是一家为医疗保健行业开发软件的 IT 公司。
根据荷兰法律规定,包含医疗数据的存储设备(如硬盘)必须由专业人员擦除,并且必须有擦除认证。
Malwarebytes 在评论这件事时说:"正常程序是让专业公司销毁它们,但这需要花钱,而通过出售硬盘,公司可以赚到一些现金。"
该公司补充说,有多种方法可以安全地擦除磁盘数据,从用随机数据覆盖(单次或多次)到调用固件中的安全擦除命令(如果可用),甚至可以将磁盘物理切碎并焚烧每一片。
Malwarebytes 还表示,个人应该确保要求从公共记录中删除他们的数据。
"在这个荷兰案例中,令人惊讶和痛心的是,这样一家公司会在其硬盘上存储这类信息,"该公司表示。
"首先,软件供应商无权存储这些信息。其次,即使有合法理由存储它们,数据也应该被加密,当然,硬盘也应该被负责任地报废。"
但是,即使是最警惕个人数据保护的人也不太可能要求删除数据,因为这些数据通常用于提供无障碍的医疗保健服务。
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。