下一代设备和网络测试、保障及分析解决方案供应商思博伦通信(伦敦证交所上市代码:SPT)近日宣布,正式发布业界首个基于订阅的自动化5G核心网测试平台——Landslide 5GC自动化套件。该平台的设计目标,是帮助5G核心网产品加快投放市场,并大幅降低相关测试成本。思博伦Landslide 5GC自动化套件拥有数百个测试用例,这些用例由思博伦5G专家开发和管理,能帮助运营商以更快的速度和更强的信心将5G产品服务推向市场。
目前,各类机构都在竞相开发和部署5G服务。要想确保5G核心部署获得成功,关键的一步便是对性能、容量和一致性加以验证。在过去,这一进程需要基于不断演进的3GPP标准,耗时数月开发手动测试用例,不仅耗时,而且成本高昂,同时可能延误新服务的上线时间及其回报周期。思博伦全新的Landslide 5GC自动化套件可以实现这些验证进程的自动化,帮助运营商节省时间和成本,并可确保服务质量和一致性。
思博伦网络生命周期服务保障事业部总经理Doug Roberts表示:“对于那些预算和资源有限又需要加快5G部署的运营商而言,该自动化套件带来的价值远不止初期的部署,它可以帮助验证网络的变化,并且随着标准的演进,在后续的测试开发中也无需投入更多的资源。”
Landslide 5GC自动化套件所提供的用例库包含数百个预先建好的测试用例,涵盖了各类端到端业务评估的一致性、容量和性能测试,包括业界广泛需求的网元包围测试能力。该自动化套件基于多种屡获大奖的产品和解决方案构建,包括Landslide核心网仿真、Velocity测试自动化,以及行业顶级的专业化服务。
对此Roberts认为:“客户不仅可以节省大量时间和成本,还可以完全信赖思博伦全面的5G专业能力和久经考验的测试方法,将风险降至最低的同时,确保5G推广获得成功。”
随着5G的出现,运营商面临着众多前所未有的挑战,从复杂的新技术和多厂商环境,到频繁的厂商补丁和新版本发布,对持续集成和持续部署(CI/CD)模式的支持已经成为高速率、大容量测试的必备要求。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。