思科昨天宣布将收购事件和日志分析初创公司Dashbase,收购金额未公开。Dashbase的软件可以让企业从各种实时通信环境中获取日志数据。这次收购将有助于增强思科的AppDynamics平台,思科是在2017年以37亿美元的价格收购了这个应用监控平台,如今已经成为思科推动应用可观察性市场的核心。
可观察性是IT领域一个快速发展的市场,涉及从日志、指标、跟踪和事件中提取数据来监控应用,以便操作员发现出现问题的根本原因并迅速解决。
AppDynamics业务总经理Linda Tong在宣布此次收购的博客文章中表示,Dashbase的技术将有助于提高可视性并统一多个域的数据,换句话说,它将帮助AppDynamics用户“跨技术、用户和业务领域”更轻松地访问他们的数据。
特别是Dashbase的工具通过支持指标、事件、日志和跟踪改善项目调查和问题解决流程。Tong说:“Dashbase将让客户以可扩展的高性能方式,在云和传统环境中支持更广泛的数据源,从而让他们更深入地了解性能问题。”
过去几年中,AppDynamics已经成为思科产品组合的一个重要部分,是思科为那些正在稳步将应用转移到多云架构的企业提供支持的基础。
Constellation Research分析师Holger Mueller表示,企业对于深入了解他们计算机系统情况的需求变得比以往任何时候都更加重要。“毫无疑问,Dashbase将使AppDynamics成为一个更加强大的工具,让企业能够全面了解他们的应用环境,从而改善客户和员工方面的体验。”
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。