大数据随着行业的发展和市场的成熟,已经从概念的层面逐渐落地,并已经跟各个行业有了密切的结合,9月5日国务院也发布纲要,促进大数据发展。百度作为国内最大的搜索引擎,今日在中国大饭店召开了2015百度世界大会,在大数据与人工智能论坛上专门探讨“大数据”。
百度前段时间提出的新目标是要做 “中国大拿”,在技术、大数据和人工智能上投入很多,目标是希望帮助中国经济转型,此次的大数据与人工智能论坛上,百度介绍了的人工智能和大数据技术,交流共享大数据相关技术,期待能为行业和自身带来更好的机会。
百度在两年前就已经成立了专门发展大数据的部门,现在也进入了全新的阶段。百度高级副总裁王劲表示:“大数据在三天前上升到了国家关注的高度,百度也希望能利用好大数据,推动三千六百行的发展。”
O2O发展迅速,大数据是其发展的基础必要条件。
诚然,没有大数据,人工智能便不能发挥其作用,在人工智能应用广泛的O2O行业就更是如此了。那么百度在大数据领域到底做了什么?
百度大数据部高级总监郭谢表示,百度的线上数据是强项,线下数据目前也在建设中不断进展,优势在于在数据采集后,有很强的数据计算和分析能力,百度也希望通过此次会议,经过探索,达成与行业伙伴的深度合作,在大数据领域取得更大的进展。
具体来说,百度作为国内最大的搜索引擎,用户覆盖面非常广泛,达6亿网民,每天响应60亿次搜索请求,150亿次的定位请求,百度基于此,通过对数据的积累,在技术、应用和生态上都有所成就。
在技术上,百度具备了实时、深度洞察大数据的能力,将线上和线下的数据结合,对多种对象如APP、用户等实现多维度的、全面深度刻画。
在应用上,百度从创新探索的阶段走到了实现多种应用场景和对服务的沉淀,现在已经拥有六大行业解决方案,七大产品组件,三大智能模型。更重要的是,百度可以助力行业形成大数据应用闭环,让商户具备大数据能力,以不断创造价值。具体就是,第一先通过采集到店客户的数据,进而分析和深度洞察其数据特征;第二,帮助店铺精准营销、精细化运营;第三步将会获得更多的客流、更有价值的业务数据流。第三步的完成又会促进第一步的原客户的新数据采集。
在生态上,百度也从内部探索走向了外部的合作开放的阶段,愿意同更多行业伙伴进行合作和共同进步。
郭谢将大数据比喻总结为“新能源”,百度的大数据能源储量大,技术强、价值高。百度有数十亿级别的搜索数据、百亿级的定位数据,庞大的商户、用户数据就像是百度大数据这个“矿藏”。而百度的“冶炼工厂”就是其超大规模数据实时计算,以及多端跨屏用户识别模型,加之深度机器学习技术,对数据进行细致的分析和处理。最后成就的百度“新能源库”就能覆盖用户线上线下全域的行为,能够全维度的刻画用户特征,推动智慧营销、个性化服务,助力科学决策。
未来,百度将开放大数据、模型,以及服务能力,积极同行业伙伴达成合作,为O2O以及其他行业的发展做出贡献。
好文章,需要你的鼓励
前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资,由GV领投。该公司开发AI智能体技术,可加入SMS、iMessage和Discord等群聊平台,为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单,解决群聊混乱问题。公司通过微调技术让AI理解群聊动态,具备社交智能,只在需要时提供帮助。
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
Anthropic宣布为企业客户增加Claude单次提示词的信息处理量,以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口,可处理75万词或7.5万行代码的请求,是此前限制的5倍,超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。
这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。