大数据随着行业的发展和市场的成熟,已经从概念的层面逐渐落地,并已经跟各个行业有了密切的结合,9月5日国务院也发布纲要,促进大数据发展。百度作为国内最大的搜索引擎,今日在中国大饭店召开了2015百度世界大会,在大数据与人工智能论坛上专门探讨“大数据”。
百度前段时间提出的新目标是要做 “中国大拿”,在技术、大数据和人工智能上投入很多,目标是希望帮助中国经济转型,此次的大数据与人工智能论坛上,百度介绍了的人工智能和大数据技术,交流共享大数据相关技术,期待能为行业和自身带来更好的机会。
百度在两年前就已经成立了专门发展大数据的部门,现在也进入了全新的阶段。百度高级副总裁王劲表示:“大数据在三天前上升到了国家关注的高度,百度也希望能利用好大数据,推动三千六百行的发展。”
O2O发展迅速,大数据是其发展的基础必要条件。
诚然,没有大数据,人工智能便不能发挥其作用,在人工智能应用广泛的O2O行业就更是如此了。那么百度在大数据领域到底做了什么?
百度大数据部高级总监郭谢表示,百度的线上数据是强项,线下数据目前也在建设中不断进展,优势在于在数据采集后,有很强的数据计算和分析能力,百度也希望通过此次会议,经过探索,达成与行业伙伴的深度合作,在大数据领域取得更大的进展。
具体来说,百度作为国内最大的搜索引擎,用户覆盖面非常广泛,达6亿网民,每天响应60亿次搜索请求,150亿次的定位请求,百度基于此,通过对数据的积累,在技术、应用和生态上都有所成就。
在技术上,百度具备了实时、深度洞察大数据的能力,将线上和线下的数据结合,对多种对象如APP、用户等实现多维度的、全面深度刻画。
在应用上,百度从创新探索的阶段走到了实现多种应用场景和对服务的沉淀,现在已经拥有六大行业解决方案,七大产品组件,三大智能模型。更重要的是,百度可以助力行业形成大数据应用闭环,让商户具备大数据能力,以不断创造价值。具体就是,第一先通过采集到店客户的数据,进而分析和深度洞察其数据特征;第二,帮助店铺精准营销、精细化运营;第三步将会获得更多的客流、更有价值的业务数据流。第三步的完成又会促进第一步的原客户的新数据采集。
在生态上,百度也从内部探索走向了外部的合作开放的阶段,愿意同更多行业伙伴进行合作和共同进步。
郭谢将大数据比喻总结为“新能源”,百度的大数据能源储量大,技术强、价值高。百度有数十亿级别的搜索数据、百亿级的定位数据,庞大的商户、用户数据就像是百度大数据这个“矿藏”。而百度的“冶炼工厂”就是其超大规模数据实时计算,以及多端跨屏用户识别模型,加之深度机器学习技术,对数据进行细致的分析和处理。最后成就的百度“新能源库”就能覆盖用户线上线下全域的行为,能够全维度的刻画用户特征,推动智慧营销、个性化服务,助力科学决策。
未来,百度将开放大数据、模型,以及服务能力,积极同行业伙伴达成合作,为O2O以及其他行业的发展做出贡献。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。