大数据已经在我们看不见的地方发挥价值,例如风险控制,以信用卡刷卡来说,以往消费者进行刷卡后,在第二笔或第三笔交易之后才会发现是否存在风险。现在利用大数据分析和挖掘技术,首笔刷卡已经伴随着实时风控,从而放行正常刷卡、阻断非法交易。
华为云计算产品线总裁任志鹏
“过去一年来,我们发现大数据在数据密集型的行业应用最多,这些企业都有一个普遍的诉求,他们希望有一个数据服务的流水线,在这个流水线中能够发现自己的商业价值,并把数据产生的智能、智慧、价值融入到新的商业流程里面去。”华为云计算产品线总裁任志鹏在华为全联接大会媒体沟通会上表示。
华为大数据坚持创新,帮助客户重塑企业数据处理架构,定位让大数据“慧”说话。
华为FusionInsight是高可靠、高安全、易使用的大数据平台,能够帮助企业快速构建海量数据信息处理系统,通过对企业内部和外部的巨量信息数据实时与非实时的分析挖掘,发现全新价值点和企业商机。
五大能力助力企业发掘数据智慧
华为FusionInsight大数据平台总经理朱照生总结了华为大数据助力企业发掘数据智慧的五大能力。
华为FusionInsight大数据平台总经理朱照生
一、实时决策:当今时代,基于全量数据进行实时决策的业务需求将越来越多,但是现有技术在业务处理能力及业务响应速度方面达不到客户的需求。华为基于丰富的大数据平台开发经验,开发的实时决策平台,可以实现基于全量数据的毫秒级决策响应,很好的满足了用户的实时决策需求。
基于FusionInsight的实时决策平台,实现了基于全量数据的毫秒级决策响应,帮助客户实现业务实时决策。朱照生举例说,我们让银行刷卡系统改变了从事后风控变成实时风控。以前持卡用户去国外出差时,很可能刷卡之后半小时收到银行电话确认。现在我们帮助中国的商业银行第一次做到了在授权之前就发现是否存在欺诈。
二、实时搜索:“我们这个搜索是企业级的搜索,比如说平安城市搜索一个人,希望这个人所有相关的信息完整呈现出来,这叫企业级的搜索,这种搜索能力不同于互联网,而是企业级的实时搜索。华为的大数据平台契合了不同行业的严格要求。”
三、关系分析:现在社交网络很发达,关系分析要找出一个人跟他社交圈子里面所有背后的各种各样的关系,“对华为来说是数学上点和边的关系,最终我们的合作伙伴,不管是做金融还是平安城市,会算出来这个点代表什么,这个边代表什么,算出所感兴趣的人、车、物。”
四、统一SQL:“我们认为大数据是企业数据自然的延伸,所以大数据应该兼容企业所有的应用,所以我们统一SQL,用华为的大数据几乎感觉不到用新技术。就像有一天奔驰推出了混合动力一样,驾驶感一模一样。”
五、大集群、多租户:数据大了之后,集群一定庞大,作为一个企业来说有很多部门,这个部门之间数据既要共享也要隔离,华为叫大集群,多租户。不同的部门对数据的使用要求、访问权限一定不一样,平台除了能够共享汇总所有的数据源之外,一定要具备多租户的能力,也就是能满足各个部门的权限的管理。
朱照生指出,这五种能力是衡量一个大数据平台能否在企业里面用起来的关键。
帮助传统企业应用大数据迁移
对于很多企业来说,面临一个大数据的关键问题,它们并不是在大数据热的时候才成立,怎么让传统的应用搬过来?上面谈到统一SQL的能力,怎么做到?
不得不说,在大数据业务应用中,大数据的标准SQL支持能力,是大数据业务应用中的一块短板。未来大数据替代传统数据库的功能,是企业数据处理架构发展的一个趋势。但是大数据要想替代传统数据库,那么就需要支持标准的SQL语言,这样才能确保上层的业务能够方便快捷的开发和应用。
华为开发了标准SQL On Hadoop技术引擎,全面支持标准SQL2003的语法,真正支持TPC-DS测试(无需修改任何一行测试脚本),并在性能上超越Spark SQL10倍,这样才能保证企业既有的应用能够无缝平滑迁移。
朱照生说,根据它参加的金融、平安城市的测试来看,目前只有华为一家提供的SQL On Hadoop完全不用修改代码脚本。
华为的大数据软件是基于Apache开源社区版本进行优化后的商业发行版,同时华为也积极将自己的智慧回馈给社区。据统计,华为2015年在Hadoop社区的贡献排名全球第二,在Spark社区的贡献排名全球第四,在全球IT设备供应商中均排名第一。今年6月,华为开源的CarbonData,全票通过Apache社区的评选,进入Apache开源社区。这也是全球第一个由中国人提出,被Apache社区接纳的开源组件。
截至2015年,华为大数据已经交付给200多个客户、500多个项目。华为希望把大数据产品作为一层土壤,上面和各行各业聚合,百花齐放与千万家合作伙伴一起服务于百行百业。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。