在当今的IT环境中,应用无疑处在最核心的位置之一。我们可以最直观的看到,在刚刚过去的2015年“双十一”电商促销中,天猫超过900亿元人民币交易额的背后,实际就是一连串应用把买家、卖家、平台乃至银行联系在一起。通过F5公司关于亚太区应用使用形态的调查中可以知道,现在一个企业或机构平均运行的应用以超过了200个。而我们每个人手机、电脑以及其他设备中正在运行的应用至少也是数以十计。是以,当我们经历了软件即服务、存储即服务、基础架构即服务……以来,F5认为应用交付,也到了从技术、解决方案向服务转型的最佳时机。
不同以往,在当今这个快速发展的IT环境,“按需部署”早已成为企业的常态需求。无论企业还是个人,都希望自己的应用可以随时可用。如果一个企业无法满足用户的应用需求,损失用户乃至损失利润都将不可避免。另一方面,由于新技术的快速更迭,如电信、金融等等企业需要随时保持自己的基础架构始终灵活,从而能够更快的部署应用,提升自己的核心竞争力。这就更将提升应用交付与应用管理的复杂程度。
F5认为,随着需求与IT大环境“双重复杂度”的提升,CIO们已经不能从单纯的一个维度、诸如安全、SSL、接入控制等方面考虑应用环境。举例而言,我们将一位乘客从A城市飞行到B城市比作一次应用的交付。10几年前乘客的需求只是简单的安全、尽可能快速不晚点抵达即可。而今天,乘客会考量订票流程是否顺畅、舱位是否舒适、机上饮食是否合理、甚至机上娱乐系统是不是丰富……这也正是现在IT界在部署应用时面临的现状,环境的复杂和需求的复杂都发生了剧变。所以应用交付也应当考虑全局,从技术向服务转型,以帮助用户应对现在的局面。
F5的应用服务由一系列技术构成,旨在保障应用高速、高可用切始终安全。应用服务并非应用本身,而是一套运行在应用所部属环境下的服务。应用服务包含了一系列不同领域的技术:包括F5一直广受赞誉的负载均衡技术、应用安全解决方案、移动应用解决方案、高可用高性能解决方案以及身份管理解决方案等近些年F5一直发力的领域。应用服务可以被看做为一个专注于应用逻辑,具备高性能、高扩展性,可以链接网络层与应用层的智能平台。
在F5看来,未来企业以及用户对应用的依赖性会持续上涨。对于企业而言,定制化、且符合自身商业模式的应用会更加受到企业级用户的青睐。这就意味这单一产品或解决方案没办法从根本上满足用户的需求。作为长期在应用交付领域领先的F5公司认为,将应用交付作为一个灵活、智能、同样可定制的服务提供给用户,将是这个行业的发展大方向。甚至可以说,应用交付从技术向服务转型的时机,已经到来。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。