10月11日,在2018华为全联接大会上,华为云正式商用发布全球首款基于Kubernetes的Serverless容器服务——CCI(Cloud Container Instance),践行“普惠AI,让客户用得起、用得好、用得放心”的理念,致力于打造AI场景下最强算力底座。
在全联接大会上,华为轮值董事长徐直军重磅发布了华为的AI战略和全栈解决方案,同时发布了两款AI芯片,华为昇腾910和310,重点提出对当前AI行业现状作出改变:第一,“训练模型从需要数日、数月到只需要几分钟、几秒钟”,即让用户享受高性能带来的极致体验;第二,“算力稀缺且昂贵变得充裕且经济”,大幅降低AI计算成本,让算力具有普遍可获得性;第三,“AI无处不在,任何场景适用,而且尊重和保护用户隐私“,意在打造全场景安全可信的AI计算平台。
在CCI商用发布会现场,华为云容器服务高级产品经理讲道:“随着大数据、人工智能等科学计算领域的快速发展,企业对计算和网络加速能力的需求日益增长,华为云推出的CCI商用产品,通过Kata技术提供安全的运行环境,充分保护客户隐私;通过使用iSula容器、对NUMA架构裸金属、IB高速网络等软硬件优化,提供超高性能的算力,性能比通用方案提升3-5倍以上;更关键的是,CCI全面支持华为在全联接大会上最新发布Ascend昇腾系列910、310AI芯片,可提供充裕且经济的AI计算能力,真正实现普惠AI,让各行各业都能用得起,用得好,用得放心!”
华为云容器实例服务(CCI),是业界首个商用的基于Kubernetes编排引擎的Serverless容器服务,能提供面向通用场景的CPU容器实例和面向AI计算场景的AI容器实例,同时在运维效率、计算性能、计算成本、产品成熟度和开放性上具备领先优势。
目前CCI(Cloud Container Instance)容器服务已在华为云正式商用,您可以访问以下地址进行体验:https://www.huaweicloud.com/product/cci.html
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。