越来越多的企业使用云来加速数字化转型,不论是公有云还是私有云的采用量都在增加。根据RightScale的调查研究显示:
1.多云是企业的首选策略,81%的企业采用多个云来承载自己的业务。
2.96%的受访者已经使用了云。92%的受访者使用了公有云,75%的受访者使用了私有云。
3.2018年更多企业正在优先考虑公有云,并将公有云是为首要选择。这一数字从2017年的29%上升到2018年的38%。
4.企业有40%的工作负载运行在公有云上,39%的工作负载运行在私有云上。而私有云的这部分可能包含了传统虚拟化环境或其他类云环境。
5.云费用的浪费使优化成本成为最高优先级,研究显示用户发现低估了云上资源的浪费程度。受访者认为有30%的浪费,而实际可能超过35%。
虽然从调研结果显示用户对公有云的采用越来越多,但是从国内现状来看,对于真正的企业用户,并没有将很多的重要工作负载迁移到云端。云上更多的应用则是新业务/新应用,我们称之为“试点项目”。
所以在国内云的采用阶段还是处于较早期,虽然说起步晚可以借鉴成功经验,但是从接触到的用户来看,大家对于云的使用仍然存在很多不恰当的方式,这也是产生云资源和成本浪费的重要原因。同时就导致了上云后并没有产生成本上的明显下降,ROI不符合预期,甚至对云产生怀疑。
通过为多个用户提供的云费用优化服务后发现,大家使用公有云的方式仍然沿袭了传统数据中心/VMware虚拟化环境的资源使用方式,存在资源申请过多/超配,资源长期使用率低等情况,导致云上的费用产生了很多浪费。
ChinaMSP认为企业要想实现云上费用的真正节省,需要按照云的方式来使用云:即遵循按需使用、按量计价的方式。
首先就是要为资源分配足够的标签(Tag)。为所有云上资源打上丰富的标签,能够帮助运维人员理解每台资源的业务属性,提供给云费用优化平台更多的维度来进行费用分析,并能充分利用自动化工具来执行更灵活的资源编排。比如按成本中心/产品线/业务组,按开发/测试/生产,按应用名,按所有者打上各自的标签。
其次就是清理僵尸资源。在传统虚拟化环境中,由于企业需要一次性投入硬件与虚拟化平台,所以在日常的使用中一般都会尽量多的使用资源,超配资源的情况屡屡发生,对于公有云资源来说,只要被开启,就按照时间收费。因此要定期清理闲置/极低使用率的EC2,未挂载的EBS,重复备份的的快照,未使用的弹性IP。
第三,调整资源规格。资源规格需要跟随业务发生变化,要在监控使用率的情况下,结合业务需求选择合适的实例系列、及时更新到最新一代实例,并进行负载感知的资源规格自动升、降配。
ChinaMSP服务过的某互联网金融客户在AWS上CPU使用率低于30%的EC2占比高达87%(处于0-10%的EC2约占60%,10-20%的约占17%,20-30%的约占10%)。因此可以根据云费用分析平台输出的详细数据,结合业务情况,优先优化CPU使用率低于10%的EC2,考虑进行降配或关停。
以一台c4.2xlarge规格的EC2为例,如果是开发及测试环境,假设每天10小时,每周6天使用,则工作时间为60/168h,占比为不到36%,以全年为时间度量,再算上法定假日和年休假,则实际工作时间占比约为32%,如果能够在不工作的时候将设备暂停,则单台EC2成本可从3400美元降低到1000美元左右。
第四,调整存储资源使用。积极使用不同的存储服务来存储不同类型的数据,如冷数据、热数据分别使用不同服务,定期分析、调整,同时尽量聚合存储资源,利用阶梯计价来降低成本。
第五,调整采购价格模型。公有云不只是按需付费,也可以根据情况用较低的价格预采购资源,或者使用一些价格极低的竞价资源,因此用户要充分利用按需实例、预留实例、竞价实例来优化成本结构。
第六,优化出向流量。公有云仅对出向流量收费,对于静态内容较多的,考虑使用CDN等网络优化服务;对于同在公有云上的不同应用数据交换,使用内网地址等措施降低出向带宽消耗。
第七,要把资源利用率发挥到极致。云的按需属性给予了用户很高的灵活性,同时资源的使用,尤其是计算资源,对于大多数场景下是存在使用率的波峰波谷与周期性,而且对于业务连续性的要求并不高,对于这些资源,就可以对其执行根据工作时间执行启停、升降配等操作。
第八,优化应用架构。根据业务发展与技术需要,通过使用容器,微服务等技术,调整数据库架构来使用更好、更便宜的IaaS资源。
对于传统IT来说,云计算是一种范式转换(Paradigm Shift),因此要以全新的思维方式去考虑如何使用云,而不是用传统的方式去看,去用。
ChinaMSP作为新一代云管理服务商(CloudMSP),致力于为用户打造舒适云途,旗下CostVision云费用管理平台,已经帮助互联网金融、电力、广电、零售等行业用户建立起费用优化流程、给予费用优化建议,甚至自动执行优化动作,为用户成功节约数百万美元的云上开销。
好文章,需要你的鼓励
周一AWS美东数据中心DNS故障导致数百万用户和上千家企业断网,Reddit、Snapchat、银行和游戏平台均受影响。专家认为这凸显了冗余备份的重要性,CIO需要根据业务关键性进行风险评估,优先保护核心系统。单一供应商策略仍可行,但需通过多区域部署分散风险,建立故障转移计划。金融、医疗等高风险行业需更高冗余级别。
上海AI实验室等机构联合提出FrameThinker框架,革命性地改变了AI处理长视频的方式。该系统采用"侦探式"多轮推理,先快速扫描全视频获得概览,再有针对性地深入分析关键片段。通过两阶段训练和认知一致性验证,FrameThinker在多个视频理解基准测试中准确率平均提升10.4%,计算效率提高20倍以上,为AI视频理解领域带来突破性进展。
英国政府发布新的反勒索软件指导文件,旨在解决供应链安全薄弱环节。该指南与新加坡当局联合制定,帮助组织识别供应链问题并采取实际措施检查供应商安全性。英国国家网络安全中心过去一年处理了204起"国家重大"网络安全事件。指南强调选择安全可靠的供应商、加强合同网络安全条款、进行独立审计等措施,以提升供应链韧性和防范网络攻击。
复旦大学团队创建MedQ-Bench基准,首次系统评估AI模型医学影像质量评估能力。研究覆盖五大成像模式,设计感知-推理双层评估体系,意外发现医学专用AI表现不如通用AI。结果显示最佳AI模型准确率仅68.97%,远低于人类专家82.50%,揭示了AI在医学影像质控应用中的现实挑战和改进方向。