电商资讯网,新鲜资讯一网打尽!

最新更新文章排行

登录 退出

中国电子商务网

当前位置: 首页 > 科技

2025 VDC互联网技术分会场:多专家分享业务赋能实践效果

时间:2025-10-11人气:作者: yinxin

2025年度vivo开发者大会于10月10日成功举办。此次大会延续了“同心•同行”主题,开设主会场及11大分会场。在互联网技术分会场上,多位vivo专家针对拨测&融合流量管理、微服务架构与Dubbo性能优化、全链路多版本环境落地、GPU容器与AI训练平台等方面分享了vivo最新的探索和实践成果,同广大线上与会者共议最新趋势下的业务智胜之道。

智驱流量,效赢增长

在飞速发展的互联网信息化时代下,抓住并充分利用“流量”将为业务增长带来“泼天”富贵,已成为共识。如何通过真实、海量的数据为精细化流量管理提供坚实的数据基础,并基于这些数据,打造一个集成本、质量、效率于一体的融合流量管理平台,进一步为业务赋能,也成了各行各业的关注焦点。

vivo互联网拨测监控负责人 莫瀚

vivo互联网拨测监控负责人莫瀚详细介绍了vivo拨测的现状、能力及如何支持流量调度。他指出,拨测在vivo的核心使命是为所有业务和产品的高可用保驾护航。在实践中,通过构建一个覆盖全球,以自有真实手机作为拨测载体的探测网络,成功为智能调度提供了数据基石。在此之上,通过输入,执行,处理,应用的闭环流程,vivo将原本被动,依赖经验,效率低下且高风险的人工调度动作,升级成为以数据驱动的智能主动调度体系,不仅释放了运维人力,效率和可靠性方面更得到极大提升。

vivo互联网运维平台研发负责人 周建华

在数据决策基石构建之后,vivo互联网运维平台研发负责人周建华分享了如何在基石上搭建一座‘融合流量管理’的大厦。和很多公司一样,vivo采用了私有/公有云结合的混合云架构。虽然该架构十分典型,但也会带来复杂难管理、成本压力高、质量挑战大、运维效率低和安全风险高五大核心挑战。他表示,vivo通过打造融合流量管理平台,实现了统一纳管、智能决策、安全防护和监控自动化,不仅运维效率大幅提升,用户体验也得到改善。同时他还透露,未来将聚焦AI驱动的深度优化、流量管理的持续深化、打通网络质量和业务指标的关联,进行持续探索。

微服务架构探索,Dubbo性能优化

随着用户规模的扩大和业务范围的全球化,vivo启动微服务化以赋能业务增长,通过全网治理,收敛Dubbo作为Java技术栈RPC框架。面对业务规模的快速扩张,为保障系统的高性能与稳定性,vivo在Dubbo路由与负载均衡的性能优化方面进行了多方位的实践。

针对Dubbo路由的优化与扩展,vivo互联网Java中间件架构师张振威在会上介绍,vivo首先针对多机房场景通过建设就近路由能力,显著降低了RT敏感性业务的请求延迟,增强了业务的可用性与多机房容灾能力;其次针对路由链,从精简链路和引入位图缓存结构两大方向进行了系统性优化,大幅提升路由执行效率。

vivo互联网Java中间件架构师 张振威

在Dubbo的负载均衡方面,vivo基于社区版本构建了vivo自适应负载均衡能力,重点优化了P2C算法并引入权重计算单元,实现了负载均衡器基于提供方负载进行流量自适应与平滑调度的能力,最终显著提升服务质量与容量,同时实现降本增效的目标。

张振威还表示,未来将致力于推进Dubbo与开源社区版本对齐,同时构建跨语言的统一微服务治理平台。为此,vivo计划建设一套标准化的、语言无关的微服务治理平台。该平台将提供统一的服务发现、流量监控、流量治理以及服务观测能力。真正实现“多语言开发,一体化治理”的目标,以降低未来的系统复杂性与运维成本。

全链路多版本环境管理,效率与并发的飞跃

在日常开发中,“环境”问题往往是开发工作效率提升的最大瓶颈之一。对此,vivo互联网DevOps架构师吴清华在会上分享了vivo的实践案例,以往需耗时2人天的环境准备工作,现在只需一键触发分钟级自动完成,受到了与会者高度关注。

日常开发所需要面对的“环境”问题主要集中在:环境不稳定、测试环境混乱、环境占用严重、资源利用率极低等方面,且这些问题并非个案。吴清华介绍,传统的环境管理方式已经走到尽头,必须找到一种全新的方法,能够让多个版本像“平行宇宙”一样,安全、隔离、高效地同步测试与发布。

vivo互联网DevOps架构师 吴清华

经过反复思考和探讨,vivo采用了“全链路多版本环境管理”理念,并将其凝练成三把关键“利刃”:第一是「全链路能力」,确保版本所依赖的所有组件和整条链路都能一键拉起、即时就绪;第二是「多版本并行」,让每个版本都在自己的“沙箱”里运行,彻底告别资源抢夺,终结“抢环境”的战争;第三是「环境自动化管理」,从环境搭建、弹性伸缩到闲置回收,全部自动完成,实现全生命周期的自动化,真正实现降本增效。

不仅如此,吴清华还介绍了全链路多版本环境管理,通过环境编排、弹性资源和流量隔离三大关键技术构筑坚固的铁三角,为vivo带来了巨大的收益。未来,将采用研效环境标准化和资源成本高效化双轨并行策略,建立更高效、经济、可靠的研发环境体系,并打造更先进的环境管理体系。

GPU容器与AI训练,让业务更稳定更高效

GPU平台是大模型时代的重要基础设施,vivo的GPU平台架构由物理层、容器平台层和AI工程层组成,支撑vivo的智能计算业务。

vivo互联网容器架构师 陈瀚

vivo互联网容器架构师陈瀚表示,容器平台在大规模GPU集群,通过架构与性能优化、自动化运维等稳定性建设措施,为AI平台提供了坚实的算力底座。容器平台在多维度探索降本提效解决方案,提升整体利用率,降低业务成本。其中单卡维度的自研虚拟化技术实现多容器无干扰共享,做到"一卡三用"。在单服务维度的GPU弹性伸缩方案自动应对负载变化,减少闲置与运维负担。在多服务维度的训推潮汐部署方案实现资源分时复用,缓解训练资源短缺。在多机多卡维度通过RDMA容器降低跨节点通信时延。

vivo Al工程架构师刘东阳则表示,VTraining训练平台是在容器能力之上构建,支撑vivo手机的蓝心小V等核心产品的大模型训练业务。在大规模训练稳定性实践中,通过减少基础设施高频故障、完善任务故障处置流程两大措施,成功实现了机器每日故障率从2%降低到1‰的突破,千卡任务有效训练时长从60%提升到99%,达到行业一流水平。平台在GPU利用率提升实践中,通过低优任务、训推潮汐部署、GPU虚拟化等策略,深度适配差异化业务场景,实现了资源的高效复用。

vivo Al工程架构师 刘东阳

未来,容器平台将重点建设多集群调度、在离线GPU混部、GPU资源池化等能力,AI训练平台则聚焦大模型训练稳定性、训练全流程支撑与GPU资源精细化运营。致力于让vivo智能计算业务更加稳定、资源利用更加高效。


标签:
免责声明:

热门话题