如何通过拨测和融合流量管理业务实践,实现智取流量、高效增长?
摘要:在飞速发展的互联网信息化时代下,如何通过真实、海量的数据打造一个集成本、质量、效率于一体的融合流量管理平台,成了各行各业的关注焦点。本文通过‘拨测’与‘融合流量管理’两个维度,来分享vivo在流量管理领域的一些实践和探索。
作者:互联网运维技术保障团队-Mo Han、Zhou Jianhua
在飞速发展的互联网信息化时代下,抓住并充分利用“流量”将为业务增长带来“泼天”富贵,已成为共识。如何通过真实、海量的数据打造一个集成本、质量、效率于一体的融合流量管理平台,也成了各行各业的关注焦点,本文通过”拨测“与“融合流量管理”两个维度,来分享vivo在流量管理领域的一些实践和探索。
本文为2025年 vivo 开发者大会互联网技术专场分享内容之一,在公众号对话框回复【2025VDC】获取 2025VDC 互联网技术会场议题相关资料。
1分钟看图掌握核心观点👇
图1 VS 图2,您更倾向于哪张图来辅助理解全文呢?
一、背景
在飞速发展的互联网信息化时代下,抓住并充分利用“流量”将为业务增长带来“泼天”富贵,已成为共识。如何通过真实、海量的数据打造一个集成本、质量、效率于一体的融合流量管理平台,也成了各行各业的关注焦点,本文通过“拨测”与“融合流量管理”两个维度,来分享vivo在流量管理领域的一些实践和探索。
二、全球拨测
2.1 什么是拨测
简单来说,拨测就是一套模拟真实用户行为,主动进行健康检查和性能测量的旁路监控系统。 它就像我们派出去的无数“观察者”,通过这些“观察者”,我们主要可以实现三大目标:
一是性能监控:它可以模拟用户对某个网络接口或者网址,发起主动探测,检测网络的延迟、丢包,错误,及时发现网络风险和故障。
二是产品优化:从用户视角去对比不同版本的性能差异,为产品迭代提供数据支持。
三是可用性监控:模拟用户使用业务场景和完整流程,评估业务的真实质量,及时发现业务可用性问题。
2.2 vivo拨测平台介绍
在vivo,拨测的核心使命,就是为所有业务和产品高可用保驾护航,网络性能监控、业务可用性监控,产品优化分析、这是基础能力,确保我们的服务稳定可靠。
在这基础能力之上以及结合本次分享的主题,我们孵化了另外一种场景-“网络调度检测”,我们会持续地对CDN、机房、运营商这些基础链路进行探测和分析,一旦发现问题,就可以基于拨测数据动态调整网络策略,以实现流量和故障智能调度目的。
2.3 vivo拨测的原理介绍
了解了vivo自有节点规模后,那么拨测如何工作的?下面这张图清晰展示了vivo拨测系统的基本工作原理,它主要分为三步:
第一步,下发执行探测任务。
平台会向分布在全球的边缘探测节点,下发探测指令,比如去访问某个网址,或者访问某一接口,也或者下载某个APP等。
第二步,数据采集与分析。
节点在执行任务时,会收集网络丢包率,响应时间、可用性等性能数据,并进行实时分析。
第三步,阈值和可用性告警。
如果发现探测结果超出了我们设定的阈值,比如访问超时、不可用,检测告警系统就会立即触发告警,并可以联动 智能调度策略 进行自动处理,比如切换线路,切换灾备机房,切换运营商等。
2.4 vivo拨测能力介绍-采集侧
为了管理如此庞大的节点网络并执行复杂的任务,我们的拨测平台构建哪些技术能力呢?大家可以看下面这张架构图,
首先、在采集侧,我们具备了从底层的DNS解析、TCP建联,到上层的HTTP可用性、私有协议,再到网页首屏、流媒体等全方位的用户体验检测能力。
同时,我们对执行拨测节点的耗电,网络环境,执行策略,配置管控都做了精细化管理 保障采集的拨测数据稳定、可信、可分析,可度量。
2.5 vivo拨测能力介绍-平台侧
在平台侧,我们同样具备任务管理、配置管理、节点管理和告警能力。可以实现多维度的任务下发,比如可以按国家、省份、城市、地区、运营商、机型,网络等维度下发。
同时,我们也具备了劫持,CDN故障等场景的检测告警能力、以及异常快照、链路分析等故障分析能力 确保收集到的拨测数据得到充分的应用,同时经过大数据分析和AI能力加持,做到业务问题 一分钟发现、即时告警。
vivo拨测平台免费体验地址:https://dial.vivo.com.cn
2.6 拨测如何支撑智能流量调度
如此海量的拨测数据,究竟是如何支撑流量调度的呢?
下面这张图清晰展示了其工作原理。
首先,是“输入”环节。
IP元数据管理平台会将公网服务IP信息同步到拨测平台,其中IP元数据包含6大关键维度:
IP信息
归属运营
归属业务
归属机房
归属集群
归属IDC
其次,是“执行”环节。
这些带有元数据的服务公网IP信息,会生成具体的“IP任务”,通过“任务调度”系统,下发给我们遍布全球的“边缘探测节点”,执行探测任务。
接着,是数据分析处理环节。
