WebSocket:新手如何秒懂服务器实时推送的核心协议?
摘要:初次接触 WebSocket 的人,都会问同样的问题:我们已经有了 HTTP 协议,为什么还需要另一个协议?它能带来什么好处?
一、引言
初次接触 WebSocket 的人,都会问同样的问题:我们已经有了 HTTP 协议,为什么还需要另一个协议?它能带来什么好处?
在我们之前的教程中,我们在树莓派 Pico 上用 HTML 开发了一个基于 HTTP 协议的网页服务器,以此控制树莓派 Pico 的硬件引脚:
https://freakstudio.cn/node/019bd0cf-8ca7-7e97-83fe-0b29d55c6f5c
这个方式非常简单,但缺点也非常明显:每次提交表单都需要完成一次完整的网络往返(也就是页面刷新),导致存在明显延迟,这种往返通信对用户体验很不友好,延迟会导致用户重复点击,或是感觉界面无响应。
HTTP 协议的核心模式是请求 - 响应:浏览器发起请求,服务器处理后返回响应。它属于半双工通信,同一时间只能单向传输数据,每次通信都需要重新建立握手连接。
对很多嵌入式项目来说,这种协议完全够用:比如用浏览器配置开发板参数,之后开发板独立运行一段时间,但是考虑下面两个情况:
温湿度实时记录和显示:如果使用 HTTP,浏览器必须不断轮询(例如每隔 1 秒请求一次数据),服务器才能返回最新的温湿度值;这样会带来几个问题:
请求频率高,浪费带宽和 MCU 资源;
数据存在延迟(取决于轮询间隔);
设备功耗增加(频繁网络通信)。
在线网络聊天室:如果使用 HTTP,客户端需要不断轮询服务器是否有新消息(例如每几百毫秒请求一次)。这样不仅效率低,还会造成:
大量无效请求(大部分时候没有新消息);
服务器压力增大;
消息延迟明显,体验差。
你可以看到,在需要服务器可以在有新消息时立即推送给所有客户端的情况下,使用 HTTP 通信并不友好。
那么,我们实际上可以选择另一种更优的方案:在浏览器与服务器之间建立并保持一个长连接,实现全双工通信。
在这种模式下,客户端和服务器都可以在任意时刻主动发送数据,不再受限于 HTTP “请求 - 响应”的单向通信机制,从而避免频繁轮询带来的性能浪费和延迟问题。
这种通信方式特别适合需要实时数据更新和即时交互反馈的场景,例如实时监控、在线聊天、远程控制等。
而实现这一能力的核心协议,就是 WebSocket。
客户端(如浏览器)向服务器发起连接请求,经一次 HTTP 握手完成协议升级后,建立持久全双工长连接。
二、WebSocket 协议介绍
2.1 基本概念
它于 2008 年诞生,2011 年成为国际标准:
WebSocket 最初在 HTML5 规范中以 TCPConnection 为名,作为基于 TCP 的套接字 API 的占位方案,用于解决浏览器端原生 TCP 通信的需求。
在 WebSocket 出现前,浏览器端端口 80 的全双工通信依赖 Comet 通道 技术,但存在两大核心缺陷:
实现复杂度高,部署与维护成本大;
因 TCP 三次握手、HTTP 请求头的额外开销,对小消息场景的传输效率极低。
2008 年 6 月,Michael Carter 牵头系列技术讨论,产出了首个名为「WebSocket」的协议版本,核心目标是在不破坏网络安全假设的前提下,解决 Comet 技术的痛点;
随后 Ian Hickson 与 Michael Carter 合作确定 WebSocket 这一名称,由 Ian Hickson 正式写入 HTML5 规范。
目前所有浏览器均已原生支持,无需额外插件,包括 Google Chrome、Firefox、Microsoft Edge、Internet Explorer、Safari 和 Opera,其属于真正的双向平等对话,支持服务器主动向客户端推送信息,也支持客户端主动向服务器发消息,属于主流的服务器推送技术之一。
其技术特点包括:
基于 TCP 协议 构建,服务器端实现逻辑简单,适配性强。
完美兼容 HTTP 生态,默认共用 80(ws)、443(wss)端口;
握手阶段采用 HTTP 协议,不易被网络屏蔽,可顺利通过各类 HTTP 代理服务器。
数据格式轻量化,通信开销小、效率高;
支持文本、二进制数据双向传输,覆盖文字、文件、音视频等各类数据场景。
无同源限制,客户端可与任意服务器建立连接,突破浏览器同源策略限制;
协议标识符:ws(未加密)、wss(加密,类似 HTTPS),通信地址遵循 URL 规范,示例:ws://example.com:80/some/path。
一句话概括就是,WebSocket 以TCP 为基础、HTTP 兼容为桥梁、双向实时为核心,兼具低延迟、高灵活、跨域自由的特点,完美适配浏览器与服务器的实时交互场景。
2.2 WebSocket 的工作流程
可以分为以下三个阶段:
握手阶段:HTTP 协议升级,建立持久连接(图中红色流程)
客户端发起 HTTP 升级请求:向服务器发送携带 Upgrade: websocket 头、随机密钥 Sec-WebSocket-Key 的 HTTP 请求,申请将当前 HTTP 连接升级为 WebSocket 连接。
服务器响应握手确认:通过约定算法生成响应密钥 Sec-WebSocket-Accept,返回给客户端完成协议升级。
连接正式建立:客户端验证响应密钥通过后,持久 TCP 长连接生效,图中标注 connection opened(连接已打开),握手阶段完成。
数据传输阶段:全双工双向实时通信(图中蓝色流程)
持久长连接生效:握手完成后,客户端与服务器维持 open and persistent connection(开放且持久的连接),全程无需重复建立连接。
双向实时消息传输:双方可随时主动向对方发送文本 / 二进制数据,实现真正的全双工通信,服务器可主动推送数据,彻底摆脱传统 HTTP 的客户端轮询限制。
心跳保活机制:双方通过 Ping(心跳请求)/Pong(心跳响应)控制帧周期性交互,维持连接存活,避免长连接因闲置被网络设备断开。
关闭阶段:优雅终止连接(图中黑色流程)
任意一方发起关闭请求:客户端或服务器可主动发送 Close 控制帧,申请关闭 WebSocket 连接。
双向确认关闭:对方收到关闭请求后,返回 Close 响应帧,完成双向确认。
连接正式关闭:双方确认后,彻底断开 TCP 长连接,图中标注 connection closed(连接已关闭),通信流程结束。
2.3 WebSocket 的数据帧格式
2.3.1 数据帧概述
WebSocket 在完成握手建立长连接后,所有通信都以「数据帧(Frame)」为最小传输单位,无论是业务数据还是连接控制指令,都封装在二进制帧中传输:
WebSocket 数据帧是二进制格式,整体分为帧头(Header)和有效载荷(Payload)两大部分,其中帧头又分为固定头部(前 2 字节 / 16bit) 和可变扩展头部(根据长度、掩码动态变化),结构如下:
其中:
帧头:包含 FIN、Opcode、Masked、Payload length 等核心字段,用于控制帧的解析与类型。
FIN 字段(1bit,偏移 0):标记当前帧是否为完整消息的最后一帧,用于消息分片。
取值规则:
1:最后一帧,代表消息传输完成;
0:分片帧,代表消息未结束,后续还有数据帧。
对应分片机制:
非分片消息:单帧,FIN=1 且 Opcode≠0;
分片消息:首帧 FIN=0、Opcode≠0(定义消息类型),中间帧 FIN=0、Opcode=0(延续帧),最后一帧 FIN=1、Opcode=0(延续帧,标记结束)。
支持大消息分片传输,适合内存有限的嵌入式设备(如树莓派 Pico W),无需缓存完整消息即可边生成边发送。
RSV1/RSV2/RSV3 字段(各 1bit,偏移 1-3):
保留位,用于协议扩展,默认必须为 0,仅当客户端与服务器在握手阶段协商了扩展(如压缩)时,才会使用非 0 值。
对应压缩扩展:permessage-deflate 压缩扩展会在握手时通过 Sec-WebSocket-Extensions: permessage-deflate 协商,启用后数据帧的 RSV1=1,表示 payload 为压缩数据。
Opcode 字段(4bit,偏移 4-7):定义帧的类型,决定 payload 的解析方式,分为非控制帧(数据帧) 和控制帧两大类。
Masked 字段(1bit,偏移 8):
作用:标记帧是否经过掩码处理。
强制规则:
客户端 → 服务器的所有帧:Masked必须为1(必须做掩码);
服务器 → 客户端的所有帧:Masked必须为0(禁止做掩码)。
掩码原理:用 32bit(4 字节)的随机 Masking key,对 payload 的每个字节做 XOR 运算。
Payload length 字段(7/7+16/7+64bit,偏移 9 开始):
作用:表示有效载荷(扩展数据 + 应用数据)的字节长度
0-125:直接用 7bit 表示长度,适合 ≤125 字节的小消息;
126:后续 16bit(2 字节)表示长度,适合 126-65535 字节的中等消息;
127:后续 64bit(8 字节)表示长度,适合 > 65535 字节的大消息(最高位必须为 0,无符号)。
字节序:大端(big-endian),无符号数。
优势:小消息用短头,大消息用长头,最大化节省带宽。
Masking key 字段(32bit,可选):
仅当 Masked=1 时存在,是 4 字节的随机数,客户端每次发帧都需生成新的随机密钥,不可固定。
作用:配合 Masked 字段,完成客户端到服务器的掩码处理。
有效载荷:实际传输的业务数据(如聊天消息、传感器数据、控制指令):
分为两部分:
扩展数据:仅协商了扩展(如压缩)时存在,长度由扩展定义;
应用数据:实际的业务数据,如聊天消息、传感器数据、控制指令。
总长度 = Payload length 字段的值。
2.3.2 Opcode 字段分类和含义
Opcode 字段分类和含义如下:
其中,控制帧核心特性为不可分片,payload 最大长度 125 字节,优先级高于数据帧,用于管理连接状态。
2.3.3 控制帧详解
控制帧用于管理连接状态,Opcode 为 0x08-0x0F,不可分片,payload 最大 125 字节:
2.3.4 分片传输
WebSocket 支持将一个大消息拆分为多个帧(分片)传输,核心规则如下:
非分片消息:单帧完成传输,FIN=1 且 Opcode≠0,适合小消息。
分片消息:≥2 帧完成传输,规则:
首帧:FIN=0,Opcode≠0(定义消息类型,如文本 / 二进制);
中间帧:FIN=0,Opcode=0(延续帧,继承首帧的消息类型);
最后一帧:FIN=1,Opcode=0(延续帧,标记消息结束)。
核心价值:
适配嵌入式设备(如 Pico W):内存有限,无需缓存完整大消息,边生成边分片发送;
支持流式传输:如实时音视频,边采集边发送;
避免大消息阻塞连接:可穿插控制帧(Ping/Pong),保证连接存活。
2.3.5 压缩扩展
WebSocket 的标准扩展(RFC 7692),用 DEFLATE 算法压缩数据消息,减少带宽占用,提升传输效率。
在握手阶段,客户端与服务器通过 Sec-WebSocket-Extensions: permessage-deflate 头协商启用压缩。
启用压缩后,数据消息的第一个帧 RSV1=1,表示 payload 为压缩数据,接收方需解压。
2.4 WebSocket 的接口
WebSocket 接口是客户端(如浏览器)与服务器建立、管理和终止 WebSocket 连接的核心工具,下面是基于 JavaScript 实现,提供了构造函数、方法、事件、属性和常量五大类接口:
WebSocket 接口按功能可分为五大类,各类接口相互配合,构成完整的通信控制逻辑:
构造函数(Constructor):核心用于初始化 WebSocket 实例,发起与服务器的连接握手,是建立 WebSocket 通信的起点。需传入目标 URL 和可选的子协议参数,URL 需遵循特定格式规范,否则会触发语法错误。
方法(Method):提供主动操作连接的能力,主要包括发送数据(send)和关闭连接(close)两个核心方法。发送数据时需注意数据格式和连接状态,关闭连接时需指定合法的状态码和关闭原因,避免异常。
事件(Event):用于监听 WebSocket 连接的各类状态变化和数据事件,是被动响应连接状态的核心方式。包括连接成功(open)、接收数据(message)、连接关闭(close)、连接错误(error)四种核心事件,可通过绑定事件回调函数,实现对连接状态的实时监控和业务逻辑处理。
属性(Attribute):用于配置或获取 WebSocket 连接的相关参数,主要包括二进制数据接收类型(binaryType),可根据业务需求修改,适配不同的二进制数据处理场景。
只读属性(Read-only attribute):用于获取 WebSocket 连接的不可修改状态和参数,如连接 URL、待发送数据字节数、协商的子协议、连接状态等,为开发调试和状态判断提供依据。
常量(Constant):定义了 WebSocket 连接的四种核心状态,对应不同的通信阶段,可通过只读属性 readyState 获取当前状态,用于判断连接是否可收发数据、是否处于关闭过程等。
需要注意的是,所有接口的使用都依赖于 WebSocket 连接的当前状态(readyState),例如发送数据(send)仅能在连接处于“已连接”(OPEN)状态时调用,否则会触发异常;关闭连接(close)在不同状态下的行为也不同,需严格遵循接口规范。
三、async_websocket_client 库介绍
3.1 基本概念
这是一个专为 MicroPython 设计的轻量级异步 WebSocket 客户端库,实现了 WebSocket 协议(RFC 6455)的核心功能,支持 ws://(明文)和 wss://(TLS 加密)连接:
源码地址:https://pypi.org/project/micropython-async-websocket-client
提供了下面的能力:
其核心类是:AsyncWebsocketClient
其中初始化方法入口参数为:
def __init__(self, ms_delay_for_read: int = 5)
ms_delay_for_read:非阻塞 socket 读取的轮询间隔(毫秒),硬件性能越强可设越小,默认 5ms 适配多数 MCU。
核心方法如下:
常用常量定义如下:
操作码(Opcodes):OP_TEXT(文本帧)、OP_BYTES(二进制帧)、OP_PING/OP_PONG(心跳)、OP_CLOSE(关闭)
关闭码(Close Codes):CLOSE_OK(正常关闭)、CLOSE_GOING_AWAY(客户端断开)、CLOSE_TOO_BIG(消息过大)等,符合 RFC 6455 标准
3.2 快速测试
这里,我们使用树莓派 Pico2w 开发板进行测试,借助外部网站:websocket-tester
这是 See-Tool 工具箱中「网络协议」分类下的一款 WebSocket 在线测试工具,可输入 wss://ws.postman-echo.com/raw 等服务地址建立连接,支持手动发送消息或定时自动发包,并在右侧调试面板实时查看收发日志与 JSON 解析,适合接口联调、实时通信排错和 WebSocket 连通性验证。
地址是:https://see-tool.com/websocket-tester
这是基于 Postman 官方 WebSocket 回显服务器的标准测试场景,核心逻辑是 「客户端发送什么内容,服务器就原样回显什么内容。
这里,我们首先在 upypi 上搜索 WebSocket 库并安装:
https://upypi.net/en/pkgs/async_websocket_client/1.0.0
复制安装命令:
mpremote mip install https://upypi.net/pkgs/async_websocket_client/1.0.0
这里,我们将下面 main.py 文件烧录到树莓派 Pico2w 中:
# Python env : MicroPython v1.23.0
# -*- coding: utf-8 -*-
# @Time : 2026/04/12
# @Author :
# @File : main.py
# @Description : Async WebSocket client usage example for MicroPython
# ======================================== 导入相关模块 =========================================
import network
import asyncio
import machine
import time
from async_websocketclient import AsyncWebsocketClient # 导入你的WebSocket库
# ======================================== 全局变量 ============================================
# 配置WiFi (请替换为你的WiFi信息)
WIFI_SSID = "Y/OURSPACE"
WIFI_PASSWORD = "qc123456789"
# 测试服务器地址 (Postman Echo)
TEST_URL = "wss://ws.postman-echo.com/raw"
# ======================================== 功能函数 ============================================
def connect_wifi():
"""
连接 WiFi 并返回网络对象。
Returns:
network.WLAN: 已连接的 WLAN 对象;连接失败时返回 None。
==========================================
Connect to WiFi and return the network object.
Returns:
network.WLAN: Connected WLAN object; None if connection fails.
"""
# 初始化WiFi为STA模式(客户端模式)
wlan = network.WLAN(network.STA_IF)
wlan.active(True)
# 避免重复连接
if not wlan.isconnected():
print(f"Connecting to WiFi: {WIFI_SSID}")
wlan.connect(WIFI_SSID, WIFI_PASSWORD)
# 等待连接(最多等待10秒)
timeout = 10
while not wlan.isconnected() and timeout > 0:
time.sleep(1) # 替换utime.sleep为time.sleep
timeout -= 1
print(f"Connecting... {timeout}s remaining")
if wlan.isconnected():
# 打印连接信息(IP、子网掩码、网关、DNS)
ip_info = wlan.ifconfig()
print(f"WiFi connected")
print(f"IP: {ip_info[0]}")
print(f"Gateway: {ip_info[2]}")
print(f"DNS: {ip_info[3]}")
else:
print("WiFi connection failed")
return None
else:
print("WiFi already connected")
return wlan
async def websocket_test():
"""
WebSocket 测试主逻辑,依次完成连接、发送、接收和关闭。
==========================================
Main WebSocket test logic: connect, send, receive, and close in sequence.
"""
global ws_client
try:
# 1. 连接WiFi
if not connect_wifi():
return
# 2. 连接WebSocket服务器
print("Connecting: {}".format(TEST_URL))
await ws_client.handshake(TEST_URL)
print("WebSocket connected (WSS)")
# 3. 发送测试消息
test_message = "Hello from Pico2W!"
print("Sending: {}".format(test_message))
await ws_client.send(test_message)
# 4. 循环接收消息
for count in range(5):
print("\nWaiting for message ({})...".format(count + 1))
response = await ws_client.recv()
if response:
print("Received: {}".format(response))
# 发送下一条消息
next_msg = "Pico count: {}".format(count + 1)
await ws_client.send(next_msg)
await asyncio.sleep(1)
else:
print("No message received, connection may be closed")
break
# 5. 关闭连接
print("\nTest complete, closing connection...")
await ws_client.close()
print("Connection closed")
except Exception as e:
print("\nException: {} - {}".format(type(e).__name__, e))
await ws_client.close()
# ======================================== 自定义类 ============================================
# ======================================== 初始化配置 ===========================================
# 初始化WebSocket客户端
ws_client = AsyncWebsocketClient(ms_delay_for_read=5)
# ======================================== 主程序 ===========================================
# 运行主程序
if __name__ == "__main__":
asyncio.run(websocket_test())
烧录代码,运行结果如下:
这是树莓派 Pico2W 成功运行编写的异步 WebSocket 客户端库的测试结果:
代码成功连接到 wss://ws.postman-echo.com/raw 回显服务器,完成了 WiFi 连接、WebSocket 握手、文本消息发送与接收的全流程,Pico 依次发送计数消息并收到服务器的正确回显,最后正常关闭连接。
