WebSocket：新手如何秒懂服务器实时推送的核心协议？

摘要：初次接触 WebSocket 的人，都会问同样的问题：我们已经有了 HTTP 协议，为什么还需要另一个协议？它能带来什么好处？

一、引言初次接触 WebSocket 的人，都会问同样的问题：我们已经有了 HTTP 协议，为什么还需要另一个协议？它能带来什么好处？在我们之前的教程中，我们在树莓派 Pico 上用 HTML 开发了一个基于 HTTP 协议的网页服务器，以此控制树莓派 Pico 的硬件引脚： https://freakstudio.cn/node/019bd0cf-8ca7-7e97-83fe-0b29d55c6f5c 这个方式非常简单，但缺点也非常明显：每次提交表单都需要完成一次完整的网络往返（也就是页面刷新），导致存在明显延迟，这种往返通信对用户体验很不友好，延迟会导致用户重复点击，或是感觉界面无响应。 HTTP 协议的核心模式是请求 - 响应：浏览器发起请求，服务器处理后返回响应。它属于半双工通信，同一时间只能单向传输数据，每次通信都需要重新建立握手连接。对很多嵌入式项目来说，这种协议完全够用：比如用浏览器配置开发板参数，之后开发板独立运行一段时间，但是考虑下面两个情况：温湿度实时记录和显示：如果使用 HTTP，浏览器必须不断轮询（例如每隔 1 秒请求一次数据），服务器才能返回最新的温湿度值；这样会带来几个问题：请求频率高，浪费带宽和 MCU 资源；数据存在延迟（取决于轮询间隔）；设备功耗增加（频繁网络通信）。在线网络聊天室：如果使用 HTTP，客户端需要不断轮询服务器是否有新消息（例如每几百毫秒请求一次）。这样不仅效率低，还会造成：大量无效请求（大部分时候没有新消息）；服务器压力增大；消息延迟明显，体验差。你可以看到，在需要服务器可以在有新消息时立即推送给所有客户端的情况下，使用 HTTP 通信并不友好。那么，我们实际上可以选择另一种更优的方案：在浏览器与服务器之间建立并保持一个长连接，实现全双工通信。在这种模式下，客户端和服务器都可以在任意时刻主动发送数据，不再受限于 HTTP “请求 - 响应”的单向通信机制，从而避免频繁轮询带来的性能浪费和延迟问题。这种通信方式特别适合需要实时数据更新和即时交互反馈的场景，例如实时监控、在线聊天、远程控制等。而实现这一能力的核心协议，就是 WebSocket。客户端（如浏览器）向服务器发起连接请求，经一次 HTTP 握手完成协议升级后，建立持久全双工长连接。二、WebSocket 协议介绍 2.1 基本概念它于 2008 年诞生，2011 年成为国际标准： WebSocket 最初在 HTML5 规范中以 TCPConnection 为名，作为基于 TCP 的套接字 API 的占位方案，用于解决浏览器端原生 TCP 通信的需求。在 WebSocket 出现前，浏览器端端口 80 的全双工通信依赖 Comet 通道技术，但存在两大核心缺陷：实现复杂度高，部署与维护成本大；因 TCP 三次握手、HTTP 请求头的额外开销，对小消息场景的传输效率极低。 2008 年 6 月，Michael Carter 牵头系列技术讨论，产出了首个名为「WebSocket」的协议版本，核心目标是在不破坏网络安全假设的前提下，解决 Comet 技术的痛点；随后 Ian Hickson 与 Michael Carter 合作确定 WebSocket 这一名称，由 Ian Hickson 正式写入 HTML5 规范。目前所有浏览器均已原生支持，无需额外插件，包括 Google Chrome、Firefox、Microsoft Edge、Internet Explorer、Safari 和 Opera，其属于真正的双向平等对话，支持服务器主动向客户端推送信息，也支持客户端主动向服务器发消息，属于主流的服务器推送技术之一。其技术特点包括：基于 TCP 协议构建，服务器端实现逻辑简单，适配性强。完美兼容 HTTP 生态，默认共用 80（ws）、443（wss）端口；握手阶段采用 HTTP 协议，不易被网络屏蔽，可顺利通过各类 HTTP 代理服务器。数据格式轻量化，通信开销小、效率高；支持文本、二进制数据双向传输，覆盖文字、文件、音视频等各类数据场景。无同源限制，客户端可与任意服务器建立连接，突破浏览器同源策略限制；协议标识符：ws（未加密）、wss（加密，类似 HTTPS），通信地址遵循 URL 规范，示例：ws://example.com:80/some/path。

WebSocket：新手如何秒懂服务器实时推送的核心协议？

相关推荐