默认
打赏 发表评论 11
想开发IM:买成品怕坑?租第3方怕贵?找开源自已撸?尽量别走弯路了... 找站长给点建议
八问WebSocket协议:为你快速解答WebSocket热门疑问
阅读(90201) | 评论(11 收藏2 淘帖1 2
微信扫一扫关注!

本文由“小姐姐养的狗”原创发布于“小姐姐味道”公众号,原题《WebSocket协议 8 问》,即时通讯网收录时有优化和改动。感谢原作者的分享。


一、引言


WebSocket是一种比较新的协议,它是伴随着html5规范而生的,虽然还比较年轻,但大多主流浏览器都已经支持。它使用方便、应用广泛,已经渗透到前后端开发的各种场景中。

对http一问一答中二式流程(就是从所周之的“长轮询”技要啦)的不满,催生了支持双向通信的WebSocket诞生。WebSocket是个不太干净协议。

本文将从8个常见的疑问入手,为还不了解WebSocket协议的开发者快速普及相关知识,从而节省您学习WebSocket的时间。

另外,如果您对Web端的即时通讯技术还完全不了解,那么《新手入门贴:详解Web端即时通讯技术的原理》、《Web端即时通讯技术盘点:短轮询、Comet、Websocket、SSE》这两篇文章请您务必抽时间读一读。

* 推荐:本文作者的另一篇文章《脑残式网络编程入门(八):你真的了解127.0.0.1和0.0.0.0的区别?》,也同样值得一读。

二、参考文章



三、更多资料


Web端即时通讯新手入门贴:
新手入门贴:详解Web端即时通讯技术的原理

Web端即时通讯技术盘点请参见:
Web端即时通讯技术盘点:短轮询、Comet、Websocket、SSE

关于Ajax短轮询:
找这方面的资料没什么意义,除非忽悠客户,否则请考虑其它3种方案即可。

有关Comet技术的详细介绍请参见:
Comet技术详解:基于HTTP长连接的Web端实时通信技术
WEB端即时通讯:HTTP长连接、长轮询(long polling)详解
WEB端即时通讯:不用WebSocket也一样能搞定消息的即时性
开源Comet服务器iComet:支持百万并发的Web端即时通讯方案

更多WebSocket的详细介绍请参见:
新手快速入门:WebSocket简明教程
WebSocket从入门到精通,半小时就够!
Socket.IO介绍:支持WebSocket、用于WEB端的即时通讯的框架
socket.io和websocket 之间是什么关系?有什么区别?
Web端即时通讯实践干货:如何让你的WebSocket断网重连更快速?

有关SSE的详细介绍文章请参见:
SSE技术详解:一种全新的HTML5服务器推送事件技术

更多WEB端即时通讯文章请见:
http://www.52im.net/forum.php?mod=collection&action=view&ctid=15

四、1问WebSocket:WebSocket协议只能浏览器发起么?


不是。目前此协议的受众的也不仅仅是web开发者。

WebSocket只是一种协议,它和http协议一样,使用类似okhttp的组件,可以在任何地方进行调用,甚至可以借助WebSocket实现RPC框架。

八问WebSocket协议:为你快速解答WebSocket热门疑问_1.jpg

五、2问WebSocket:WebSocket和HTTP什么关系?


WebSocket和http一样,都是处于OSI模型中的最高层:应用层。

八问WebSocket协议:为你快速解答WebSocket热门疑问_2.jpg

WebSocket借助http协议进行握手,握手成功后,就会变身为TCP通道,从此与http不再相见。

使用netstat或者ss,能够看到对应的连接,它与处于抽象层的socket,在外观上没有区别。

更多WebSocket和HTTP的关系,以及与Socket的区别,可进一步阅读以下文章:


六、3问WebSocket:WebSocket和长轮询有什么区别?


长轮询,就是客户端发送一个请求,服务端将一直在这个连接上等待(当然有一个超长的超时时间),直到有数据才返回,它依然是一个一问一答的模式。比如著名的comted。

WebSocket在握手成功后,就是全双工的TCP通道,数据可以主动从服务端发送到客户端,处于连接两端的应用没有任何区别。

WebSocket创建的连接和Http的长连接是不一样的。由于Http长连接底层依然是Http协议,所以它还是一问一答,只是Hold住了一条命长点的连接而已。

长轮询和Http长连接是阻塞的I/O,但WebSocket可以是非阻塞的(具体是多路复用)。

八问WebSocket协议:为你快速解答WebSocket热门疑问_3.jpg

这方面更深入的资料,请进一步学习:


七、4问WebSocket:如何创建一个WebSocket连接?


WebSocket的连接创建是借助Http协议进行的。这样设计主要是考虑兼容性,在浏览器中就可以很方便的发起请求,看起来比较具有迷惑性。

下图是一个典型的由浏览器发起的ws请求,可以看到和http请求长的是非常相似的。

但是,它只是请求阶段长得像而已:
八问WebSocket协议:为你快速解答WebSocket热门疑问_4.jpg

请求的地址,一般是:ws://\*\*\*,或者是使用了SSL/TLS加密的安全协议wss:,用来标识是WebSocket请求。

  • 1)首先,通过Http头里面的Upgrade域,请求进行协议转换。如果服务端支持的话,就可以切换到WebSocket协议。简单点讲:连接已经在那了,通过握手切换成ws协议,就是切换了连接的一个状态而已。
  • 2)Connection域可以认为是与Upgrade域配对的头信息。像nginx等代理服务器,是要先处理Connection,然后再发起协议转换的。
  • 3)Sec-WebSocket-Key 是随机的字符串,服务器端会用这些数据来构造出一个 SHA-1 的信息摘要。如此操作,可以尽量避免普通 HTTP 请求被误认为 WebSocket 协议。

其他的,像Sec-WebSocket*字样的头信息,表明了客户端支持的子协议以及其他信息。像loT中很流行的mqtt,就可以作为WebSocket的子协议。

八问WebSocket协议:为你快速解答WebSocket热门疑问_5.jpg

使用javascript,可以很容易连接一个WebSocket服务端:
<script>
  var ws = new WebSocket('ws://localhost:80');
  ws.onopen = function () {
    console.log('ws onopen');
    ws.send('from client: hello');
  };
  ws.onmessage = function (e) {
    console.log('ws onmessage');
    console.log('from server: ' + e.data);
  };
  ...
</script>

更详细的资料,请阅读:《WebSocket详解(三):深入WebSocket通信协议细节》。

八、5问WebSocket:WebSocket如何处理数据?


WebSocket是通过事件通知的方式运行的。它包含四个事件和两个动作(发送和关闭)。

WebSocket的事件:
事件
钩子
备注
openonopen连接建立时触发
messageonmessage客户端接收服务端数据时触发
erroronerror通信发生错误时触发
closeonclose连接关闭时触发
数据可直接通过Socket.send()方法进行传输。

通过chrome的Inspect->Network->WS,可以看到页面上的WebSocket连接。

如图Opcode为2,表明它是一个二进制帧:
八问WebSocket协议:为你快速解答WebSocket热门疑问_6.jpg

WebSocket有类似tcp协议的帧格式,在此不做过多解释。(可以详细阅读:《理论联系实际:从零理解WebSocket的通信原理、协议格式、安全性

参考:https://tools.ietf.org/html/rfc6455#section-5.1

九、6问WebSocket:如何使用Nginx做WebSocket的负载均衡?


nginx官网已经给出了例子。主要是Upgrade和Connection头的设置。

Nginx的中的配置如下:
map $http_upgrade $connection_upgrade {
    default upgrade;
    '' close;
}

location /chat/ {
    proxy_pass http://backend;
    proxy_http_version 1.1;
    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection $connection_upgrade;
}

需要注意的是,nginx做负载均衡,不需要配置ip_hash等参数,nginx天然支持。由于ip_hash仅使用ip地址的前三个数字做hash,还有可能造成服务端的不均衡。

特别注意:

在IM聊天系统场景下,Nginx提供给WebSocket的这种所谓的“负载均衡”,只能解决传统分布系统中的SLB服务器要做的事。

通俗地说,Nginx只能帮助完成引导WebSocket客户连接到哪一个WebSocket服务端实例,在IM集群情况下,如果两个用户处于不同的WebSocket实例下时,它们之间的跨实例通信,Nginx是没有办法实现的,这一块的逻辑还是得IM开发者自已来实现。

总而言之,Nginx提供给WebSocket的所谓“负载均衡”,并不是IM开发者认为的那种全功能集群!


十、7问WebSocket:Java服务端怎么实现WebSocket?


可以使用javax.WebSocket下的包,简单的实现ws服务端。目前基本可以通过注解的方式去编写代码,比如ServerEndpoint。

推荐使用基于netty的netty-socketio进行服务端的编写。由于使用的是netty,所以能够在多个层面进行切入,获取一些统计数据,执行一些控制指令。socketio是一套解决方案,它有多个语言的客户端,并处理了市面上大多数的兼容问题。

友情忠告:socket.io几乎是市面上最好的开源WebSocket解决方案,但netty-socketio这个开源工程并非socket.io官方团队维护,而对于socket.io这个版本帝来说,其他的非官方版本能不能即时跟进,也是一个需要考虑的风险因素。

十一、8问WebSocket:WebSocket能干些啥?


1)通知功能:

保持一个长连接,当服务端有新的消息,能够实时的推送到使用方。像知乎的点赞通知、评论等,都可以使用WebSocket通信。

某些使用H5的客户端,为了简化开发,也会使用WebSocket进行消息的通知,由于它是实时推送的,会有更好的用户体验。

2)数据收集:

一些次优级别的数据,比如行为日志、trace、异常执栈收集等,都可以开辟专门的WebSocket通道进行传输。这能够增加信息的集中度,并能及时的针对用户的行为进行合适的配置推送。由于大多数浏览器内核都支持,它将使客户端APM编程模型变得简单。

3)加密 && 认证:

虽然使用Fiddler、Charles等能够抓到很多WebSocket包。但如果同时开启SSL,传输加密后的二进制数据,会大幅增加破解的成本,会安全的多。

4)反向控制钩子:

这个...由于是双工长连接,服务端完全可以推送一些钩子命令,甚至直接是代码,在客户端进行执行。比如截个屏,录个音,种个小马。用户只要通过了授权申请,剩下的就随你发挥了。

支付宝偷偷调用你的相机给你拍照的梗,我是相信的。

十二:本文小结


想当年,cometd的出现,惊为天人,振奋了很久。但技术日新月异,cometd已经衰老,而Socket.io得到了快速发展。WebSocket经过一段时间的混沌期,规范已经越来越完善,使用也越来越方便,不需要再处理那么多的兼容。

但它的本质,还是新瓶装旧酒,换汤不换药。WebSocket的发展得益于HTML5规范的制定。规范的意义,就是约束厂商们天马行空的实现,以及指明发展的方向。

这当然有典型的反例,那就是ie。现在,只有一群公认的**,还坚持在用。

附录:更多WEB端即时通讯资料


新手入门贴:史上最全Web端即时通讯技术原理详解
Web端即时通讯技术盘点:短轮询、Comet、Websocket、SSE
SSE技术详解:一种全新的HTML5服务器推送事件技术
Comet技术详解:基于HTTP长连接的Web端实时通信技术
新手快速入门:WebSocket简明教程
WebSocket详解(一):初步认识WebSocket技术
WebSocket详解(二):技术原理、代码演示和应用案例
WebSocket详解(三):深入WebSocket通信协议细节
WebSocket详解(四):刨根问底HTTP与WebSocket的关系(上篇)
WebSocket详解(五):刨根问底HTTP与WebSocket的关系(下篇)
WebSocket详解(六):刨根问底WebSocket与Socket的关系
socket.io实现消息推送的一点实践及思路
LinkedIn的Web端即时通讯实践:实现单机几十万条长连接
Web端即时通讯技术的发展与WebSocket、Socket.io的技术实践
Web端即时通讯安全:跨站点WebSocket劫持漏洞详解(含示例代码)
开源框架Pomelo实践:搭建Web端高性能分布式IM聊天服务器
使用WebSocket和SSE技术实现Web端消息推送
详解Web端通信方式的演进:从Ajax、JSONP 到 SSE、Websocket
MobileIMSDK-Web的网络层框架为何使用的是Socket.io而不是Netty?
理论联系实际:从零理解WebSocket的通信原理、协议格式、安全性
微信小程序中如何使用WebSocket实现长连接(含完整源码)
八问WebSocket协议:为你快速解答WebSocket热门疑问
>> 更多同类文章 ……

即时通讯网 - 即时通讯开发者社区! 来源: - 即时通讯开发者社区!

本帖已收录至以下技术专辑

推荐方案
评论 11
第二句,使用方便而不是使用方面。
引用:登至必极 发表于 2019-04-27 17:52
第二句,使用方便而不是使用方面。

多谢纠错,已修订
这个网站真的太精彩了,最近业务需要涉及im,看里面文章越看越有味道,点赞&#128077;
引用:Remember 发表于 2019-04-30 11:32
这个网站真的太精彩了,最近业务需要涉及im,看里面文章越看越有味道,点赞&#128077;

您又遇到websocket延时问题吗?我这边使用网络一查基本都是延时几百毫秒
引用:py白 发表于 2020-04-14 14:20
您又遇到websocket延时问题吗?我这边使用网络一查基本都是延时几百毫秒

延时?服务端用的是什么框架?
引用:JackJiang 发表于 2020-04-14 14:38
延时?服务端用的是什么框架?

之前一直没问题,最近就是发现有点延时,前端浏览器显示的消息发送时间跟后台服务接受到数据打印出来的时间出入有点大。
1:对比了服务器和浏览器时间,基本一致
2:采用的webscoket
3:服务器用的python框架sanic
还有就是发现webscoket的传输,又是会整合为一条。类似图中,逻辑明明是发一条到服务器,服务器确认一条,但有时会造成一下发很多条到服务器,然后又很多条返回给服务器

L]9}6BKDHR540OJTE~LO%Q6.png (32.44 KB, 下载次数: 1707)

L]9}6BKDHR540OJTE~LO%Q6.png
引用:py白 发表于 2020-04-14 15:15
之前一直没问题,最近就是发现有点延时,前端浏览器显示的消息发送时间跟后台服务接受到数据打印出来的时 ...

python没用过。 。。 你能确认,你用的这个websocket客户端和服务端库是成熟稳定的吗
发现两处错别字:
“处于链接两端的应用没有任何区别” 中的 “链接” ===> “连接”;
“当服务端游新的消息” 中的 “游” ===> “有”。
签名: ruankao 做练习
引用:gxl_ct001 发表于 2021-02-15 22:24
发现两处错别字:
“处于链接两端的应用没有任何区别” 中的 “链接” ===> “连接”;
“当服务端游新的 ...

感谢勘误,看的很仔细,已修订。
打赏楼主 ×
使用微信打赏! 使用支付宝打赏!

返回顶部