《计网》Application Layer
TCP/IP协议栈的最顶层:应用层
2.1 Principles of Network Applications
2.1.1 Network Application Architectures
要写出一个网络应用,首先要选择一种架构,是CS(client-to-server)架构,还是P2P(peer-to-peer)架构。
所谓CS架构,就是整个网络应用生态是由server和client这种不对等关系组成(比如web应用),server必须长时间不关机来达到持续为client提供资源的效果,client专门访问资源。一般来说服务提供方都是服务器的集群,也称为data center,一个data center中包含了成千上万台服务器。因为就如今的网络吞吐量来看,一台server是远远无法为一个成熟的网络应用提供所需的服务的。甚至一个data center也不够,要多个data center才能满足需求(google有将近50data centers遍布全球)。
P2P架构中,两两相连的hosts彼此对等,它们自己都既可以提供资源,也可以访问资源。这种架构方式在数据传输量较大的网络应用中经常被使用(比如点对点文件传输BitTorrent,网络电话,视频会议)。
P2P最大的好处就是self-scalability,因为一台host给它的所有peers发送文件A后,它的所有peers又能给它们各自的peers发送文件A,文件A在整个网络中被越来越多hosts所拥有,到了后期如果网络中某台新host要请求文件A,就可能会有N个已持有文件A的hosts一起传输给它,速度非常快。
另外P2P也不需要类似server等的一些基础架构,比较经济,方便。
不过P2P也存在一些问题:安全,peers较少时性能很差,去中心化网络的可靠性较低。
如今很多软件都同时采用了P2P和CS架构
2.1.2 Processes Communicating
一台机器上processes之间相互通信的内容是操作系统中需要探究的内容,在网络中,我们主要研究不同hosts上的process之间通信的过程:它们通过互相发送message来通信。
2.1.2.1 Client and Server Processes
无论是CS架构还是P2P架构,不同hosts之间的processes都存在server/client pair的关系(注意CS架构中的server和client指的是host,而不是此处的process)。
比如web应用中,客户端的浏览器就是一个client process,服务端为client提供内容的进程就是server process;P2P的文件传输服务中,请求文件内容的进程为client process,提供内容的进程为server process(所以P2P中的一个host可以同时充当client和server的角色)。
更精确的定义:
In the context of a communication session between a pair of processes, the process that initiates the communication (that is, initially contacts the other process at the beginning of the session) is labeled as the client. The process that waits to be contacted to begin the session is the server.
在web应用中,浏览器(client process)向服务端发起连接请求,一直在等待请求的服务端接收服务的进程(server process)接受(或拒绝)连接请求;P2P中请求文件的host向另一个host发起连接请求(client process),另一个host被动等待并接受(或拒绝)连接请求(server process)。
2.1.2.2 The Interface Between the Process and the Computer Network
process通过【软件实现的接口——socket 】来接收或发送message。
如果把process比作房子,那么socket就是这个房子的门,process接收信息发送信息都要通过它的socket。
(上图假定运输层协议为TCP),可以看出,socket其实就是一个host上应用层和传输层之间的接口,因此它也被称为【应用和网络】之间的Application Programming Interface (API) 。
应用程序的开发者对应用层这边的socket拥有完全控制权,而对传输层那边的socket的操作空间却非常少,只有如下两个方面:
- 选择使用哪一个传输层协议
- 填写一些传输层的参数(比如最大的segment size)
2.1.2.3 Addressing Processes
两个hosts之间互相通信需要知道彼此的IP地址,而一台host上会运行多个processes,两个processes之间通信的话,就需要知道对方是host上具体的哪一个进程。用port number来标识每一个进程,这样就可以通过【IP+port number】来精确的定位一个host上的某一个process了。
一些著名的应用程序拥有固定的port number:HTTP(80),SMTP(25)等,
2.1.3 Transport Services Available to Applications
编写网络应用程序之前首先要选择一种传输层协议,传输层的协议有两个:TCP和UDP,它们提供了不同的服务类型。
Reliable Data Transfer,选择可靠传输可以保证数据完好无损的到达接收端,但是速度较慢。相对的,选择不可靠传输速度较快。
throughput,很多媒体应用(比如视频网站)要保证稳定的网络带宽,这时就要选择throughput guaranteed服务,而一些比如邮件服务,就不需要稳定的带宽,只要传输可靠就行。
timing,一些应用要求数据必须要给定的时间内传递到(比如网络会议,网络游戏),就要选择timing的协议。
Security,传输层协议还会提供一些数据加密,数据完整性校验等安全服务。
2.1.4 Transport Services Provided by the Internet
TCP
提供面向连接的可靠数据传输服务,具体来看:
- connection-oriented service
在传输数据之前,使用TCP连接的两个进程会先交换一些控制信息,这个过程就是著名的三次握手,三次握手完成后,两个进程的sockets之间就建立起了TCP connection,这种连接允许它们进行全双工通信。
通信结束后,两进程也会通过类似三次握手的方式挥手告别来中止TCP连接。 - reliable data transfer service
通过TCP connection传输的数据不会产生丢包或者数据重复、数据缺失等问题。 - congestion control
如果当前网络整体比较拥塞,TCP可以限制进程的数据发送速率
UDP
UDP只提供最基本的数据传输服务,因为简单,所以它的特点是高效,但是不够可靠。
UDP是无连接的服务,通信之前不需要交换控制信息;UDP不可靠,这意味着数据传输过程中可能发生丢包、数据缺失、数据到达顺序错乱等问题。不仅如此,UDP也没有任何拥塞控制策略,这意味着它可能一次发送一大批数据到链路上,引发链路拥塞。
视频通话这类一般都使用UDP实现,因为这类应用对数据完整性有一定容忍度,使用UDP能够避免TCP带来的额外开销。不过如今多数防火墙都会阻塞UDP数据,因此通常这类应用会将TCP作为第二选择以备不时之需。
2.1.5 Application-Layer Protocols
使用相同两个应用层协议的终端可以互相发送message来实现对应的功能。
应用层协议通常定义了:
- message类型(是请求还是回应)
- message的语法(里面有多少个字段)
- message中每个字段的语义
- 一个进程【何时】、【如何】发送和接收message
注意区分【应用层协议application-layer protocols】和【网络应用network applications】,前者是后者的子集(十分重要的子集)。比如web应用包含了HTML、web browser、web servers以及应用层协议HTTP。
2.2 The Web and HTTP
2.2.1 Overview of HTTP
web的核心是它的应用层协议:HTTP(TyperText Transfer Protocol)。HTTP包含两个程序:client program和server program,分别运行在客户端和服务端,通过交换HTTP messages来互相通信。HTTP定义了这些messages的结构以及client和server交换messages的方式。
因为browser实现了客户端的HTTP,所以web应用中client可等同于browser
web page由base HTML file和多个objects(图片、视频等)组成,这些objects都被URL唯一标识。
URL(Uniform Resource Locator)包含两部分内容:
- 提供网页内容(object)的服务器的域名
- object所在的路径名称
例如:http://www.someSchool.edu/someDepartment/picture.gif
www.someSchool.edu就是提供objects访问的服务器域名
/someDepartment/picture.gif就是当前访问的object的路径
HTTP定义了client向server请求网页的方式,以及server向client传输网页的方式。web应用整体采用了CS架构,即一个server长期开机固定ip运行服务等待client请求,多个client可以在任意时间访问server提供的web资源。
HTTP归根到底是一个应用,之前学过,网络应用都要选择一个传输层协议,HTTP选择的传输层协议是TCP,因此web应用是无损传输数据的。
HTTP还是一个stateless protocol,即它不会记录client的状态信息。这一点体现在,即使一个client在极短的间隔内多次请求同一个object,每当server响应完一次请求,就会把它完全忘记,下一次请求对它来说就像以前从来没有发生过一样。
2.2.2 Non-Persistent and Persistent Connections
运行在TCP之上的应用程序,server和client之间会建立持久的连接来通信,这种情况下需要做一个重要的决定:只建立一条TCP连接,让request/response同时在这个连接上传输;还是为request和response各自单独建立一条TCP连接?
只建立一条TCP连接,让request/response同时在这个连接上传输称为Non-persistent connection,
为request和response各自单独建立一条TCP连接称为Persistent connection。
HTTP可以在这两种方式中任选其一。
2.2.2.1 HTTP with Non-Persistent Connections
为了解释non-persistent connection,先来看看一个网页从server发送到client的过程是怎样的。
假定网页的URL是: http://www.someSchool.edu/someDepartment/home.index
- HTTP client process首先向服务器www.someSchool.edu的80端口(HTTP的默认端口)发起TCP连接请求,连接建立起来后,client和server两边各有一个socket口。
- HTTP client process通过socket向HTTP server process发送请求报文,该请求报文中包含请求的资源在server上的具体路径(如:/someDepartment/home.index)。
- HTTP server process通过自己这边的socket接收client发来的请求报文,然后根据报文的请求,到自己的硬盘上寻找相应的资源/someDepartment/home.index,然后将该资源打包成HTTP response报文的格式,从socket向client发出。
- 资源传输完毕后,HTTP server process发出关闭TCP connection的请求(不过这时TCP连接不会真的被关闭,它会等到HTTP client process确认【完整的】收到资源报文后,才会关闭)
- HTTP client process(browser)接收到回复报文后,TCP连接断开,接着client将报文拆开,取出其中的资源显示在浏览器界面上
使用不同的浏览器可能会看到并不完全相同的网页,因为HTTP只管发送和接收HTTP报文,至于报文中的信息是如何被解释然后呈现给用户则完全是由browser来控制的。
以上整个过程就是典型的non-persistent connection,每传输一个资源就需要创建一次TCP连接(第1步),每一次传输完毕后都要断开连接(第4步),所以下一次传输网页又要重新建立TCP连接,注意【一次HTTP传输只能传输一个资源(object),而非整个网页】,所以假如一个网页上有11张图片,那么这张网页就需要11次TCP传输。这就是所谓的面向无连接,无记忆,不会因为一个client要请求多个资源而为它保持TCP连接。
不过现代的browser一般可以同时并行的维护多个TCP连接,所以网页连接的速度不至于很慢。
现在来算算从client发起网页请求到它接收到完整的网页总共需要的时间。我们称一个简短的小报文从client发到server,然后从server发回到client总共花费的时间为 round-trip time(RTT) ,RTT包括了之前我们介绍过的packet-propagation delays、packet-queuing delays以及packet-processing delays。一个网页从请求到完整接收这整个过程其实远不止一个RTT的时间,一个重要的原因就是两个终端之间建立TCP连接必须要经过 三次握手(three-way handshaking) 。
三次握手的前两次就用掉了一个RTT的时间,最后一次握手则将第三次握手的报文和HTTP request报文一起发出。
2.2.2.2 HTTP with Persistent Connections
Non-persistent connection让server的负担过重。其实请求一次网页建立一次TCP连接还稍微可以接受,如果请求一个object就得新建一个TCP连接的话,一个现代网页至少也要创建十几个TCP连接,一个server可是要同时对成百上千个clients提供服务的。不仅如此,TCP连接创建还特别慢,要好几个RTT。
为了解决这个问题,HTTP 1.1提供了persistent connection,它使得连接得以维持,可以对同一目标进行连续的objects传输(如果server收到【连续的】请求,它就会将这些请求的结果【连续地】发回给目标client),这下终于可以用一个TCP连接一次性传输整个网页而不需要为网页上的每一个object都创建一个全新的TCP链接了。当一条TCP链接在一定时间内(用户可定义)没有被使用后,该链接才会被关闭。
HTTP 1.1的模式默认为persistent connection,之后在HTTP 1.1基础之上新做出来的HTTP/2甚至允许多个不同的请求和应答报文同时在一条TCP链路上传输。
2.2.3 HTTP Message Format
2.2.3.1 HTTP Request Message
一个典型的HTTP请求报文示例如下:
【GET /somedir/page.html HTTP/1.1】 //第一行叫做 request line ,包含三个字段:方法(有GET、POST等)、URL、以及HTTP version。
余下几行统称为 header lines
【Host: www.someschool.edu】 //指明了请求的资源在哪台host上。既然已经建立了TCP链接,那么对方主机的IP已经是知道的,然而这条信息是否是多余的呢?其实到后面我们就会学到Web proxy caches会用到它。
【Connection: close 】 //这代表browser并不希望建立persistent connection,这样在server发出response message后就会请求关闭TCP
【User-agent: Mozilla/5.0】 //说明了发出 resquest的browser类型,本例为火狐。这条信息其实很重要,因为server可以根据不同的browser类型发送不同版本的response message
【Accept-language: fr】 //说明了client想接收法文版本的网页
现在来学习HTTP resquest message的一般格式:
可以看到其中有一个特殊的字段叫做 Entity body,如果method字段使用GET,该字段就为空。只有当使用POST方法时,该字段可以被用户填写。要注意的是,不光是POST方法可以让用户写入数据,GET也可以,它们之间的区别在于,GET会把用户输入的数据展示在url上,而POST不会。
也可以使用head方法,当server收到一个head方法的request message时,它会无视掉请求报文,直接返回一个response message,因此该方法通常用来debug;put方法使得用户可以上传object到web server;delete方法使得用户可以删除web server上的文件。
2.2.3.1 HTTP Response Message
下面的示例就是上一小节示例的回复:
HTTP/1.1 200 OK // status line ,有三个字段:协议版本、status code、状态信息。本例server使用HTTP 1.1版本,一切正常。
//中间六行统称 header lines
Connection: close ///告诉client这条消息发完我就要关TCP链接了
Date: Tue, 18 Aug 2015 15:44:04 GMT //server发送response message的时间
Server: Apache/2.2.3 (CentOS) //指明了server的软件类型
Last-Modified: Tue, 18 Aug 2015 15:11:03 GMT //之后还会详细介绍,指明本object内容的最后修改时间
Content-Length: 6821 //entity body的长度
Content-Type: text/html //entity body中的数据类型
//最后是entity body
(data data data data data …)
具体看看status code
status code | 含义 | |
---|---|---|
200 OK | 请求成功,response message也已经成功发送 | |
301 Moved Permanently | 请求的object已经被永久移走了,新的网址在Location字段中给出,一般这时browser会自动重定位到新的网址 | |
400 Bad Request | 400是一个通用的错误码,代表server无法理解本次request | |
404 Not Found | 请求的文件不在该server上 | |
505 HTTP Version Not Supported | 本server不支持请求的HTTP协议版本 | |
2.2.4 User-Server Interaction: Cookies
虽然HTTP server是无状态协议(不会对用户有记忆),但大多数情况下web server需要去记住用户来实现某些功能(比如对会员用户提供特定的内容),基于这种需求,cookies技术出现了,使用cookie可以让网站持续的追踪用户,现在大多数网页都使用了cookie技术。
cookie技术分为四个部分:
- 在HTTP response message和request message中各有一行cookie header line
- browser会在客户端维护一个cookie file
- 一个网站后端的数据库
现在来根据案例学习下cookie的具体运作流程:
假定Susan第一次访问亚马逊的网站,当它发送的HTTP resquest到达亚马逊的web服务器后,服务器会为它创建一个独一无二的身份验证码,并且在后端数据库中以该验证码为索引创建一个数据条目,接着亚马逊的web服务器会回应Susan的browser一个HTTP response message,其中就包含了一个cookie的条目:【Set-cookie:1678】。当Susan的browser接收到亚马逊的response message后,发现其中有一个set-cookie字段,就会在自己维护的cookie文件中增添一行数据,这一行数据包括亚马逊服务器的主机名以及set-cookie字段中的身份验证码。随后Susan不断的访问亚马逊网站,他每一次访问的resquest message都会被browser加上cookie的身份验证码字段(即:Cookie:1678),这样一来亚马逊的web server就可以追踪Susan在网站上的行为,用户1678浏览了哪些网页,浏览的顺序,甚至打开网页的时间,收集这些数据并分析就可以做出一个推荐系统。如果Susan在亚马逊上注册了自己账号,那么亚马逊的web server就会将用户1678和Susan填写的个人信息(姓名、性别、银行卡号和密码)关联起来,综合分析1678的访问偏好以及Susan的个人信息,精准的推荐首页商品或者投放广告,并且Susan每次购买商品无需重复输入自己的卡号密码。
用户第一次访问某网站后,网站服务器会用一个独一无二的身份码标识他,并将其写入数据库,该身份码同时会保存在用户本地端,之后如果再次访问该网站,用户的browser每次发出的HTTP resquest message中就会在cookie字段包含自己的身份码,server根据身份码来记住用户。
虽然cookie方便了用户,但是由于它能够获取用户大量的敏感信息,因此不太安全。
2.2.5 Web Caching
web cache 也称为 proxy server ,可以【代替原web server满足一些HTTP resquests】。web cache拥有自己的存储系统,里面保存了原web server中最近被访问过的一些数据,用户可以在browser中进行设置所有请求都优先发送到web cache。现假定browser请求http://www.someschool.edu/campus.gif:
- browser先与web cache建立TCP链接,并向其发送HTTP request
- web cache接收到resquest后,检查自己是否缓存了resquest要求的目标资源,如果有,就将目标资源打包到HTTP response message中发送给client browser
- 如果web cache没有缓存目标资源,就会转而与原web server建立TCP链接,然后向其发送请求目标资源的HTTP resquest,等收到原web server的response后,就会将其中的目标资源存储到自己的硬盘中,并将一份该资源的复制打包成HTTP response message发送给client browser
从上述过程可以看出【web cache既是client也是server】。
一般web cache是由ISP购买并安装的,比如大学就可能购买一个web cache,然后配置让校园中所有的browser都优先访问web cahce。
使用web cache的理由有二:
- 极大的降低客户端请求网页的时延,尤其是当client和原服务器之间的带宽远小于client和web cache之间的的带宽时(通常情况下client和web cache之间都会建立高速连接)
- web cache可以极大的减轻接入层的拥塞状况,使得接入层的机构不需要很频繁的升级带宽,节省了很多费用。不仅如此,从整体上看web cache减轻了整个互联网的拥塞状况,提升了整个互联网的性能。
2.2.5.1 The Conditional GET
web cache可能会带来一个问题:一个资源刚刚被缓存后,原服务器上该资源的内容被更新了。幸好HTTP提供了验证一个object是否是最新的机制 conditional GET ,当一个HTTP request message【使用GET方法】并且【存在If-Modified-Since字段】它就叫conditional GET。
依然通过第一个例子来看看conditional GET的工作方式:
client browser向web cache发出请求,web cache本地没有缓存目标资源,转而向原web server发出请求。
原web server将目标资源发回给web cached
HTTP/1.1 200 OK
Date: Sat, 3 Oct 2015 15:39:29
Server: Apache/1.3.0 (Unix)
Last-Modified: Wed, 9 Sep 2015 09:23:24
Content-Type: image/gif
(data data data data data …)web cache将目标资源【以及Last-Modified字段】存储在本地硬盘,并将一份复制发给client browser
一周后,一个browser向该web cache请求同一份资源,虽然这份资源被缓存在了web cache中,但是可能已经过期了,因此它要发出conditional GET来确认该资源是否是最新的,即向原web server发送:
GET /fruit/kiwi.gif HTTP/1.1
Host: www.exotiquecuisine.com
If-modified-since: Wed, 9 Sep 2015 09:23:24conditional GET的作用是让原server对比目标资源的modified字段,如果不同就传一份最新的,如果相同就按兵不动。本例中两modified字段值相同,表明该资源没有被修改过。
原web server将response message传输给cache:
HTTP/1.1 304 Not Modified
Date: Sat, 10 Oct 2015 15:39:29
Server: Apache/1.3.0 (Unix)
(empty entity body)web cache知道了该资源是最新的,就直接将其发送给client browser
2.3 Electronic Mail in the Internet
电子邮件在互联网诞生之初就已经存在了,直到现在它仍然是互联网中不可缺少的一环
电子邮件的三个主要组成部分:
- user agent (如Outlook、sina mail等)
- mail servers
- Simple Mail Transfer Protocol (SMTP)
电邮写好后,发送端通过user agent将其发送到mail server上,接收端通过user agent获取mail server上的邮件。每一个用户都在某一个mail server上拥有自己的 mailbox ,里面装着待收取的邮件。如果接收端的mail server出现问题,发送端的mail server可以察觉到并且将发送失败的邮件保存到自己的 message queue 中,过一段时间后再次尝试发送,如果失败次数过多,发送端mail server就会通知用户是否要将邮件删除。
SMTP是电邮使用的标准应用层协议,它下层使用TCP可靠传输,提供将邮件从发送端mail server传输到接收端mail server的服务。SMTP有两个端,一个运行在发送端mail server上的客户端,一个运行在接收端mail server上的服务端,不过每一个mail server都会同时运行SMTP的两种端,因为它要同时扮演发送端和接收端两种角色。
2.3.1 SMTP
假设Alice想要给Bob发送一个纯ASCII字符文件:
- Alice打开她的user agent,输入Bob的电邮地址,然后将已经写好的邮件发送
- Alice的user agent将邮件发送到她的mail server处,mail server接收到后将该邮件存储在待发送队列中
- Alice这边的mail server上运行的SMTP发现待发送队列中有新邮件,就会开始申请与Bob的mail server上的SMTP(port 25)进行TCP连接
- 待双方的SMTP连接成功后,Alice端(即SMTP客户端)就会将Alice的邮件放到TCP信道上发送
- 邮件传输到Bob端的mail server后,其上运行的SMTP会接收该邮件,然后买了server将该邮件放到Bob的mailbox中
- Bob的user agent会给他发出一个新邮件提示,Bob有空时即可阅读
值得注意的一点是,SMTP传输不使用中继服务器,也就是说,【即使邮件通信双方处在地球的南北极,邮件也会直接在双方的mail server之间通过SMTP传输,不会因为距离太远而在中途被中继发送】。不仅如此,电子邮件要么发送成功——在接收端手中,要么发送失败——在发送端手中等待重新发送,绝不可能因为传输中途失败而留存在某一个发送端和接收端之外的服务器中。
2.3.2 Comparison with HTTP
HTTP和SMTP有相同之处,他们都用于在服务器和客户端之间传送数据,都使用persistent connection。它们的不同之处在于:
HTTP是一种 pull protocol ,比如用户通过HTTP去web server上主动pull下来自己想要的信息。【在HTTP建立的TCP连接中,通常是想要主动获取数据的一方先发起TCP请求】
SMTP是一种 push protocol ,比如电邮发送端的mail server将邮件主动push到接收端mail server。【在SMTP建立的TCP连接中,通常是想要主动发送数据的一方先发起TCP请求】
SMTP要求邮件内容全是ASCII格式的,如果有非ASCII格式的内容,要先将这部分内容转成ASCII格式才能发送,而HTTP没有这个要求
HTTP会将每一个object封装到HTTP response message中逐个发送,而SMTP会将所有的objects封装到一个message中一次全部发送
2.3.3 Mail Access Protocols
我们之前讨论的内容中,只说了mail server之间消息的传输需要SMTP,但其实从发送端user agent将消息发送到他的mail server这一步也是需要SMTP来push的,那么接收端该如何从他的mail server中获取邮件数据呢?SMTP只能push不能用,因此必须要想其他方法。
事实上可以完成把邮件从接收端mail server给pull到user agent这一任务协议有很多:Post Office Protocol——Version 3(POP3),Internet Mail Access Protocol(IMAP),以及HTTP
2.3.3.1 POP3
POP3是一个极其简单的协议,因为它太简单了以至于它的许多功能都受限了。
接收端的user agent对它的mail server的110端口(POP3端口)发起TCP连接,POP3的运行有三个阶段:authorization、transaction以及update。
- authorization。这一阶段user agent会发送用户名和密码来验证用户身份
- transaction。这一阶段user agent将消息内容pull到本地,并标记邮件状态(是否要删除,标为已读等)
- update。用户在user agent发出 quit指令后,本次POP3对话结束,与此同时mail server将标记为删除的邮件删除。
2.3.3.2 IMAP
POP3只能把邮件取回到用户本地,而IMAP可以将邮件取到用户指定的云存储器中,它比POP3要复杂的多。IMAP server可以通过IMAP session持续维护用户的状态信息,IMAP还允许用户一次获取部分邮件信息,比如只获取邮件头部信息,或者部分邮件内容,当用户网络状况不好时,用户可以通过该方法仅仅获取邮件中的文字内容,等到网络状况较好时再收取其中的媒体内容。
2.3.3.3 Web-Based E-Mail
如今越来越多用户通过web browser来获取电邮,使用Web-Based Email时,user agent就是一个web browser,用户通过HTTP来与远程的mail box通信。发送端将邮件发送到mail server使用HTTP协议,当接收端想要从mail server中获取邮件时,邮件内容也会通过HTTP协议pull到接收端主机上,不过两个mail servers之间的数据传输依然使用SMTP。
2.4 DNS—The Internet’s Directory Service
虽然人类可以同时被身份证号、姓名、学生证号所标识,但通常情况下我们更愿意用好记的方式——姓名,去记住一个人。计算机网络中的主机也一样,用ip地址去标识一个主机对机器来说轻而易举,但对人类来说却十分痛苦,DNS的出现就是为了解决人类记忆up地址难的问题。
2.4.1 Services Provided by DNS
利用字符串来标识网络实体方便了人类,但却几乎不可能为机器(如路由器)所用,因为字符串长短不一,如果统一字符串格式又会造成限制过多,在加上字符串相关算法一般复杂度较高,所以路由器等设备在工作时仍然以IP地址来标识网络实体。
所以每一个网络实体都同时被IP地址和字符串hostname所标识,为了同时满足机器处理方便和人类记忆方便,就得提供一种机制快速对IP地址和hostname进行转换,domain name system(DNS) 提供了这个转换的服务。
DNS的定义:首先它是【由一组划分等级的DNS servers组成的分布式数据库】,也是【一个应用层协议,使得主机可以向DNS数据库发起域名转换请求】。
大多数应用层协议都离不开DNS,假设某一个browser想要请求baidu的主页, 它能够把HTTP request正确发送到百度web服务器的前提就是拿到www.baidu.com的IP地址:
- browser所在的主机上同时运行着DNS client进程
- browser将用户在URL中输入的www.baidu/com提取出来并发送给DNS client进程
- DNS client向DNS server发起对www.baidu.com的域名转换请求(请求报文基于UDP传输)
- 正常情况下,一段时间后DNS client会收到DNS server的回复,其中包含了www.baidu.com的IP地址
- browser拿到了目标IP地址后,就开始向该IP主机发起TCP请求
除了能够进行域名转换,DNS还提供了其他的重要功能:
- Host aliasing。一个IP地址可以申请多个域名,DNS能够将任何域名都映射到正确的IP
- Mail server aliasing。 DNS还可以为电子邮箱地址提供别名转换服务
- Load distribution。为了降低服务器的压力,很多机构会将服务器分布在各个地方,但这些服务器都提供相同的服务(如web),DNS可以将这样一组功能相同但IP不同的服务器映射到同一个域名上
2.4.2 Overview of How DNS Works
2.4.2.1 A Distributed, Hierarchical Database
互联网中,没有任何一个DNS server是全能的——能够提供所有的地址转换,整个DNS生态其实是遍布世界各地的分布式服务器集群,它们之间有严格的等级划分。一般情况下DNS server可以被划分为四种:
root DNS servers
总共有400多台遍布世界各地,提供TLD的IP地址
top-level domain(TLD)DNS servers
每一个顶级域名(com、org、edu等)都对应了一个TLD,Verisign Global Registry Services公司维护com,Educause公司维护edu。TLD提供authoritative servers的IP地址
authoritative DNS servers
想在互联网上让别人使用自己的服务器,就必须要将服务器的【域名–IP 】记录到authoritative DNS server中。可以选择实现自己的authoritative DNS server,把服务器的【域名–IP】记录上去,也可以选择付钱把自己的【域名–IP】记录到别人authoritative DNS server上,一般大学和大公司都拥有自己的authoritative DNS server。
local DNS server
严格来说它不属于DNS hierarchy中的一种。一般每一个ISP都有一个local DNS server,client连接上ISP后,所有DNS请求会先发到local DNS server,它作为代理将client的DNS请求发送给root DNS server,一般local DNS server距离client只有几个路由器的距离。
假如某个client想要请求www.baidu.com的IP地址:
- client将DNS请求发送给local DNS server,由它将请求代理转发给root server
- 一段时间后,root server将对应TLD的IP地址回复给local DNS server
- local DNS server与TLD联络,TLD返回对应authoritative server的IP地址
- 接着local DNS server与authoritative server联络,authoritative server返回www.baidu.com的IP地址
- 最后local DNS server把百度的ip地址发送给client
这就是典型的DNS lookup过程。
以上这种DNS请求过程中,从requesting host到local DNS server是 recursive query (请求是以递归的方式进行的),而接下来local DNS sersver的三个请求都是 iterative query (请求的结果直接返回请求方)
2.4.2.2 DNS Caching
DNS转换的过程太耗时间了,需要与好几个server通信才能进行一次转换。因此为了减少转换过程中时间的消耗,现在普遍采用DNS Caching机制,它的原理如下:
在DNS请求链中所有涉及到的DNS servers,它们只要收到一个DNS reply(已经转换好的结果),就会把这个reply结果缓存在本地,这样之后如果收到一个对相同域名的请求就可以立即将结果返回,DNS server大概每两天会对本地的DNS reply条目进行更新。
在DNS caching机制的作用下,大多数DNS请求根本无法到达root DNS server,因此节省了巨量的DNS转换时间,也节省了巨量的网络资源。
2.4.3 DNS Records and Messages
DNS中存储的条目叫做 resource records(RRs) ,它给出了域名到IP地址的映射关系。每一个DNS reply message可以携带多个RRs。
RRs是一个四元组(Name,Value,Type,TTL),其中TTL规定了本条RRs应该多久时候被更新,Name和Value字段的意义取决于Type:
- 当【Type=A】时,Name字段代表hostname,Value字段代表Name对应的IP address,所以Type A的RRs提供了标准的hostname-to-IP映射。比如RRs(www.funwithcode.com, 145.37.93.126, A, 30)
- 当【Type=NS】时,Name字段代表domain name(如baidu.com),Value字段代表一个authoritative DNS server的hostname,它知道如何获取domain name中任意hosts的IP地址。Type=NS的RRs用来把当前的DNS query送到DNS query chain中的下一个server处。比如RRs(funwithcode.com, dns.funwithcode.com. NS, 30)
- 当【Type=CNAME】时,Name字段是alias hostname,Value字段是alias hostname的本名,这种类型的RRs是用来将别名转换为原名的。比如RRs(funwithcode.com, relay1.bar.funwithcode.com, CNAME)
- 当【Type=MX】时,Name字段是mail server的alias hostname,Value字段是本名。比如(funwithcode.com, mail.bar.funwithcode.com, MX, 30)。MX RRs使得人们可以给mail servers的hostname起更好记的别名。要注意的是一个机构可以给mail server和其他server(如web server)起一样的别名,这时只能靠DNS message中的Type来区别client请求的是哪个server的域名
某一个hostname(比如A)的authoritative DNS server中存储了A对应的type A RRs,利用它可以直接对A进行域名转换;然而这个DNS server可能对其他的hostname(比如B)来说可能不是authoritative DNS server,此时这个server中存储了hostname B对应的type NS RRs,该条目提供了hostname B所处的域名,以及一个type A条目——提供能对NS RRs域名中所有host进行域名转换的authoritative DNS server的IP地址(包含在value字段中)。
比如某DNS server 不是www.baidu.com的authoritative DNS server,则它会包含一个type NS的条目(baidu.com, dns.baidu.com, NS, 30)提供了知道如何域名转换www.baidu.com的authoritative DNS server的hostname,以及一个type A条目(dns.baidu.com, 123.123.123.123, A, 20)对NS RRs中hostname进行域名转换。
2.4.3.1 DNS Message
DNS reply和DNS request报文【格式相同】。
【header section】
最上方的12 bytes是 header section 。
Identification:在DNS处理的过程中client可能还会不断的发送DNS请求,该字段帮助client弄清楚哪个请求对应哪个回应
Flags:其中包含了几个标志位。
flag name | flag meaning |
---|---|
query/reply flag | 标识DNS报文类型,1为回复,0为请求 |
authoritative flag | 当请求转换的hostname到达authoritative DNS server时,其回复报文中该字段为1 |
recursion-desired flag | client想要递归式的DNS解析时,该字段为1 |
recursion-available flag | 当DNSserver支持递归式解析时,该字段为1 |
四个number-of:不同RRs的数量
【question section】
在client发送给DNS server的询问报文中,包含了client的DNS请求信息。
【answer section】
在DNS server发回给client的回复报文中,其中包含了DNS server对query的回复信息。
【authority section】
包含其他authoritative server的记录
【additional section】
其他的补充信息
可以直接通过nslookup程序向附近的DNS server发送DNS请求,比如在命令行中输入nslookup后,当接收到DNS server的回复后,nslookup就会将回复的信息(answer section中的数据)转译成人话并打印在屏幕上
2.4.3.2 Inserting Records into the DNS Database
假设我们刚刚成立了一家互联网业务公司(假设叫networkutopia),则我们要做的第一件事就是去 registrar 注册networkutopia.com这个域名,registrar是一类商业公司,它们的主营业务就是让客户注册【独一无二】的域名,并把这个域名写入到 DNS database 中。1999年Network Solutions垄断了com, net, org这些顶级域名,之后涌现了很多registrars与其竞争,所有的accredits都可在ICANN中查到。
当我们在某个registrar注册networkutopia.com域名时,还需要提供【主/次authoritative DNS servers】的域名和IP地址,registrar会将这两个DNS server对应的Type NS和Type A条目存入顶级DNS servers(TLD server),即下列两个条目:
(networkutopia.com, dns1.networkutopia,com, NS)
(dns1.networkutopia.com, 212,212,212,1, A)
与此同时,还得确保我们公司web server(www.networkutopia.com)的Type A和mail server(mail.networkutopia.com)的Type MX记录存入了我们的主/次authoritative DNS server中(现在这一过程通常动态的完成)
2.4.4 Conclude
最后通过一个例子来把DNS这节的知识总结一下。
假如A想要访问www.networkutopia.com网站。
- 首先她的主机会发送DNS query给local DNS server,
- 接着local DNS server将请求转发到TLD com server(如果TLD server中没有缓存networkutopia的条目,则TLD server会把root server的信息发给local DNS server,然后local DNS server再将DNS请求发送给root DNS server),不过由于我们已经成功在TLD server中注册了我们的域名,所以query走到TLD com server时命中了
- 然后TLD将authoritative DNS server信息(一条Type A,一条Type NS)回复给local DNS server
- local DNS server提取Type A中提供的authoritatvie DNS server的IP地址212.212.212.1,并将DNS请求发给它
- authoritative DNS server将www.networkutopia.com对应的IP地址212.212.212.4发给local DNS server,然后local DNS server将其发送给client
- 至此A的DNS请求完成,现在A可以与212.212.212.4建立TCP连接并发送HTTP request来获取网页内容了
2.5 Peer-to-Peer File Distribution
之前我们讨论的所有协议都是基于C/S架构的,需要一台不停工作的S来为C提供服务,而在P2P架构中,任意两台主机可以直接配对并互相通信,任意两台终端都互为彼此的 peer ,所有在P2P中的实体都即可作为server也可作为client,因此P2P架构中所有的实体都可以称为peer。
本章我们将讨论P2P的一个最基本的应用:某一个节点将一个大文件发送给其他多个节点。试想如果用C/S架构来完成这件事,server的负担将会非常重——它必须把这一个巨大的文件逐个传输给所有其他的client,但如果使用P2P架构,网络中每一个peer都可以把自己当前已经接收到的文件的任意部分发给其他peers,其他peers又把自己已接收文件的任意部分发送给它们的peers,这样就将文件分发的任务均摊给了每一个网络中的节点,提高传输效率同时,避免了单点网络负担过重。
截止2016年,最流行的P2P文件分发协议是BitTorrent。在BitTorrent协议中,对某一个文件,所有参与该文件传输的节点(peer)组成一个 torrent ,该文件被划分为一个个的chunks(固定大小,一般为256Kb),每一对peers互相下载对方的chunks。
一个刚参与进来的peer没有chunk,不过随着它不断的与其他peer结对,其他peer会给它传输(它缺失的)chunks,同时它也会不断给其他节点传输(对方缺失的)chunks。当一个节点获取到了完整文件后,它可以选择直接离开,也可以选择继续留下作为server给别人传输文件。
每一个torrent中都包含一个 tracker,每当一个peer加入torrent时,它会在tracker上注册并周期性的告知tracker自己仍然在当前torrent中,这就相当于tracker可以一直监视本torrent内的情况。
当一个peer A加入torrent时,tracker会在本torrent中随机选择一些peers并将它们的IP地址发送给A,拿到这个peers列表后,A就会并行的与该列表上所有的peers建立TCP连接。现在假定所有与A建立了连接的peers叫做neighboring peers,随着时间的推移,A的neighboring peers中有一些会退出,也会有一些新加入peers与A建立连接,因此A的neighboring peers list是 动态变化的 。
与所有neighboring peers建立连接后,A就会周期性的询问它所有的邻居:你们手上都有哪些trunk?列好清单发给我看看。A收到清单后,就会根据清单上的内容,向所有邻居请求它缺少的trunks(优先请求最稀缺的trunk,以此来尽力保持每个trunk数量的平衡)。
2.6 Video Streaming and Content Distribution Networks
2.6.1 Internet Video
首先我们来了解一下什么是video。
video本质上是一系列图片,这些图片以每秒24~30张的速度显示在屏幕上。一张数码图片由一组pixels组成,每一个pixel以比特的形式编码,这个编码的值就代表了亮度和颜色。
video的一个重要特性就是其比特率可以被压缩,比特率越低,画质越差,所占硬盘空间越小。现在一般视频网站都会为一个视频提供不同清晰度的版本,方便用户根据自己的网络状况进行选择。
2.6.2 HTTP Streaming and DASH
使用HTTP Streaming的话,视频就存储在HTTP server上。当client想要观看视频时,只需要与HTTP server建立TCP连接,并发送HTTP GET请求指定视频(用URL标识),之后server就会把视频打包在HTTP回复中发送给client。client这边视频播放器会有一个buffer,当接收数据达到一定阈值时就会开始播放视频。
一开始很多视频公司(比如YouTube)都是采用HTTP Streaming方式提供服务,但它的缺点在于所有的用户只能观看同一种清晰度的视频,为了提高灵活性,现在一般一种新的基于HTTP的streaming方式:Dynamic Adaptive Streaming over HTTP(DASH) ,它为每一个视频提供了多个不同清晰度的版本。
2.6.3 Content Distribution Networks
试想像Youtube这样的公司,每秒钟都要为全世界的网友传输巨量的视频数据,这个任务该如何完成呢?
利用Content Distribution Networks(CDNs) 技术,它可以管理多个分布在不同地理位置的服务器集群(cluster),在这些服务器中存储视频(可能还有音频和文件),并指引用户去距离最近的cluster请求视频数据。如果请求的视频并未存储在当前cluster中,则当前cluster会去其他cluster请求该视频,并在将该视频存储在本地的同时发送给用户。