HTTP协议浅析 http视频流传输协议

1、HTTP协议简介

浏览器和Web服务器之间一问一答的交互过程遵守一定的规则,这个规则就是HTTP协议。HTTP协议时TCP/IP协议集中的一个应用层协议,定义了浏览器和Web服务器之间交换数据过程和数据本身的格式。现在广泛应用的有HTTP/1.0和HTTP/1.1两个版本,1.1和1.0相比最大的特点就是增加对长连接的支持。

2、协议流程

2.1 HTTP/1.0的通信过程

HTTP/1.0只支持短连接,每次连接只处理一个请求,即使对同一站点的每一个页面的访问,浏览器和服务器之间都要建立一次单独的链接。通信过程如图1所示:

图1:HTTP1.0通信过程

2.2 HTTP /1.1的通信过程

HTTP/1.1支持长连接,在一个TCP连接上可以传送多个HTTP请求和应答,减少建立和关闭连接的消耗和延迟。例如一个包含多张图片资源的网页文件的多个请求和响应可以在同一个连接中传输,并且还允许浏览器客户端不用等待上一次请求的结果返回就可以发送下一个请求,也就是支持pipeline管线化。HTTP 1.1的通信过程如图2所示:

图2:HTTP 1.1通信过程

3、HTTP请求

完整的HTTP请求包括:一个请求行、若干HTTP头域和可选的实体内容三部分:

3.1 请求行

请求行以一个方法符号开头,以空格分开,后面跟着请求的URI和协议版本,格式如下:

MethodRequest-URIHTTP-Version CRLF

其中的Method表示请求方法,Request-URI是同一资源标识符,HTTP-Version表示请求的HTTP协议版本,CRLF表示回车换行。

请求方法有8种,方法名全为大写:

(1)GET请求获取Request-URI指定的资源

(2)HEAD 请求获取Request-URI制定资源的响应消息报头

(3)POST 用于向服务器提交数据,正常情况下带有“消息体”

(4)PUT请求服务器存储一个资源,并用Request-URI作为其标识

(5)DELETE请求服务器删除Request-URI所标识的资源

(6)TRACE 请求服务器回送收到的请求信息,主要用于测试或诊断

(7)CONNECT 保留将来使用

(8)OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求

HTTP头域分为四种:通用头域、请求头域、响应头域和实体头域。每个头域由一个域名、冒号和域值三部分组成,域名大小写无关,域值前可以添加任何数量的空格符。

3.2.1 通用头域

通用头域是指请求和响应都支持的HTTP头域,最常见的有Cache-Control、Connection和Transfer-Encoding,具体含义如下:

(1)Cache-Control:指定请求和相应遵循的缓存机制,最常见的值是no-cache,指示请求和响应消息不能缓存;

(2)Connection:用于指定处理完本次请求/响应后,客户端和服务器是否还要继续保持连接。

(3)Transfer-Encoding:用于指定实体内容的传输编码方式。

3.2.2 请求头域

请求头域是只有在请求头中带有的,用于向服务器传递关于请求或者关于客户端的附件信息。常见的有:Accept、Accept-Encoding、Accept-Language、Accept-Charset、Host、Referer、User-Agent和Cookie,具体含义如下:

(1)Accept:用于指定客户端程序能够处理的MIME类型,多个时用逗号隔开;

(2)Accept-Encoding:指定客户端程序支持的压缩方式;

(3)Accept-Language:指定客户端期望返回哪个国家语言的文档;

(4)Accept-Charset:指定客户端程序可以使用的字符集;

(5)Host:指定资源所在的主机名和端口号;

(6)Referer:指定请求uri的源资源地址,也就是用户从哪个uri过来,允许服务器生成回退链表;

(7)User-Agent:浏览器客户端信息,如使用哪种浏览器等;

(8)Cookie:服务器在浏览器端留下的信息,这是最重要的请求头字段之一,例如访问百度的时候通常会带有类似如下的Cookie:

BAIDUID=27C48D40C9CDCF48CEAAFCFD9C47FC52:FG=1;BD_UTK_DVT=1

3.2.3 响应头域

响应头域只在HTTP响应中出现,在第4章节详细讲解。

3.2.4 实体头域

HTTP请求和响应中都可以包含实体头域,实体头域包含实体内容的一些信息。常见的实体头域有:Content-Encoding、Content-Length、Content-Type和Expires,具体含义如下:

(1)Content-Encoding:指明实体内容采用的压缩方式;

(2)Content-Length:指明实体内容的长度,单位为字节;

(3)Content-Type:指定实体内容的MIME类型;

(4)Expires:指明实体内容在什么时间之后过期,不再缓存。

3.2可选实体内容

HTTP请求是否带有实体内容主要看请求行中的请求方法,我们只分析GET和POST两种主要的类型,GET方法用于获取服务器上的特定资源,一般没有实体内容。POST方法用于向服务器提交数据,一般带有实体内容。下面是一个请求方法为POST的HTTP请求的完整数据(其中绿色标注的部分是实体内容):

POST /deal_post.phpHTTP/1.1

Referer: http://网站域名/post.php

Accept-Language: zh-cn

Content-Type:application/x-www-form-urlencoded

User-Agent: Mozilla/4.0

Host: 网站域名

Content-Length: 43

Connection: Keep-Alive

Cache-Control: no-cache

Cookie:BAIDUID=27C48D40C9CDCF48CEAAFCFD9C47FC52:FG=1;

data1=a&data2=b&data3=c&Submit=�ύ

4、HTTP应答

HTTP应答包括:一个状态行、若干消息头和实体内容三部分组成。

4.1 状态行

状态行以HTTP协议版本开头,后面跟着状态码和简单的状态描述,格式如下:

HTTP-Version Status-CodeReason-Phrase CRLF

其中的Status-Code是一个三个数字组成的返回状态码,Reason-Phrase提供一个简单的状态描述,如对于200成功页面就是“OK”,对于404页面未找到错误就是“Not Found”。

HTTP应答的状态行根据状态码可以分为五种类型:

(1)1xx:信息,请求收到,继续处理;

(2)2xx:成功,行为被成功地接受、理解和采纳;

(3)3xx:重定向,为了完成请求,必须进一步执行的动作;

(4)4xx:客户端错误,请求包含语法错误或者请求无法实现;

(5)5xx:服务端错误,服务器不能正确执行一个正确的请求。

下表中是检索前段Web服务器测试中常见的几种返回状态码:

状态码

含义

200

正确返回结果

302

页面跳转

304

页面未改动

400

请求错误,不符合协议

404

请求的页面未找到

405

方法不允许

501

未被使用

503

服务不可用

4.2 HTTP头域

前面我们介绍过HTTP头域可以分为四种,HTTP应答包含通用头域、响应头域和实体头域,通用头域和实体头域前面已经介绍过,本节主要介绍响应头域。

响应头域允许服务器传递不能放在状态行中的附件信息,主要用于描述服务器的信息和Request URI的进一步信息,检索前段Web服务器测试中最常见的响应头域有Server、Location、Set-Cookie和P3P,具体含义如下:

(1)Server:说明响应服务器的名称,如BWS/1.0或者Apache/1.3.27;

(2)Location:在302跳转页面应答的时候,带有Location指明跳转的目的地址;

(3)Set-Cookie:服务器对浏览器端设置Cookie,例如不带Cookie访问BWS的时候,BWS会返回类似如下的Set-Cookie内容:

BAIDUID=B589E67D8A2C6B15C2FDD8F20C3DC0D5:FG=1; expires=Wed,26-Aug-39 01:47:59 GMT; path=/; domain=.baidu.com

(4) P3P:设置允许Cookie的跨域访问

P3P: CP=" OTI DSP CORIVA OUR IND COM "

4.3 实体内容

HTTP响应的实体内容按照传输编码方式(编码的目的是让浏览器和服务器之间能正确收发数据)区分主要分为三种:

(1)由Content-Length明确标明实体内容,这是最常见的一种类型;

(2)没有Content-Length头域,由Transfer-Encoding指明采用Chunked编码;

(3)既没有Content-Length也没有Transfer-Encoding标明采用Chunked编码;

4.3.1Content-Length类型

这是最常见的一种类型,由Content-Length头域标明后续的实体内容的字节长度,浏览器或者服务器根据解析出来的Content-Length去读取后续的实体内容。下面是一个该类型的HTTP响应(绿色部分是实体内容,长度为20个字节):

HTTP/1.1 200 OK

Date: Wed, 26 Aug 2009 02:45:57 GMT

Server: Apache/2.0.63 (Unix) PHP/5.2.6

Content-Length:20

Content-Type: text/html

Content-Language: en

<html>content</html>

4.3.2Chunked类型

Chunked编码类型也是较常见的,当服务器不能预先确定HTTP报文体的长度时,无法在应答头域Content-Length域来指明报文体长度,此时需要采用chunked编码,通过Transfer-Encodeing头域说明采用chuncked编码。检索前段模块中Apache-snap很多地方就采用了Chunked编码,而BWS不支持Chunked编码。

chunked编码的基本方法是将大块数据分解成多块小数据,每块都可以自指定长度,其具体格式如下:

Chunked-Body =*chunk //0至多个chunk

last-chunk//最后一个chunk

trailer //尾部

CRLF//结束标记符

chunk = chunk-size [ chunk-extension ]CRLF

chunk-data CRLF

chunk-size= 1*HEX

last-chunk= 1*("0") [ chunk-extension ] CRLF

chunk-extension= *( ";"chunk-ext-name [ "=" chunk-ext-val ] )

chunk-ext-name =token

chunk-ext-val= token | quoted-string

chunk-data= chunk-size(OCTET)

trailer= *(entity-header CRLF)

Chunked-Body表示经过chunked编码后的报文体。报文体可以分为chunk, last-chunk,trailer和结束符四部分。chunk的数量在报文体中最少可以为0,无上限;每个chunk的长度是自指定的,即起始的数据必然是16进制数字的字符串,代表后面chunk-data的长度(字节数)。这个16进制的字符串第一个字符如果是“0”,则表示chunk-size为0,该chunk为last-chunk,无chunk-data部分。可选的chunk-extension由通信双方自行确定,如果接收者不理解它的意义,可以忽略。

trailer是附加的在尾部的额外头域,通常包含一些元数据(metadata, meta means "aboutinformation"),这些头域可以在解码后附加在现有头域之后。

下面我们以一个实例来分析一下chunked编码页面,首先在apache(本机端口9000)的发布目录htdocs下准备一个文件test.php,内容如下:

<html>

<head>

<title>Hi</title>

<link rel="stylesheet"href="style.css" type="text/css"

media="all"/>

</head>

<?php flush();sleep(5); ?>

<bodyonload="loaded();">

<h1>Hi</h1>

</body>

</html>

在测试机上通过echo –ne “GET /test.phpHTTP/1.1rnHost: www.baidu.comrnrn” | nc 127.0.0.19000访问该页得到的结果如下:

HTTP/1.1200 OK

Date:Thu, 27 Nov 2008 05:51:25 GMT

Server:Apache/2.0.63 (Unix) PHP/5.2.6

X-Powered-By: PHP/5.2.6

Transfer-Encoding: chunked

Content-Type: text/html

74

<html>

<head>

<title>Hi</title>

<link rel="stylesheet" href="style.css"type="text/css" media="all" />

</head>

29

<body>

<h1>Hi</h1>

</body>

</html>

0


查看应答的二进制内容如下:

由应答报文可以看出,在头域结束符“rnrn”之后是ASCII码74,表示第一个chunk的chunk-size,转换为十进制是116字节,74后面紧接着“rn”是chunk-size和chunk-data的分隔符,因此这里没有chunk-extension,这里我们可以看出头域结束符“rnrn”之后紧接的地址是000000E7,在000000E7后面是37 34 0d 0a,也就是“74rn”,74表示第一个chunk-data的十六进制长度,那么第一个chunk-data的起始地址就是000000EB,下一个chunk的起始地址就是000000EB + 74 + 2 =00000161,在0000015F的位置我们可以看到0d 0a 32 39 0d 0a,也就是“rn29rn”,前一个“rn”表示上一个chunk的结束,然后29表示十六进制的下一个chunk-data的长度,后一个“rn”是chunk-size和chunk-data的分隔符。

从0000015F+ 2 + 2 + 2 =00000165开始为第二个chunk-data的数据,长度为41个字节,于是下一个chunk的起始位置就是00000165 + 29 =0000018E,这个地方的数据是0d 0a 30 0d 0a,也就是“0rnrn”,0作为chunk-size表示这个chunk为最后一个chunk,第一个“rn”表示最后一个chunk的结束,而第二个“rn”表示没有tailer部分,整个chunk-body结束。

4.3.3 特殊类型

特殊类型指的是HTTP响应中既没有Content-Length指明实体内容的长度,也没有Transfer-Encoding指明采用Chunked编码,只是服务器在发送完响应之后就直接关闭连接。

下面是一个特殊类型HTTP应答的例子:

HTTP/1.1 413 Request Entity TooLarge

Date: Wed, 26 Aug 2009 05:16:39GMT

HTTP协议浅析 http视频流传输协议

Server: Apache/2.0.63 (Unix)PHP/5.2.6

Vary: Accept-Encoding

Connection: close

Content-Type: text/html;charset=iso-8859-1

<!DOCTYPE HTML PUBLIC"-//IETF//DTD HTML 2.0//EN">

<html><head>

<title>413 Request Entity TooLarge</title>

</head><body>

……

特殊类型的HTTP应答在检索前段模块中也是会出现的(如Apache),应答的结束标志是服务器关闭连接,在测试Transmit和UTR的时候应该尤其注意检查能否正确处理该类型的HTTP应答。

  

爱华网本文地址 » http://www.aihuau.com/a/25101017/328963.html

更多阅读

Internet 传输层协议 snmp使用的传输层协议

本章介绍了 Internet 传输层的两个重要协议 TCP 和 UDP ,包括这两种协议的报文格式和工作原理。特别地,本章详细介绍了 TCP 的连接建立与关闭,以及连接建立与关闭过程的状态转换。3.1 引言Internet 在传输层有两种主要的协议:一种是面向

TCP/IP协议 tcpip协议分为几层

http://course.cug.edu.cn/netinfo/Chapter06/6.4.htm TCP/IP协议简介因特网上使用的通信协议——TCP/IP协议与OSI相比,简化了高层的协议,简化了会话层和表示层,将其融合到了应用层,使得通信的层次减少,提高了通信的效率。下图示意了TCP/

模拟登录-以新浪微博为例 新浪微博登录失败

在很多情况下,网站的访问都需要用户登录,要想通过程序获取页面信息(比如说爬虫)就必须通过模拟登录来实现。下面是我对新浪微博的模拟登录的一些研究。利用HttpFox监视并且分析所有进出浏览器的HTTP网络传输。HttpFox是FireFox浏览器的

BIT北漂系列(3)——HDLC协议原理及其概述_雪无痕 hdlc帧

HDLC协议原理及其概述北京理工大学 数字通信技术研究所 黄英杰摘要:HDLC:High Level Data LinkControl(高级数据链路控制规程)。是面向比特的数据链路控制协议的典型代表,它是由国际标准化组织(ISO)定制的,为在比特同步物理层上的数据链

声明:《HTTP协议浅析 http视频流传输协议》为网友桃花定终生分享!如侵犯到您的合法权益请联系我们删除