http

http

  • http:hyper text transfer protocol, 应用层协议, 80/tcp, 文本协议

  • html:hyper text mark language, 是一种编程语言,超文本标记语言;

    • html格式示例:

      <html>
        <head>
            <title>TITLE</title>
        </head>
        <body>
            <h1></h1>
                <p> blabla... <a href="http://www.magedu.com/download.html"> bla... </a> </p>
            <h2> </h2>
        </body>
      </html>
  • http协议版本:

    • http/0.9:原型版本,功能简陋

      • 只允许客户端从服务器下载文件;
    • http/1.0: cache, MIME, method,

      • MIME:Multipurpose Internet Mail Extesion,可实现把非文本信息编码成文本格式的数据,由仅传递文本数据的协议传到目的端之后再还原回来
      • method:GET, POST, HEAD,PUT, DELETE,TRACE, OPTIONS
    • http/1.1:增强了缓存功能;
    • http/2.0
  • http工作模式:

    • 一次完整的http事务:请求<–>响应

      • http请求报文:http request
        http响应报文: http response
    • 一次完整的http请求处理过程:
      (1) 建立或处理TCP连接:接收请求或拒绝请求;
      (2) 接收请求:接收来自于网络上的主机请求报文中对某特定资源的一次请求的过程;
      (3) 处理请求:对请求报文进行解析,获取客户端请求的资源及请求方法等相关信息;
      (4) 访问资源:获取请求报文中请求的资源;服务器访问本地资源;
      (5) 构建响应报文
      (6) 发送响应报文
      (7) 记录日志:记录访问网站的信息;

    • 接收请求的模型:
      并发访问响应模型:当一个用户进行完一次请求时,服务端使用已完成的套接字来进行维持之后的资源传送;

      1. 单进程I/O模型:启动一个进程处理用户请求;这意味着,一次只能处理一个请求,多个请求被串行响应;
      2. 多进程I/O结构:父进程接收请求,由父进程并行启动多个子进程,每个子进程响应一个请求;
      3. 复用的I/O结构:一个进程响应n个请求;

        • 多线程模式:一个进程生成n个线程,一个线程处理一个请求;
        • 事件驱动(event-driven):使用事件回调机制,一个进程直接处理n个请求;
      4. 复用的多进程I/O结构:启动多个(m)个进程,每个进程生成(n)个线程;响应的请求的数量:m*n
    • 处理请求:分析请求报文的http请求报文首部

      • http协议:
        http请求报文首部
        http响应报文首部
      • 请求报文首部的格式:

        <method> <URL> <VERSION>
        HEADERS: (name: value)
        <request body>
    • 访问资源:获取请求报文中请求的资源

      • web资源:web resource

        • 静态资源(不对数据做任何处理,原样不动的发给客户端;): .jpg, .png, .gif, .html, txt, .js, .css, .mp3, .avi
        • 动态资源(用户请求的资源,服务端通过执行程序做出处理,发送给客户端的是程序的运行结果;因此,不同的用户、不同的请求会得到不同的结果;): .php, .jsp

          注意:一个页面中展示的资源可能有多个;每个资源都需要单独请求;

        • 资源的标识机制:URL
          Uniform Resource Locator:用于描述服务器某特定资源的位置;

          例如:  http://www.sina.com.cn/index.html
          Scheme://Server[:Port][/PATH/TO/SOME_RESOURCE]
          
          文档路径映射:
          DocumentRoot /var/www/html/
      • web服务器,即存放了web资源的主机,负责向请求者提供对方请求的静态资源,或动态资源运行生成的结果;这些资源通常应该放置于本地文件系统某路径下;此路径称为DocRoot;

        http://www.magedu.com/images/logo.jpg
        
        /var/www/html/: images/logo.jgp
      • web服务器的资源路径映射方式:
        (a) docroot
        (b) alias
        (c) 虚拟主机的docroot
        (d) 用户家目录的docroot
    • http请求处理中的连接模式:

      • 保持连接(长连接):keep-alive
        时间
        数量
      • 非保持连接(短连接)

URL:Unifrom Resource Locator

  • 基本语法:
    <scheme>://[<user>[:<password>]@]<host>:<port>/<path>[;<params>][?<query>][#<frag>]

    • URL方案:scheme
    • 服务器地址:ip:port
    • 资源路径:/<path>

      http://www.magedu.com:80/bbs/index.php, 
      https://www.magedu.com:443/
    • params: 参数;不需要查询数据库
      http://www.magedu.com/bbs/hello;gender=f
    • query:查询字符串;通常向动态资源传递数据库查询时的条件
      http://www.magedu.com/bbs/item.php?username=tom&title=abc
    • frag:片段;同一页面的不同位置显示
      https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html-single/Installation_Guide/index.html#ch-Boot-x86
  • 相对URL:同一个站点内的其他资源的引用;
    绝对URL:可以是同一个站点内的资源引用;也可以跨站点的资源引用;

http协议

  • http/0.9, http/1.0, http/1.1, http/2.0

  • http协议:stateless

    • 无状态:服务器无法持续追踪访问者来源
    • 引用机制来追踪同一用户:cookie, session
      cookie:当客户端第一次访问时,服务端会发送一个数据cookie,此数据有作用范围
  • http事务:
    请求:request
    响应:response

    • 报文语法格式:

      • request报文

        <method> <request-URL> <version>
        <HEADERS>
        
        <entity-body>
      • response报文

        <version> <status> <reason-phrase>
        <HEADERS>
        
        <entity-body>
      • method: 请求方法,标明客户端希望服务器对资源执行的动作;
        GET、HEAD、POST、PUT(DAV)、DELETE、TRACE、OPTIONS
      • version:HTTP/<major>.<minor>
      • status:三位数字,如200,301, 302, 404, 502; 标记请求处理过程中发生的情况;
      • reason-phrase:对于status状态码所标记的状态的简要描述;
      • headers:每个请求或响应报文可包含任意个首部;每个首部都有首部名称,后面跟一个冒号,而后跟上一个可选空格,接着是一个值;
      • entity-body:请求时附加的数据或响应时附加的数据;
  • 报文语法格式详解:

    • method(方法): 客户端告诉服务器端

      • GET:从服务器获取一个资源;
        HEAD:只从服务器获取文档的响应首部;
        POST:向服务器发送要处理的数据;
        PUT:将请求的主体部分存储在服务器上;
        DELETE:请求删除服务器上指定的文档;
        TRACE:追踪请求到达服务器中间经过的代理服务器;
        OPTIONS:请求服务器返回对指定资源支持使用的请求方法;
        协议查看或分析的工具:tcpdump, tshark, wireshark
    • status(状态码): 服务器端告诉客户端

      • 1xx:100-101, 信息提示
        2xx:200-206, 成功类
        3xx:300-305, 重定向
        4xx:400-415, 错误类信息,客户端的错误
        5xx:500-505, 错误类信息,服务器端的错误

      • 常用的状态码:
        200: 成功,请求的所有数据通过响应报文的entity-body部分发送;OK
        301: 请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;这种属于永久重定向;Moved Permanently
        302: 与301相似,但在响应报文中通过Location指明资源现在所处临时新位置;这种属于临时重定向;Found
        304: 客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;Not Modified
        401: 需要输入账号和密码认证方能访问资源;Unauthorized
        403: 请求被禁止;Forbidden
        404: 服务器无法找到客户端请求的资源;Not Found
        500: 服务器内部错误;Internal Server Error
        502: 代理服务器从后端服务器收到了一条伪响应;Bad Gateway
        原因:代理服务器的上级给代理服务器发过来了一个错误信息,导致代理服务器无法回应客户端;Bad Gateway
        正向代理:代理客户端访问互联网;反向代理:代理服务器处理客户端请求;

    • headers:
      格式:Name: Value

      • Response Headers 响应首部

        Cache-Control:public, max-age=600
        Connection:keep-alive
        Content-Type:image/png
        Date:Tue, 28 Apr 2015 01:43:54 GMT
        ETag:"5af34e-ce6-504ea605b2e40"
        Last-Modified:Wed, 08 Oct 2014 14:46:09 GMT
      • Request Headers 请求首部

        Accept:image/webp,*/*;q=0.8
        Accept-Encoding:gzip, deflate, sdch
        Accept-Language:zh-CN,zh;q=0.8
        Cache-Control:max-age=0
        Connection:keep-alive
        Cookie: ...
        Host:access.redhat.com
        If-Modified-Since:Wed, 08 Oct 2014 14:46:09 GMT
        If-None-Match:"5af34e-ce6-504ea605b2e40"
        Referer:https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux/6/html-single/Installation_Guide/index.html
        User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36
      • 首部的分类:

        1. 通用首部:既可以用在请求报文,也可用于响应报文;
        2. 请求首部
        3. 响应首部
        4. 实体首部
        5. 扩展首部
      • 通用首部:
        Date: 报文的创建时间;通常在请求报文中
        Connection:连接状态,如keep-alive, close
        Via:显示报文经过的中间节点
        Cache-Control:控制缓存
        Pragma

      • 请求首部:
        Accept:通知服务器自己可接受的媒体类型;
        Accept-Charset:接受的字符集
        Accept-Encoding:接受的编码格式,如gzip,deflate,sdch
        Accept-Language:接受的语言,告诉服务器可接受的语言

        Client-IP: 客户端IP
        Host: 请求的服务器名称和端口号
        Referer:包含当前正在请求的资源的上一级资源;
        User-Agent:客户端代理

        • 条件式请求首部:
          Expect:
          If-Modified-Since:自从指定的时间之后,请求的资源是否发生过修改;
          If-Unmodified-Since:与上述相反,是否没发生过修改;
          If-None-Match:本地缓存中存储的文档的ETag标签是否与服务器文档的Etag不匹配;
          If-Match:与上述相反,

        • 安全请求首部:
          Authorization:向服务器发送认证信息,如账号和密码;
          Cookie: 客户端向服务器发送cookie
          Cookie2:

        • 代理请求首部:
          Proxy-Authorization: 向代理服务器认证

      • 响应首部:

        • 信息性首部:
          Age:响应持续时长;
          Server:服务器程序软件名称和版本;安全起见,移除此项

        • 协商首部:某资源有多种表示方法时使用
          Accept-Ranges:服务器可接受的请求范围类型
          Vary:服务器查看的其它首部列表;

        • 安全响应首部:
          Set-Cookie:向客户端设置cookie;客户端第一次访问服务端时,服务端向客户端发送一个cookie
          Set-Cookie2
          WWW-Authenticate:来自服务器的对客户端的质询认证表单

      • 实体首部:
        Allow: 列出对此实体可使用的请求方法
        Location:告诉客户端真正的实体位于何处

        Content-Encoding:内容的编码格式
        Content-Language:内容使用的语言
        Content-Length: 主体的长度
        Content-Location: 实体真正所处位置;
        Content-Type:主体的对象类型

        • 缓存相关:
          ETag:实体的扩展标签;
          Expires:实体的过期时间;
          Last-Modified:最后一次修改的时间

原创文章,作者:s,如若转载,请注明出处:http://www.178linux.com/77496

(0)
ss
上一篇 2017-06-04
下一篇 2017-06-04

相关推荐

  • 运维练习题

     1、简述TCP三次握手四次挥手过程及各过程中客户端和服务器端的状态。TCP三次握手:客户端向服务器发送SYN包,客户端进入syn_SEND状态服务端收到客户端的发送的包返回ACK+SYN包,服务器端进入SYN_RECV状态客户端收到服务器端返回的包再发ACK包,客户端进入ESTABLISHED状态,服务器收到包也进入ESTABLISHED状态客户…

    Linux干货 2016-06-12
  • 每天一个Linux命令

        程序管理:      程序的组成部分:二进制程序文件,库文件,配置文件,帮助文件。                      二进制和库文件可执行,库文件不能独立执行,只能被调用时执…

    Linux干货 2017-04-08
  • Linux 用户、用户组及权限管理

    一、Linux用户及用户组的基本概念 用户:用户是实现能够将有限的资源在多个使用者之间进行分配;、 用户组:用户组是指多个用户的集合,方便对一类需要同样权限的用户授权 Linux是多用户、多任务的操作系统。     多用户指:多人同时使用系统资源;多任务:同时运行多个进程 二、用户及用户组类别 1、用户:名称解析库 /…

    Linux干货 2016-03-20
  • PageRank算法

    1. PageRank算法概述          PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。         是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的…

    Linux干货 2015-12-15
  • 第三周小练习

    1. 列出当前系统上所有已经登陆的用户的用户名,注意,同一个用户登陆多次,则显示一次即可 who -u|grep -o "^[[:alnum:]]*\>"|uniq 2. 取出最后登陆到当前系统的用户信息 who|tail -n1 3. 取出当前系统上被用户当作其默认shell的最多的那个sh…

    Linux干货 2016-11-21
  • systemd

    1、systemd (1)CentOS 7 使用systemd替换了SysV。Systemd目的是要取代一直在使用的init系统,兼容SysV和LSB的启动脚本,负责在系统启动或运行时,激活系统资源、服务器进程和其它进程。 (2)systemd的新特性: 系统引导是实现服务并行启动 按需启动守护进程 自动化管理各服务间的依赖关系 同时采用sockets式与D…

    Linux干货 2016-09-21