Web服务,http协议。

一·web

  1。web是一种网站服务器,C/S架构,比较流行的Apache,Nginx,IIS。客户能够去服务器请求资  

     资源。

  2.使用http协议,服务器html或者xml格式文件,客户浏览器访问资源(url)。

  3.过程包括服务器套接字监听直到和客户套接字建立连接,客户请求资源(获得资源方式,资源位置url),服务器响应把资源按要求发送回客户。

二·http

  1.http超文本传输协议,应用层协议,基于tcp/ip协议。

  2.http监听tcp/80端口。

  3.http事务大体过程。

        1.一般客户使用浏览器,输入网址,要得到服务器IP地址,先要查看浏览器缓           存(缓存时间TTL定义),没有就去查看本地hosts文件,etc/named.conf中           定义的域,还没有查看自己设置的DNS服务器缓存,再没有DNS服务器去给你           递归去。

        2.tcp3次握手,建立连接。

        3.客户发送请求,顺便说下请求消息报文的大体结构。

            a.请求行包括请求方法一般用GET,URL字段,http版本。例如GET                     /index.html HTTP/1.1。

            b.请求头部,附加的一些信息。

              Host接受请求的服务器地址,可以是IP:端口号,也可以是域名

                 User-Agent发送请求的应用程序名称

                 Connection指定与连接相关的属性,如Connection:Keep-Alive

                 Accept-Charset通知服务端可以发送的编码格式

                 Accept-Encoding通知服务端可以发送的数据压缩格式

                 Accept-Language通知服务端可以发送的语言格式

            4.接收请求,顺便说下接收多处理模块MPM。

                 一般服务器都是高并发响应,keep-alive特性使得一次连接,能                     多个请求,要适当用keep时间和资源请求数量坐下限定。

                prefork一个进程处理一个请求,预先多个进程是谓进程池。

                worker多个进程一个进程生成多个线程,一个线程处理一个请求,预                       先多个线程。

                event多个进程一个进程处理多个请求,预先多个进程。

             5.响应报文

                  a.状态行,例如HTTP//1.1 200 OK

                     包含版本号,状态码。

                     状态码大体如下

                         100-199请求过程状态。

                         200-299接收请求和处理过程状态,如200接收处理都OK

                         300-399详细请求,如301资源位置变化,307资源位置临时                                  变化

                         400-499客户错误,如401未经授权,404找不到主机。

                         500-599服务端错误,如500服务器错误,503不接受请求

                  b.响应头部,附加好多信息,如下

应答头 说明
Allow 服务器支持哪些请求方法(如GET、POST等)。
Content-Encoding 文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的 Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader("Accept- Encoding"))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。
Content-Length 表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入 ByteArrayOutputStram,完成后查看其大小,然后把该值放入Content-Length头,最后通过 byteArrayStream.writeTo(response.getOutputStream()发送内容。
Content-Type 表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentTyep。
Date 当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。
Expires 应该在什么时候认为文档已经过期,从而不再缓存它?
Last-Modified 文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件 GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。
Location 表示客户应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。
Refresh 表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。
注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的 HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。

注意Refresh的意义是“N秒之后刷新本页面或访问指定页面”,而不是“每隔N秒刷新本页面或访问指定页面”。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV="Refresh" …>。

注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。

Server 服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。
Set-Cookie 设置和页面关联的Cookie。Servlet不应使用response.setHeader("Set-Cookie", …),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。
WWW-Authenticate 客户应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader("WWW-Authenticate", "BASIC realm=\"executives\"")。
注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。

                    6.响应正文

              响应过程和数据读取存数也有好多内容的,下回分解吧。

                       

原创文章,作者:蓝色深空,如若转载,请注明出处:http://www.178linux.com/6036

(0)
蓝色深空蓝色深空
上一篇 2015-07-03
下一篇 2015-07-06

相关推荐

  • N25-第六周作业

    第六周 请详细总结vim编辑器的使用并完成以下练习题 文本编辑器: vim:     模式化的编辑器         基本模式:          &…

    Linux干货 2016-12-28
  • 文本处理工具grep

    正则表达式:Regular Expression REGEXP         由一类特殊字符及文本字符所编写的模式,表示控制或通配的功能 两类:     基本正则表达式BRE:     扩展正则表达式ERE: *** grep    GLoble searc…

    Linux干货 2016-08-04
  • 编译内核

    了解内核;内核设计体系:单内核,微内核     linux:单内核设计,但充分借鉴了微内核体系的设计优点;为内核引入了模块化机制; 内核的组成部分一般有三种;     kernel:内核核心,一般为bzimage (bzip2格式所压缩的内核映像文件),这个文件通常位于/boot…

    Linux干货 2016-09-21
  • 三剑客-sed小结

     sed是一款流编辑器工具,通常我们用来对文本进行过滤与替换操作,特别是当你想要对几十个配置文件做统一更改时,你会感受到sed的魅力。它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到…

    系统运维 2016-07-26
  • 常用大数据词汇中英文对照表

    A 聚合(Aggregation) – 搜索、合并、显示数据的过程 算法(Algorithms) – 可以完成某种数据分析的数学公式 分析法(Analytics) – 用于发现数据的内在涵义 异 常检测(Anomaly detection) – 在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outlie…

    Linux干货 2015-03-10
  • 第11天:网络基础,属性配置

    http://note.youdao.com/noteshare?id=bf6e776e7271953bffe1bdf949df4e8f

    Linux干货 2016-09-06