FreeBSD连载(81):超文本传输协议HTTP

发表于:2007-07-01来源:作者:点击数: 标签:
第9章 设置WWW服务 由于能够提供图形、声音等多媒体数据,WWW已经成为Internet使用者最喜爱的访问方式,当前的大部分Internet流量均是由WWW浏览产生的。由于这种多媒体浏览方式的帮助,Internet不再仅仅是由专业人员使用,对计算机了解不多的普通使用者也能

第9章 设置WWW服务

  由于能够提供图形、声音等多媒体数据,WWW已经成为Internet使用者最喜爱的访问方式,当前的大部分 Internet流量均是由WWW浏览产生的。由于这种多媒体浏览方式的帮助,Internet不再仅仅是由专业人员 使用,对计算机了解不多的普通使用者也能进入Internet的世界,享受Internet带来的新鲜内容。

  虽然WWW服务非常之流行,然而要建立一个WWW服务器以提供WWW服务却仍然属于专业领域的任务。当前能够 提供WWW服务的软件有很多种,分别运行在不同的操作系统之上,其中有一些软件能够运行在个人使用的Windows桌 面系统上,具备图形界面且易于配置,因此很多希望尝试提供WWW服务的使用者常常会安装并试运行过这些系统。然而这些 系统基本上是只能提供极其有限的服务能力的系统,如果要想提供一个能够允许正常的Internet访问的服务器系统, 至少应该使用Windows NT系统。当要求更高的性能和稳定性系统时,就应该选择Unix。FreeBSD显然是 使用Intel平台系统时,可供选择的极其优秀的WWW服务器操作系统。

  • 基本概念

  虽然普通使用者只需要了解一些常识性的概念,如URL、HTML等,就能通过浏览器很轻松的访问Internet 上的Web资源。然而要建立一个Web服务器,却需要更多的相关概念,如HTTP、MIME、CGI等,这样才能 了解Web服务器的设置参数,以正确设置这些参数建立一个真正可用的服务器系统。

  • 超文本传输协议HTTP

  用于支持WWW浏览的网络协议为HTTP,这是一种最基本的客户机/服务器的访问协议。浏览器向服务器发送请 求,而服务器回应相应的网页。HTTP协议从1990年开始出现,发展到当前的HTTP 1.1标准,已经有了相当多 的扩展,然而其最基本的实现是非常简单的,服务器需要进行的额外处理相当少,这也是为什么Web服务器软件如此众多的 原因之一。

  • 请求方法
  • 通常,HTTP协议使用端口80来提供客户访问,因此也可以使用其他的网络软件,如telnet,模拟客户向服务器发送请求,来查看HTTP的传输方式。

    clearcase/" target="_blank" >cccccc width=100%>
    $ telnet webserver 80 Trying 192.168.0.1... Connected to webserver. Escape character is @#^]@#. GET /index.html

      当telnet显示了Connect等信息建立了连接之后,服务器就等待使用者输入请求,而不进行任何提示。 上例中,使用者输入GET /index.html指令,则服务器立即将相应的网页返回,然后关闭连接。

      客户程序向服务器发送的请求可以有不同的类型,这样服务器可以根据不同的请求类型进行不同的处理。在HTTP 1.0中,定义了三种最基本的请求类型,GET、POST和HEAD,这些请求方法的实现方式均与上例相同,客户程序 用大写指令将请求发送给服务器,后面跟随具体的数据。

      GET请求最为常见,它后面跟随一个网页的位置,服务器接受请求并返回其请求的页面。除了页面位置作参数之外 ,请求还可以跟随协议的版本如HTTP/1.0等作为参数,以发送给服务器更多的信息。

      POST请求要求服务器接收大量的信息,除了POST后面跟随的参数之外,浏览器还会在后面持续发送数据,让 服务器进行处理。通常,POST方法是和CGI程序分不开的,服务器应该启动一个CGI程序来处理POST发送来的数 据。

      HEAD请求在客户程序和服务器之间进行交流,而不会返回具体的文档。当使用GET和POST方法时,服务器 最后都将结果文档返回给客户程序,浏览器将刷新显示。而HEAD请求则不同,它仅仅交流一些内部数据,这些数据不会影 响浏览的过程。因此HEAD方法通常不单独使用,而是和其他的请求方法一起起到辅助作用。一些搜寻引擎使用的自动搜索 机器人使用这个方法来获得网页的标志信息,或者进行安全认证时,使用这个方法来传递认证信息。

      除了这三种最常见的访问方法之外,在HTTP 1.1中还定义了更多的访问方法类型,如PUT,用于将网页放 置到正确位置,DELETE用于删除相关文档等。这些方法并不常用,因而大部分Web服务器软件并没有实现他们。然而 对于特定场合他们还是非常有用的,例如使用软件编辑网页时,网页编辑器可以使用这些方法,管理不同的网页。

      如果服务器不支持客户发送的请求方法,服务器将返回错误并立即关闭连接。

  • 服务器对HTTP的处理方式
  •   HTTP协议的这种请求/回应的模式,使得服务器只能根据客户程序的请求发送回信息,这样的好处是客户具备很 大的自由度,可以任意访问服务器上的信息。因此就存在多个客户同时访问一个服务器的问题。

      在Unix下,由一个守护进程来监视来自客户程序的请求,当守护进程接受到一个请求时,就建立一个新的进程对 请求进行处理。通常服务器能创建足够多的新进程来回应客户的请求,然而如果同时发送请求的客户太多,那么服务器就有可 能出现超载的情况,创建进程的速度跟不上众多客户发送请求的速度,这样就造成了服务器对外表现反应迟缓。此外,为了提 高用户使用浏览器时的性能,现代浏览器还支持并发的访问方式,浏览一个网页时同时建立多个连接,以迅速获得一个网页上 的多个图标,这样能更快速完成整个网页的传输。但是对服务器来讲,更增加了瞬间负载。

      显然,造成这个问题的关键是服务器对HTTP协议的处理方式,一次请求就要建立一个连接,在网页上充满了多个 较小的图象文件的时候,那么服务器和客户程序之间的大部分工作是用于建立连接,而真正用于传递数据的工作却很轻松。因 此,更好的利用现有连接,减少建立连接的消耗,就需要能在一次连接中回应多个请求。在HTTP 1.1中提供了这种持 续连接的方式,而下一代HTTP协议:HTTP-NG更增加了有关会话控制、丰富的内容协商等方式的支持,来提供更高 效率的连接。

      除了针对每次请求都建立一个新进程的处理方式之外,HTTP守护进程也能使用其他的方式处理多个请求,例如使 用多线程,或者使用异步方式在不同请求之间进行切换,就能在一个进程内处理多个请求。虽然比起建立新进程来讲,这样消 耗的处理器资源略微减少,但是并不能从根本上消除并发访问带来的处理器资源不足的问题。一般使用线程和异步方式的程序 较为复杂,不能很容易扩充对新特性的支持,并有可能因为程序内部要自己进行同步等原因也会造成资源消耗。使用这些方式 ,虽然对处理静态的网页有好处,但对于执行CGI程序,仍然要创建子进程进行处理。因此,大部分运行在Unix上的守 护程序仍然使用多进程的方式,这种方式简单却有效。

      即使对于使用多进程方式进行处理的Web服务器,也有不同的处理方式。Unix系统中提供了超级服务器进程inetd ,因此简单的Web服务器可以使用inetd来启动真正的Web服务器。然而,inetd效率不高,使用in etd的服务器不能用作高负载的服务器系统,因此高负载的Web服务器,本身来监听客户连接请求,并负责启动子进程真 正处理客户的请求。

      如果选择的服务器程序的确需要使用inetd来启动,可以选择与inetd功能相同,但效率更高的超级服务器 进程tcpserver,它可以比inetd更高效的启动服务进程。

    未完,待续。。。  

    原文转自:http://www.ltesting.net