1、题目:Apache 下的虚拟主机设置联系地址:杨寿保 张焕杰 中国科学技术大学网络中心 安徽合肥中国科大网络中心 230026电话:0551-3603400传真:0551-3603143Apache 下的虚拟主机设置杨寿保 张焕杰 作者简介:杨寿保:教授,中国科学技术大学网络中心主任张焕杰:硕士研究生,就读于中国科学技术大学计算机科学与技术系摘要:本文介绍了 WWW 服务器的虚拟主机的工作原理,讨论了在 Apache WWW 服务器下的各种虚拟主机、尤其是大规模虚拟主机的设置技术,并比较了各种方式的特点。关键词:Apache WWW Virtual Hosting 虚拟主机 一、WWW 服务
2、器虚拟主机原理WWW 服务器虚拟主机是指使用一台物理机器,充当多个主机名的 WWW 服务器。比如由一台机器同时提供 http:/, http:/ 等的 WWW 服务,而浏览这些 WWW 站点的用户感觉不到这种方式下跟由不同的机器提供不同的服务有什么差别。使用 WWW 虚拟主机的好处在于,一些小规模的网站,通过跟其他网站共享同一台物理机器,可以减少系统的运行成本,并且可以减少管理的难度。另外,对于个人用户,也可以使用这种虚拟主机方式来建立有自己独立域名的 WWW 服务器,目前国内有很多公司都提供这种免费的服务。WWW 虚拟主机有两种工作方式:1.1 基于 IP 地址的虚拟主机方式这种方式下,不同
3、的主机名解析到不同的 IP 地址,提供虚拟主机服务的机器上同时设置有这些 IP 地址。服务器根据用户请求的目的 IP 地址来判定用户请求的是哪个虚拟主机的服务,从而进一步的处理。缺点:基于 IP 地址的虚拟主机方式需要在提供虚拟主机服务的机器上设立多个 IP 地址,既浪费了 IP 地址,又限制了一台机器所能容纳的虚拟主机数目。因此这种方式越来越少使用。但是,这种方式是早期使用的 HTTP 1.0 协议唯一支持的虚拟主机方式。1.2 基于主机名的虚拟主机方式由于基于 IP 地址的虚拟主机方式有如上的缺点,HTTP 1.1 协议中增加了对基于主机名的虚拟主机的支持。具体说,当客户程序向 WWW 服
4、务器发出请求时,客户想要访问的主机名也通过请求头中的“Host:”语句传递给 WWW 服务器。比如,, 都对应于同一个 IP 地址(即由同一台机器来给这两个虚拟域名提供服务) ,客户程序要存取http:/ 时,发出的请求头中包含有如下的内容:GET /index.html HTTP/1.1Host: WWW 服务器程序接收到这个请求后,可以通过检查“Host:”语句,来判定客户程序请求是哪个虚拟主机的服务,然后再进一步的处理。优点:提供虚拟主机服务的机器上只要设置一个 IP 地址,理论上就可以给无数多个虚拟域名提供服务,占用资源少,管理方便。目前基本上都是使用这种方式来提供虚拟主机服务。缺点
5、:在早期的 HTTP 1.0 版本下不能使用。实际上现在使用的浏览器基本上都支持基于主机名的虚拟主机方式。二、Apache 服务器下的虚拟主机设置技术2.1 Apache WWW 服务器简介Apache WWW 服务器是目前 Internet 上使用最广的 WWW 服务器软件。通过灵活的配置,它可以完成几乎您想得到的功能。本文主要介绍在 Apache 下设置各种虚拟主机的方法。2.2 Apache WWW 服务器下基于 IP 地址的虚拟主机设置使用这种虚拟主机方式,首先要在服务器上为每个虚拟主机单独设置一个 IP 地址。这些 IP地址可以通过增加多个网卡或者在一个网卡上设立多个 IP 地址来完
6、成。有了多个 IP 地址后,可以采用以下两种方式之一来设置 Apache:2.2.1 为每个虚拟主机运行一份 Apache采用这种方式,每一份 Apache 程序可以以单独的用户运行,因此各个虚拟主机之间互不影响。设置这种虚拟主机时,只要为每一份 Apache 设置一套配置文件就可以了,唯一需要注意的是:必须使用“Listen”语句,强制每一份 Apache 仅仅在属于“ 自己”的 IP 地址上接收服务请求。优点:各个虚拟主机之间互不干扰,安全性高。缺点:占用系统资源较多。2.2.2 多个虚拟主机共享同一份 Apache 采用这种方式,各个虚拟主机共享同一份 Apache,因此各个虚拟主机之间
7、有一定的影响,尤其是执行 CGI 程序时,可能会带来一些严重的安全问题。设置这种虚拟主机时,只要为每一个虚拟主机设置类似如下的信息即可DocumentRoot /home/company1优点:占用系统资源比上一种方式少。缺点:安全性低,每个虚拟主机仍然需要占用一个 IP 地址。2.3 Apache WWW 服务器下简单的基于名字的虚拟主机设置这种方式下,各个虚拟主机共享同一份 Apache,因此有 CGI 程序运行时,安全性也不高。设置这种虚拟主机时,只要为每一个虚拟主机设置类似如下的信息即可NameVirtualHost 111.222.33.44 ; 在这个 IP 地址接收虚拟主机的服务
8、ServerName DocumentRoot /www/company1ServerName DocumentRoot /www/company2优点:只要一个 IP 地址就可以提供大量的虚拟主机服务。缺点:安全性差。维护这些虚拟主机时需要更改配置文件,并且需要重新启动 Apache 进程才能起作用。因此不适合进行大规模的虚拟主机服务。2.4 Apache WWW 服务器下基于名字的大规模虚拟主机设置所谓大规模虚拟主机,是指能够提供非常多的虚拟主机服务,比如能提供超过数十万个域名的虚拟主机服务。如果使用以上讨论的方法,是很难完成的。实现这种服务的一种方式是利用Apache 功能强大的 URL
9、 重写功能。下面以一个实例来说明这种方式。2.4.1 Apache 中 URL 重写功能 Apache 1.2 及以后版本都有 URL 重写(Rewrite)功能。简单的说,URL 重写功能就是在Apache 接收到请求后,在处理的过程中能根据预先设定的规则,对请求中的 URL 进行修改。这些规则主要由正规表达式组成。重写依赖于输入的 URL、各种服务器端环境变量、HTTP 请求头中的内容、时间,甚至可以通过外部的程序来使用数据库中的信息来帮助重写。URL 重写功能非常强大,通过 URL 重写,可以使 Apache 完成异常复杂的功能。当然,URL重写功能本身也比较复杂,关于 URL 重写功能
10、的详细说明可以参看 Apache 的随机文档。2.4.2 使用 Apache 中 URL 重写功能实现基于名字的大规模虚拟主机设置假设机器 提供名字形如 、 等的大规模虚拟主机服务。其中虚拟主机名必须是字母或数字,并且长度至少为 3。为了防止一个目录下文件或子目录太多而对性能产生很大的负面影响,对用户的目录按照名字进行分级划分,如虚拟主机 的相关文件存放在目录/member/ab/de/abcde 下面。其中“ab” 、 “de”分别是“abcde”的前边两个字符和最后两个字符。当用户请求 http:/ 时,系统应该返回/member/ab/de/abcde 下面的文件。下面是为了完成这种
11、功能需要进行的设置:1. 对域名服务器的设置假设 的 IP 地址为 202.103.190.57,在域名服务器 DNS 的 数据文件中增加一行:* IN A 202.103.190.57这样,所有 * 的 IP 地址都会被解析为 202.103.190.57,就没有必要为各个虚拟主机分别进行设置。2. 对 Apache 的设置首先使用命令“httpd -l”检查 mod_rewrite 模块是否已经编译到 Apache 中,如果没有,重新编译 Apache。然后在 Apache 的配置文件 httpd.conf 中增加如下语句(其中以“#”开头的为注释):#禁止使用机器的正式名UseCan
12、onicalName off#使能重写功能RewriteEngine onRewriteMap lowercase int:tolower# 为安全考虑,对 CGI 程序不进行重写RewriteCond %REQUEST_URI !/cgi-bin/# 对 不重写,其他的重写RewriteCond $lowercase:%HTTP_HOST !(.*)$RewriteCond $lowercase:%HTTP_HOST a-z0-9-+(.*)$# 首先把机器名改为小写,添加到请求的文件路径前,并继续处理RewriteRule (.+) $lowercase:%HTTP_HOST$1 C#
13、重写请求RewriteRule (a-z0-9)(a-z0-9)(a-z0-9)(.*)/(.*) /member/$1$2/$2$3/$1$2$3/$5RewriteRule (a-z0-9)(a-z0-9)(a-z0-9*)(a-z0-9)(a-z0-9)(.*)/(.*) /member/$1$2/$4$5/$1$2$3$4$5/$7优点:只要一个 IP 地址就可以提供大量的虚拟主机服务,维护方便。缺点:安全性低。上例为了增强安全性,禁止运行用户自己的 CGI 程序。2.5 Apache WWW 服务器下的重定向虚拟主机设置重定向虚拟主机是指仅仅提供重定向功能,而不实际存放用户主页数据的
14、虚拟主机。比如,某站点有多个镜像服务器,假设为 、,。这些服务器放在不同的网络上,分布于各地的客户访问这些服务器的速度也互不相同。而站点 通过虚拟域名 为这些镜像的服务器提供虚拟主机服务。当客户访问http:/ 时, 根据用户的 IP 地址、收集到的网络拓扑结构信息,把客户重定向到对该客户来说访问速度最快的站点。重定向虚拟主机服务也可以通过使用 URL 重写功能来完成。这里仅给出简单的重写规则:RewriteRule (a-z0-9+)(.*)/(.*) /www/cgi-bin/nph-redirect.cgi/$1/$3 T=application/x-httpd-cgi,L其中,nph
15、-redirect.cgi 为一个 CGI 程序,为了实现自动重定向,它需要产生完整的 HTTP 应答头信息。该程序通过环境变量 PATH_INFO 得到用户请求的 URL,通过环境变量REMOTE_ADDR 得到用户的 IP 地址,并根据网络拓扑情况生成重定向信息,返回给客户。三、小结WWW 服务器虚拟主机的使用越来越多,尤其是对中小型站点,通过使用虚拟主机技术,可以减少开销,减少维护管理工作量。本文介绍了 WWW 服务器虚拟主机的两种工作方式,并讨论了在 Apache WWW 服务器下的各种虚拟主机、尤其是大规模虚拟主机的设置技术,并比较了各种方式的特点。当用户对安全性要求较高时,可以使用
16、基于 IP 地址的虚拟主机方式,并且每一个虚拟主机由单独的 Apache 进程进行服务。其他情况下,可以根据实际要求来设置虚拟主机服务。参考文献:1Apache 1.3 Users Guide http:/www.apache.orgVirtual Hosting Setup Using ApacheAbstract:There are two types of WWW Virtual Hosting, IP-based and Name-based. Those two types are introduced in this thesis, followed by some methods about WWW Virtual Hosting configuration under Apache and the difference between them is analyzed.