1、修改位置如下图 具体的解释如下 Access Log Valve 用来创建日志文件,格式与标准的 web server 日志文件相同。可以使用用日志分析工具对日志进行分析,跟踪页面点击次数、用户会话的活动等。Access Log Valve 的很多配置和行为特性与 File Logger 相同,包括每晚午夜自动切换日志文件。Access Log Valve 可以和任何 Catalina 容器关联,记录该容器处理的所有请求。 例子如下: className实现的 Java 类名。必须被设置成org.apache.catalina.valves.AccessLogValve。 directory存
2、放日志文件的目录,可以是相对路径或者绝对路径。如果使用相对路径,是指相对于 $CATALINA_HOME 的路径。如果不指定 directory 属性,缺省值是“logs”(相对于 $CATALINA_HOME) pattern需要记录的请求/响应不同信息域的格式布局。如果是“common”或者“combine”,说明选择标准格式。下面会有关于配置这个属性的更多信息。 prefix日志文件名的前缀。如果没有指定,缺省值是“access_log.”。如果不想使用前缀,使用长度为 0 的字符串。 resolveHosts将远端主机的 IP 地址通过 DNS 查询转换成主机名,设为 true。如果为
3、false,忽略 DNS 查询,报告远端的 IP 地址。 suffix日志文件名的后缀。如果没有指定,缺省值是“”。如果不想使用后缀,使用长度为 0 的字符串。 rotatable 缺省值为 true,用来决定日志是否翻转的标志。如果为 false,日志文件永远不翻转,并且忽略 fileDataFormat。要谨慎使用。 condition打开条件日志。如果设置了这个属性,只有在ServletRequest.getAttribute()是 null 的时候,才会为请求创建日志。比如,如果 condition 设为 junk,则只有在Servlet.getAttribute(“junk“)=nu
4、ll 的时候,才会记录这个请求。使用过滤器,可以很容易设置(或者取消设置)不同请求的属性。 fileDateFormat允许在日志文件名称中使用定制的日期格式。日志的格式也决定了日志文件翻转的频率。如果想每个小时翻转一次,将这个值设为 yyyy-MM-dd.HHpattern 属性值由字符串常量和 pattern 标识符加上前缀“%“组合而成。pattern 标识符加上前缀 “%“,用来代替当前请求/响应中的对应的变量值。目前支持如下的 pattern: %a - 远端 IP 地址 %A - 本地 IP 地址 %b - 发送的字节数,不包括 HTTP 头,如果为 0,使用“ %B - 发送的字
5、节数,不包括 HTTP 头 %h - 远端主机名(如果 resolveHost=false,远端的 IP 地址) %H - 请求协议 %l - 从 identd 返回的远端逻辑用户名(总是返回 -) %m - 请求的方法(GET,POST,等) %p - 收到请求的本地端口号 %q - 查询字符串(如果存在,以 ?开始) %r - 请求的第一行,包含了请求的方法和 URI %s - 响应的状态码 %S - 用户的 session ID %t - 日志和时间,使用通常的 Log 格式 %u - 认证以后的远端用户(如果存在的话,否则为-) %U - 请求的 URI 路径 %v - 本地服务器的名
6、称 %D - 处理请求的时间,以毫秒为单位 %T - 处理请求的时间,以秒为单位运行结果 常使用 web 服务器的朋友大都了解,一般的 web server 有两部分日志:一是运行中的日志,它主要记录运行的一些信息,尤其是一些异常错误日志信息二是访问日志信息,它记录的访问的时间,IP,访问的资料等相关信息。现在我来和大家介绍一下利用 tomcat 产生的访问日志数据,我们能做哪些有效的分析数据?首先是配置 tomcat 访问日志数据,默认情况下访问日志没有打开,配置的方式如下:编辑 $catalina/conf/server.xml 文件.注:$catalina是 tomcat 的安装目录把以
7、下的注释()去掉即可。其中 directory 是产生的目录 tomcat 安装$catalina作为当前目录pattern 表示日志生产的格式, common 是 tomcat 提供的一个标准设置格式。其具体的表达式为 %h %l %u %t “%r“ %s %b但本人建议采用以下具体的配置,因为标准配置有一些重要的日志数据无法生。%h %l %u %t “%r“ %s %b %T 具体的日志产生样式说明如下(从官方文档中摘录) :* %a - Remote IP address* %A - Local IP address* %b - Bytes sent, excluding HTTP
8、headers, or - if zero* %B - Bytes sent, excluding HTTP headers* %h - Remote host name (or IP address if resolveHosts is false)* %H - Request protocol* %l - Remote logical username from identd (always returns -)* %m - Request method (GET, POST, etc.)* %p - Local port on which this request was receive
9、d* %q - Query string (prepended with a ? if it exists)* %r - First line of the request (method and request URI)* %s - HTTP status code of the response* %S - User session ID* %t - Date and time, in Common Log Format* %u - Remote user that was authenticated (if any), else -* %U - Requested URL path* %
10、v - Local server name* %D - Time taken to process the request, in millis* %T - Time taken to process the request, in secondsThere is also support to write information from the cookie, incoming header, the Session or something else in the ServletRequest. It is modeled after the apache syntax:* %xxxi
11、for incoming headers* %xxxc for a specific cookie* %xxxr xxx is an attribute in the ServletRequest* %xxxs xxx is an attribute in the HttpSession现在我们回头再来看一下下面这个配置 %h %l %u %t “%r“ %s %b %T 生产的访问日志数据,我们可以做哪些事?先看一下,我们能得到的数据有:* %h 访问的用户 IP 地址* %l 访问逻辑用户名,通常返回-* %u 访问验证用户名,通常返回 -* %t 访问日时* %r 访问的方式(post
12、或者是 get),访问的资源和使用的 http 协议版本* %s 访问返回的 http 状态* %b 访问资源返回的流量* %T 访问所使用的时间有了这些数据,我们可以根据时间段做以下的分析处理(图片使用 jfreechart 工具动态生成) :* 独立 IP 数统计* 访问请求数统计* 访问资料文件数统计* 访问流量统计* 访问处理响应时间统计* 统计所有 404 错误页面* 统计所有 500 错误的页面* 统计访问最频繁页面* 统计访问处理时间最久页面* 统计并发访问频率最高的页面分析工具包括两大部分,一个是后台解释程序,每天执行一次对后台日志数据进行解析后保存到数据库中。第二个是显示程序,从数据库中查询数据并生成相应的图表信息。