网站服务器日志分析对于一个网站具有比较重要的作用,通过分析该日志,我们可以知道搜索引擎爬行记录,这有利于我们针对搜索引擎的习惯进行交换。
那么,今天我们便以SEO教程网为例,告诉大家怎么来分析网站日志吧:
1,我们到哪去找服务器日志?
一般我们使用的虚拟机都会有服务器日志,大都在logs文件夹下,如果你的空间没有,那么请联系你的空间服务商,他会为你解决的。
实例截图:
2,自己来查看服务器日志
对于不够大的日志,我们完全可以通过一般的文本编辑器查看,因为日志就那么大点,但是,对于一些大网站,搜索引擎爬行的非常频繁的网站,其日志就很大了,我们得使用后面说的软件来查看。
我们用文本打开服务器日志,然后我们就会看到很多条记录,在这里,我为大家讲解一下如何看懂这些“天文”!
举例说明:66.249.68.143 – - [29/Jun/2011:00:30:29 +0800]"GET/seoshichang/ HTTP/1.1" 200 7926 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
第一项信息是远程主机的地址。
日志记录的第二项是请求的时间。上例日志记录表示请求的时间是2011年6月29日00:30:29。时间信息最后的”+0800″表示服务器所处时区位于UTC之后的8小时。
日志记录的第三项信息是整个日志中最有用的信息,它告诉我们服务器收到一个什么样的请求,上例中为浏览者请求访问“/seoshichang/”页面。
在上例中,METHOD是GET,其他经常可能出现的METHOD还有POST和HEAD,此外还有不少可能出现的合法METHOD,但主要就是这三种。
PROTOCOL通常是HTTP,后面再加上版本号。
日志记录的第四项信息是状态代码,如果显示200则表示请求成功,如果显示的是300开头则是表示重定向,现实400则表示有错误。
日志记录的第五项表示发送给客户端的总字节数。
日志记录的第六项记录的是你的页面访问者,上例中为Google蜘蛛,当然,还有百度蜘蛛和雅虎蜘蛛等。
这行的意思是2011年6月29号零点30分29的时候,IP为66.249.68.143的谷歌搜索引擎蜘蛛(Googlebot)访问了/seoshichang/页面,访问结果为浏览成功。
3,通过软件查看服务器日志
在这里,我推荐我使用的卡卡家园蜘蛛爬行日志分析器,看效果:
该软件对百度来路,谷歌来路,雅虎来路等都做了分类,并且可以看到正常,错误,缓存,301重定向等数据,效率比手动查看显然要高出了许多,而且也准确了许多,是不是很好呢?