NEWS

分享创造价值   合作实现共赢

网站日志的用途,如何分析网站日志?

搜索引擎抓取网站信息必会在服务器上留下信息,这个信息就在网站日志文件里。网站日志是在根目录下的log或者weblog文件夹下,我们把这个日志文件下载下来,用记事本打开就可以看到内容。

一般日志里记录的有蜘蛛名称,状态码,来源,通过分些这些数据可以了解网站的状况。
比如百度的蜘蛛程序名称是baiduspider,Google的是Google-Googlebot等,我们在日志的内容里搜索蜘蛛名就可以知道哪个搜索引擎已经爬取过网站了。在这里要注意的是所显示的时间是国际标准时间,所以要在这个时间上加8个小时,这样才是北京时间,如果是自己的独立服务器可以设置为北京时间。

网站日志的数据:
其次是状态码,服务器状态码的值是我们和蜘蛛交流的信号。最常见的HTTP状态码有200页面抓取成功状态码、304(上次抓取的和这次抓取的没变化),404(未找到页面,错误链接),500(服务器未响应,一般由服务器维护和出故障,网站打不开时出现的)。知道了这些基本信息以后我们就可以根据网站日志进行分析了,比如日志中出现大量的谷歌蜘蛛和百度蜘蛛,说明您的站很受支柱的欢迎,蜘蛛时常来光顾你的网站。

网站日志用途:
1.比如新站上线,我们就可以借助网站日志文件来查看网站是否收录,如果日志有搜索引擎的蜘蛛来抓取过,并且状态码是200就说明抓取成功,该搜索引擎已经收录网站了,查询不出来只是没有放出数据而已。
2.当网站收录异常时我们要把正常收录的日志和异常的日志进行对比分析,找出问题所在,这样可以解决网站收录问题。
3.网站被K掉后,通过观察网站日志来看蜘蛛是否正常来临,慢慢过一段时间,如果蜘蛛数量增加或者经常来临并且返回200状态吗,那么说明您的网站恢复正常了。
4.通过日志查找网站是否存在死链接
打开日志,查询404代码,看看在弹出的窗口中有没有找到记录。如果找到,说明你的网站存在死链接。
5.查找是否存在程序错误:
我们再输入500进行查找,如果查找到相关页面,说明网站的程序在运行过程中出现了错误,需要对程序进行修改。
6.查看是否被入侵过:
在网站日志里我们搜索一下%20和’单引号(半角的),看看是否有相关的页面存在。此方法可以判断出程序上的漏洞,这样我们可以修改程序防止SQL注入。

如果以前蜘蛛每天要来成百上千次,那么这个时候你的网站是具备吸引力,往往关键词的表现也比较稳健,当蜘蛛来访次数发生比明显的减少时,说明你的网站发生了问题,将会面临惩罚。所以说通过网站日志可以了解许多的情况,站长们必须学会掌握。

相关文章