江西SEO:教你看懂网站日志分析

seo优化 2023-08-18 07:18www.168986.cn长沙seo优化
      网站日志分析是我们SEO优化必须学习的知识点。从日志代码的判断来看,不难发现蜘蛛对我们网站的评价及其爬行细节,从而对后续的优化工作起到指导作用。,虽然网站的日志分析并不难,新手还是不掌握意思,所以分析起来会有问题。以下江西SEO将简要介绍如何理解蜘蛛和网站日志。
 
1、蜘蛛名字
在网站日志中,蜘蛛名通常有以下几种
 
百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou get spider 。在日志中,只要搜索上述蜘蛛名称,就可以看到蜘蛛类别的抓取痕迹。
 
2、蜘蛛返回类型
蜘蛛爬行后返回代码,HTTP状态码一般分类
 
(1)200代码表明蜘蛛爬回正常。
 
(2)304代码表明,自上次爬行以来,内容没有更新。
 
(3)404代码,访问此连接是错误链接。
 
(4)301代码表示永久跳转。
 
(6)500代码表示程序错误。
 
3、解读日志代码
date记录浏览日期;
 
time访问时间;
 
s-虚拟主机Sitename的别称。
 
s-IP来访者IP;
 
cs-method显示了两种常见的浏览方式,一种是GET,另一种是【违禁词,系统已经被屏蔽】T;
 
cs-uri-stem是浏览哪个文档;
 
cs-uri-query是指访问地址的附加参数,如asp文档后面的字符串id=12等,如果没有参数,则表示;
 
s-port 访问端口;
 
cs-username 来访者名称;
 
c-ip 来源ip;
 
cs(User-Agent)浏览来源;
 
sc-status情况,200表示成功,403表示无权,404表示无法播放页面,500表示程序错误;
 
sc-substatus 将服务端输送到客户端的字节大小;
 
cs–win32-statu客户端输送到服务端的字节大小;
 
 
举例说明
[2014-08-29 00:09:12 W3SVC962713505 203.171.226.111 GET /index.html – 80 – 61.135.168.39 Baiduspider ( http://.baidu./search/spider.htm) 200 0 64
 
1、203.171.226.11是搜索模块蜘蛛浏览网站ip
 
2、61.135.168.39 以Baiduspider为代表的ip。
 
3、代码里的/index.html 这表明搜索模块蜘蛛访问的网页
 
4、2014-08-29 00:09:12 代表搜索模块蜘蛛爬行的日期和时间
 
5、代码中的200表示搜索模块蜘蛛爬行后返回代码
 
6、W3SVC962713505代表网站日志的文件夹

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by