百度蜘蛛日志抓取解读 提高百度收录
很多网站目前使用的都是虚拟空间,都能够提供日志。日志是指在网站根目录下的logfiles文件夹里面日期.txt文本文件有很多介绍通过http查看返回命令的那种办法来查看蜘蛛。现在更多的网站是没有提供可以通过软件来查看的日志格式。
更多的是类似狼蚁网站SEO优化的日志格式,如下
03:28:34 GET /goods.php 202.108.7.205 200 34696 390
第一 03:28:34 访问时间
第二 GET /goods.php 访问的页面 get表示获取
第三 202.108.7.205 访问网站的源IP
第四 200 成功访问
第五 34696 390 表示记录的内容大小
接下来要介绍几个HTTP状态码扩展基本知识
成功2×× 成功处理了请求的状态码。
200 服务器已成功处理了请求并提供了请求的网页。
204 服务器成功处理了请求,但没有返回任何内容。
重定向3××每次请求中使用重定向不要超过 5 次。
301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。搜索引擎索引中保存新的URL。
302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。
304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。
客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。
400 服务器不理解请求的语法。
403 服务器拒绝请求。
404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。
服务器错误5××表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。
500 服务器遇到错误,无法完成请求。
503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。
以上日志提取于http://..027zhan. 如果你不会提取日志的话
查看服务器日志办法日志默认存放在System32\LogFiles目录下,使用W3C扩展格式
虚拟主机查看日志办法根目录下logfiles文件(一般需虚拟主机面板中开启日志记录)
2010-05-06 17:48:16 W3SVC945321 222.73.167.138 GET /FUKE/CARNATION.html - 80 - 123.125.66.42 Baiduspider+(+http://.baidu./search/spider.htm) 200 0 0 7341
1、2010-05-06 17:48:16 蜘蛛光临的时间
2、W3SVC945321 日志文件名
3、222.73.167.138 网站服务器IP地址
4、GET 是从服务器上获取数据
5、/FUKE/CARNATION.html 抓取的文件
6、- 80 - 80端口
7、123.125.66.42 蜘蛛的来路地址
8、Baiduspider+ 百度蜘蛛的名字
9、+http://.baidu./search/spider.htm 百度蜘蛛机器人的介绍
10、200 0 0 7341 200服务器成功返回网页
seo排名培训
- seo推广是什么意思呢 seo是什么推广网站
- seo免费优化网站 seo网站优化优化排名
- seo关键词排名优化 seo关键词排名优化多少钱
- seo是什么职业 seo属于什么职业
- seo具体怎么优化 seo常用优化技巧
- seo搜索引擎排名优化seo搜索引擎排名优化案例分
- seo关键词优化软件 seo网站优化软件
- seo从入门到精通 seo零基础入门到精通
- seo百度发包工具 seo发包程序
- seo推广网址 seo推广的网站和平台有哪些
- seo排名快速优化 seo技巧seo排名优化
- seo关键词优化 百度搜索关键词排名优化推广
- seo的基本步骤 seo的基本步骤顺序
- seo具体怎么优化 seo具体怎么优化内容
- seo关键词首页排名 seo关键词排名得分公式
- seo排名优化公司价格 seo排名优化服务