seo排名培训

seo优化 2022-02-14 09:48www.168986.cn长沙seo优化
为何进行SEO?
seo是什么。
全名:SEO是英文SearchEngineOptimization的缩写,中文意为“SEO”定义:
SEO是指对搜索引擎排名的自然机制有所了解,对网站进行内外调整优化,提高网站关键词在搜索引擎中的自然排名,以获取更多的流量,从而达到网站销售和品牌建设的目标。
一般而言,对网站进行优化以提高搜索引擎的相关搜索排名,从而达到获得更多流量的技术和过程。
为何执行seo。
高质量的搜索:主动搜索的用户基本都有相关的需求,这些流量留存率高,转化率高,是非常优质的流量来源。
价格比:与其它宣传方式相比,所支付的费用低了很多。
扩展性:网站可以不停地增加关键字和相关流量。
长久有效:一旦排名提升,有效期就会延长。
改进站点易用性并改进用户体验:seo对页面的需求经常与这两个方面互用。
seo分类。
seo分为白帽子、黑帽子、灰帽子,这些都是搜索引擎优化行业,有些优化方法不符合搜索引擎质量规范,或者叫作弊的SEO手法叫黑帽子,英文叫黑帽子。而且正规的符合搜索引擎质量标准的网站都叫Whitehat。因为搜索引擎发布的质量规范和指导原则是较为普遍的,经常存在各种各样的解释空间,而那些无法明确地归类为黑帽子或白帽子的最优方法就是这种最优的方法。seo主要的欺骗方式。
搜索。
搜索历史简介
为何了解搜索引擎。
SEO人员对网站进行优化是为了尽可能减少搜索引擎的工作量,降低搜索引擎的工作难度,使搜索引擎能够更加轻松、快速地收录网页,更加精确地获取网页内容。
与搜索引擎有关。
真实搜索引擎是指由蜘蛛程序通过网络连接抓取大量网页,存入数据库,然后进行预处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库中选出满足关键词要求的网页。爬虫、网页的收录和排序均为自动处理。
(区分于门户网站)方向。
获取网页的方式需要快速和全面。
大量的数据存储。
检索过程快速高效,具有很好的扩展性。
快速而准确的查询处理。
判别使用者和人工智能。
搜索是如何工作的。
其工作过程大致可分为三个阶段:爬虫与抓抓、预处理、排序。
爬升和抓起。
执行资料收集。
蜘蛛。
淘宝是一种栗子。
君子不可防小人。
使用搜索引擎抓取和访问网页的程序叫做蜘蛛。
在蜘蛛程序发出访问页面请求之后,服务器返回HTML代码,爬行器程序将接收到的代码保存到原始页面数据库中。为提高搜索引擎爬虫和抓取速度,采用多蜘蛛并行分布爬行。
爬行器在访问任何站点时,首先会访问到robots.txt文件根。若robots.txt文件禁止搜索引擎获取某些文件或目录,蜘蛛将遵守该协议,并不会捕获被禁站点。
为了尽可能地获取更多的网页,蜘蛛会追踪网页上的链接,从一个页面爬到下一页爬行策略:深度优先和广度优先相结合。
通讯库。
手工输入的种子网站(门户网站)
在爬行器抓取页面之后,页面中的外部链接。
网站管理员自行提交。
为避免重复搜索和抓取网址,搜索引擎创建了一个地址库,以记录那些尚未被截获的网页以及已被截获的网页。
url源。
大多数主流搜索引擎都会提供表格,让网站管理员提交网址。但是,提交的网址仅仅是存储在地址库中,是否收录还取决于网页重要性。大多数搜索引擎收录网页都是蜘蛛自己追踪链接得来的。在提交页面基本没有任何作用的情况下,搜索引擎更愿意沿着自己的链接找到新页面。
文档存储
截获的页面被放置到原始数据库中,每个url都有相应的文件号。
复制爬取内容检测。
爬虫时会进行一定程度的复制检测,如果在有较低权重的网站上有大量转载和剽窃的内容,则该网页不会被收录。
前处理(指标)
爬行器获取的原始页面,不能直接用于查询排名处理,需要对其进行预处理,为最终的查询排名做准备。
抽取文本
在html的标题、p、h1、span标签中提取文本。
除了文字文字之外,还将提取meta标签中的文字、图片替代文字、Flash文件、链接锚文等。
汉语分词
中文搜索引擎特有的步骤。
字典匹配与基于统计的方法。
停下来的话
啊,啊
the,of。
去除噪音。
按照HTML标签对分页、分页、导航、正文、页脚、广告等区域进行分类,在网站中大量重复出现的部分往往属于噪声。
去除重量
这篇博客在两个不同的博客网站上发表。
网页特征关键字计算指纹,即从网页主体内容中挑选出部分最具代表性的关键字(通常是出现频率最高的关键字),然后计算这些关键字的数字指纹。
前向指数
将网页转换成一组关键字,同时记录每个关键字在网页上出现的频率、出现次数、格式(如出现在标题标签、黑体字、H标签、锚字等)、位置(如网页第一段文字等。
反向排标
转换前向索引关系。
连结关系计算。
链路原则
当搜索引擎抓到网页内容之后,必须事先计算出网页中哪些链接指向哪些其它网页,每一页有哪些导入链接,链接用了什么锚点文字,这些复杂的链接构成了网站和网页的重量。
特别的文档处理
除HTML文件之外,搜索引擎经常可以获取并索引PDF、Word、WPS、XLS、PPT、TXT文件等多种基于文本的文件类型。
等级。
当用户输入搜索框中的关键字,排行程序调用索引库数据,计算排名显示给用户,排位过程与用户直接交互。
搜寻条目处理
汉语分词
停下来的话
说明处理:搜索结果是否都符合要求。
拼错修正
集成搜索触发:视频,音频,咨询。
文档匹配。
在倒排索引数据库中,找到符合多个关键字的文件。
选择初始子集。
检索出的结果通常会有几万甚至几十万,如果文件太多,无法计算所有文件的相关性,所有初始子集的选择都是根据网页权重,先选取大约1000个文件。
相关计算。
关键字通用程度:使用频率越高,计算相关性越小,停止词就是经常用词的极端,它对页面相关性的影响很小。
词汇频度和密度:网页中出现的关键字越多,相关性就越强,但是因为这个问题很容易被钻空,所以它的重要性也就逐渐降低了。
要害词位置和形式:标题、黑、黑、关键词h1,相关性较高。
关键字距离:多个关键字间距离越近,相关性越强。
连结分析与页权值:有网页用关键字对网页进行描述,自己的网页重量,以及导入网页链接的网页重量。
等级筛选和调整。
在涉嫌作弊的网页上将-11、-6、-30名次进行排名。
放置广告。
等级显示。
排序程序确定了所有排名之后,原始页面的标题标签、描述标签、快照日期等数据显示在网页中。
查找高速缓存。
而在搜索领域,所谓缓存,就是在高速内存硬件设备上开辟一个存储区,用来存储常见的用户查询及搜索结果,并采用一定的管理策略来维护缓存区内的数据。如果搜索引擎再一次收到用户的查询请求,就先在缓存系统中查找,如果能在缓存中找到,就直接返回搜索结果;否则,按正常的搜索过程返回搜索结果。当前,所有的搜索引擎都使用缓存技术。
二/八法则
访问和点击记录。
搜寻使用者的IP地址、关键字的搜索、搜索时间、点击了哪个网页,搜索引擎就会记录形成日志。记录文件中的数据对于搜索引擎判断搜索结果质量、调整搜索算法、预测搜索趋势等具有重要意义。
这些日志还会影响用户在该用户登录后的排名。
主优化点。
实体和链路结构。
平面站点结构:当爬行时,爬行将采用深度优先和广度优先相结合的方法,因此如果层次太高,可能会导致蜘蛛无法爬到您的页面。
在整个站点中,主页的权重最高,点击距离越小,被spider爬取的几率和权重也越高。同时,我们还需要控制主页内网页(即特定文章页面)的点击距离,这样做的效果更好。
清楚的导航。
清楚的导航系统是网站设计的重要目标。归根结底,您肯定不希望用户进入您的站点主页后,面对杂乱无章的网页,很难找到它。对搜索引擎的spider来说也一样,杂乱的导航会减少spider爬升的可能性。建立网站导航时,应注意以下事项:
文本导航。尝试用HTML静态文本作为导航,而不使用JavaScript生成的动态导航。这对于spider来说,爬行阻力最小。导航系连结是网站收录最重要的内部连结。
点击率和点击率。浏览的目的之一是使所有网页和主页的点击距离越短越好。象一个重量普通的站点,内页一般不能超过首页4、5次。因此,在链路结构上要尽可能的平。
标记文本中包含关键词。浏览关键字尽可能的使用目标关键字。
面包屑导航。面包屑对中大型网站来说至关重要。这是帮助用户和搜索引擎建立网页在站点整体结构中位置的最佳方式。
防止堆页脚。近几年来,页脚堆砌关键字的做法似乎不受搜索引擎欢迎,尽量避免。
取消收录机制。
metarobots。
标记通过还可以设置禁止搜索引擎索引本页面的内容,禁止追踪本页面的链接。content的参数是:
noindex:不对此页面内容nofollow:不跟踪该页面链接nosnippet:不要在搜索结果中显示noarchive:不要显示快照noodp:不要使用开放目录中的标题和描述。
图片
每一个参数中间需要用引号分隔开。nofollow标签
nofollow
nofollow标签是由Google领导创新的一种“反垃圾链接”,得到了市场上其它主流搜索引擎的广泛支持。nofollow是a标签的属性值。用来通知搜索引擎不要跟踪该链接,因为该链接不受作者信任。在这里,nofollow和前面提到的meta标签中的nofollow不同,在于:a标签上的nofollow是指一个链接,而meta上的nofollow指的是整个页面中的所有链接。nofollow经常被用在博客评论,论坛帖子,社交网站,留言板等等。由于这些地方的内容都是用户可以随意留下链接,站长们不知道这些链接是否可信。当您发布了segmentfault或traguest之后,您的文章中所包含的外部链接就会有rel="nofollow"。与此同时,对网站内某些重复内容的网页或某些链接不需要被收录的链接可以添加,可以避免网站重量的浪费。例如,联系我们、隐私政策之类的网页,都可以使用ofollow标签。
内链和重量的分配。
某个站点的主页权重是最高的,接下来是第二级分类页面,和我们前面提到的链接结构一样,也是一种树状结构。有几条内部权限分配原则:
关键的内页可以直接链接到首页来提高权重。
不必要的页面设置nofollow的权重不分散。
锚点对于内部权限分配也是一种很重要的方法。在这方面,维基百科肯定做得最好。
404页
如果没有访问过的页面,则需要专用的404页。在设计404页时有一些要点:
和网站保持统一风格。
错误信息应出现在显眼位置,明确提示用户,访问页面不存在。
出错页面还能提供几种跳转:例如返回主页以及您引导用户访问的其他链接。
一个关于404页面和外链的小窍门,就是因为搜索引擎不能无缘无故地爬一些不存在的原因。当然也有一些外部链接指向这些地址,例如其他人的blog网页参考资料等,而原文可能你已删除或替换url。这样我们就可以通过Google网站站长工具找到我们网站中存在的错误链接,做301的错误地址,跳到正确的页面或直接在没有创建的URL上创建新网页,来获得那些外部链接的权重。
合理使用标签。
语义化
语义、简明、结构化的代码更有助于突出重点并适合于搜索引擎捕捉。
仅有H1职称。
每页应有一个惟一的h1标题,但是并非每一页的h1标题都是一个站点名。(但是html5中的h1标题可以多次出现,每一个带结构大纲的标签都有自己独立的h1标题,比如header,footer,section,aside,article)
h1标题是一个站点名,内页面的h1标题是每个内页的标题,例如分类页面是分类的名字,而详细页面是以h1标题形式命名的。
 

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by