搜索引擎排名计算的过程
中文分词/将短句转换为词形式。与索引处理时做法相同。
去停止词/将无用效果词全部去掉,与索引处理时做法相同。
指令与逻辑处理/一般,分词之后,会将分词的两种形式以且的逻辑处理。如搜索极简seo,会查找既包含seo,又包含极简的结果。但在高级指令中,可能会有所不同,比如-减号,代表着不包含后面的。如搜索搜索引擎优化 –优化,则指会呈现出搜索引擎的相关结果。
明显拼写错误纠正/例如搜索博人转,则会校正为博人传。
下拉词/当我们搜索词,输入框中会自动显示一些其他人搜索的相关的长尾词。例如搜索极简seo,输入框则会出现极简seo教程网的字样。
整合搜索/整合搜索,可能是出来的资讯,也可能出来的是视频。例如在手机百度上搜索极简seo,第一个搜索结果是百度的聚合视频。例如搜索一个热门新闻,则会出现资讯。
文件匹配/处理搜索词之后,搜索引擎得到了用户的几个词,然后去寻找包含这些词的所有文件。然后找到同时包含这几个词的文件,然后开始进行排序。但也会有一种情况就是可能只包含其中某些词,依然有很好的排名。
关键词1:文件1,文件5,文件19…
关键词2:文件3,文件5,文件28…
如果用户搜索词同时包含了关键词1和关键词2,参与排名的就是文件5。
子集选择/对文件的范围进行限定,例如对一万个网页进行排序。
关键词频率和密度/键词出现的频率和密度是比较重要的,但是千万不要做关键词堆砌。
关键词位置与表现形式/关键词一般在首位等位置出现,表现形式以标签形式、链接形式、加粗等用来做强调。
关键词是否完美匹配/关键词完整出现也是影响相关性的因素之一,如出现搜索引擎优化和出现搜索引擎中的各种优化问题是不同的效果。而且这两个词之间的离的越远效果越差。
网站权重与网页权重/整站的权重与网页的权重对排名有着非常大的影响。
链接投票/网页有多少从外部来的链接投票,影响着关键词的排名。当然,高权重且有相关性的网站才是最有效的。
关键词的常用程度/例如,seo优化,其实优化很容易出现,但seo单指seo行业,假如分词技术将其分成两个词,究竟seo必然是比较重要的那一个,而优化作用要小的多。
排名过滤与调整/通过以上相关性的计算,基本的排名已经确定,但是还需要进行一些微调,例如作弊嫌疑的网页过滤,权重高和相关性强的网站排名靠前。
排名展示/排名确定之后,搜索引擎会将网页的标题标签、描述标签等调用并显示,但如果用户搜索词并不在描述标签内,搜索引擎可能会将文章中提到搜索词的地方提取出来作为网页摘要。
搜索缓存/大部分人搜索词几乎是一样的,所以,搜索引擎会将最常见的搜索词和结果存入缓存,当用户搜索时可直接调用,提升排名效率,缩短了搜索结果出现的时间。
用户查询及点击日志/搜索用户的一些数据都是可以被搜索引擎记录的,作为了影响排名的数据。例如:用户的IP地址、查询词、点击了哪些网页、反复搜索了几次等等。
上一篇:域名劫持原理以及域名劫持解决方法