极简黑白

百度是怎么判断网页质量、权威等信息的?

本文发表于2022-07-17 来自于 SEO 栏目

image.png

在百度的搜索核心策略中,网页的质量度一直都是比较重要的指标之一。如果一个网站的网页没有做好那么不管是怎么优化也是不会有很大的效果。

一般来说,网页被创建或存在都是有目的的。从用户角度,这个目的可能是好的,也就是有益目的,也可能是有害处的,比如钓鱼网页。

有害网页,比如意图伤害、欺骗用户,只是为了赚钱而没有试图帮助用户的网页,直接被评为最低质量网页,不再进行进一步评估。这类网页比较明确,不是指南的重点。

如果网页具备有益目的,也就是对用户有帮助,网页质量评分的标准就是看网页在多大程度上达到了(帮助用户的)目的。所以评估员们要打分,就需要先理解网页存在的目的。


网页目的没有贵贱之分。只要网页是为了帮助用户而存在,一种目的或种类的网页并不比另一种目的的网页天生更高质量。也是就是说,网页目的或种类与质量并没有直接关系,没有哪种网页天生就高级,比如,百科全书网页并不一定比笑话网页质量更高。做低俗点内容的SEO可以放心了,低俗内容也是可以高质量的,只要很好地满足了部分低俗的搜索需求。

网站让用户提交MSPaint编辑过的照片,使照片里的东西看起来像是张大嘴,正在吃掉别的什么东西。刷新一下网页就换一张照片。就这么一个功能,怪无聊的。但这样的网页同样有其目的:幽默,让用户乐一下。

另外,网页是否有广告和网页质量也没有必然关系,有广告不一定意味着网页质量低。包括Google Adsense等文字或品牌广告,我相信也包括联署计划这类赚钱方式。所以网站要赚钱,也不是个问题,不必然就导致质量低。

每种目的的网页都有高质量的,也都有低质量的。评估员需要理解网页存在的目的,才能更好地给出相应的评分。

有一类比较特殊的网页,YMYL网页,Your Money or Your Life网页的缩写,我称之为要么要钱,要么要命网页,指的是可能影响用户未来的快乐、健康、财政稳定、安全等的网页。如:提供有关投资、税务、退休计划、买房、大学学费、买保险等方面建议或信息的网页

提供重要公众信息的官方或新闻网页,如涉及到当地/国家政府政策、流程、法律、灾难应急服务等信息的网页,涉及重要国际事件、商业、政治、科技等的新闻网页。这部分需要评估员运用自己的知识和判断力,不是所有新闻网页都属于YMYL网页。

YMYL网页的质量评分标准是非常高的,不然可能影响用户的健康、安全、财务等。

网页的质量不仅仅取决于网页本身,也要参考网站及网页内容创作者的背景和网上声誉情况。评估员不仅需要看网页内容,还得看整个网站,研究网站所有人,甚至到第三方网站调查网站和创作者情况。

谁(公司、机构、个人)是当前网页内容创作者?不一定是网站拥有者,比如用户产生内容的网站。

联系方式或客服信息需要完备。尤其是和钱打交道的网站,这点非常重要,如商城、银行、信用卡服务等。所以,SEO们先检查一下自己网站的联系我们网页有没有?是不是空的?我在给客户做SEO服务时,都会把联系我们、关于我们、隐私权政策、服务条款这四个网页作为必须做好的基本网页,有时候客户不理解,这和SEO有什么关系?其实,是否显得正规是搜索引擎挺看重的事情。

联系方式或客服信息需要具体到什么程度视网站类型而定。比如一个笑话网站就不像电商网站那样要求很细的联系方式。

一些网站有合理理由不显示联系信息,如个人网站不显示住址、电话,用户产生内容的网页可以选择匿名。这不属于可疑范围。

网站和创作者声誉应该基于真实用户的体验和行业专家的意见,而不仅仅是看网站自己怎么说。

调查要以外部、独立可信信息源为主。如果网站本身和可信的外部信息源说的不一样,以外部信息源说法为准。对网站自己声称的内容要带着怀疑的眼光来看。

可以寻找并参考真实用户或专家写的评论、推荐、新闻。购物网站用户评分也在参考之列,大量正面评论代表正面声誉。这两点存疑,尤其是中文网站,四处刷评论现在太常见了。指南中也强调了这点,要求评估员正面和负面信息都要看,而且要真的读一下这些评论。

在新闻、百科、博客帖子、文章、论坛等地方寻找真人写的信息,而不是统计数字。还有其它信息源,如获奖信息、专业协会的推荐等。

Google要求评论员必须做调查,不要假设,自己常用的网站也不一定就声誉好。

指南花了不小篇幅讲解怎样在Google寻找这些信息源,简单说,无非是搜索网站/公司名 -site:domain,或者公司/网站名 评论之类的,中文的可以加上公司/网站名 怎么样、好不好、骗子之类的。也可以在特定网站搜索一下网站或公司名称,如维基百科、Yelp,中文的可以考虑贴吧、知乎等地方。

最后,调查不到什么信息,不说明网页质量就一定低。有的小公司,小机构确实在网上没什么动静,但不意味着他们质量不高。

看来,网上名誉管理并不只是事后补救的时候需要SEO,SEO本身就需要网上名誉管理。第三方网站的评论、打分、新闻等对网站和网页本身的质量分数就是有影响的。我猜想,这部分是人工智能发挥作用的地方。网上貌似正常的正面评价大量是刷出来的,经典算法靠文字和语义很难区分真实评论和刷出来的评论,但人工去研究一下,刷的评论显而易见。经过人工打标签的数据交给AI系统学习,AI可能会找出更精确判断评论真实性的方法。

如前面说的,给网页质量打分首先要理解网页存在的原因。没有所谓有益目的的网页,如意图伤害、欺骗、误导用户的网页,只是为了赚钱而没有试图帮助用户的网页,传播仇恨、暴力的网页,应该被评为最低质量网页,不用再进一步评估了。

其它有有益目的的网页,根据网页在多大程度上达到了这个目的,给予5个级别的质量打分:最低,低,中等,高,最高。

专业度、权威度、信任度:所谓E-A-T,Expertise, Authoritativeness, Trustworthiness的缩写。显然,这三个度越高,质量越高。E-A-T这个提法最近在英文SEO行业是很流行的,有的SEO说自己的网站就是因为按照E-A-T标准检查、优化过,才在Medic更新中获得流量增长。这个话题比较重要,下篇帖子再单独写。

主体内容质量和数量:内容包括文字、图片、视频、功能。除了质量,还要求合适的数量。

网站背景信息、主体内容创作者信息:前面所提到的网站和作者背景调查,包括网站本身描述的和其它信息来源的。

下面只以高质量网页为例,看看什么样的网页被Google认为是高质量的,其它如最高、低质量等依此类推。

高质量网页应该有有益目的,并且很好地达到了这个目的。另外,还要有这些特征:

创作高质量内容需要相当大量的时间、努力、专业、才能、技巧,这在内容中会体现出来。除了信息,网页功能也要测试,确认能用。

多少量才是足够量?这取决于网页的目的。一般来说,宽泛的主题需要的内容量比狭窄的主题多。用户搜索马航失联,几千字也介绍不清楚。用户查询姚明多高,就没必要写几千字了。

了解谁对网站负责是评估网站、网页质量的重要部分。高质量网页至少要有清楚的背景信息,使用户建立信任。

不同类型网站需要的信息量可能不同。如YMYL网站要建立极高的信任,需要的背景信息就更多。

一个网页在没有声誉信息的情况下有可能被评为高质量。但一个网站如果有令人信服的负面名誉,就不能被评为高质量了。当然,负面评论要看具体内容是否合理,不能只看评分。

发表评论:

评论记录:

还没有评论,快抢占沙发吧!