百度增强对https页面抓取力度
上线时间:2017年8月30号公布,8月期间已上线
主要影响:升级了对HTTPS数据的抓取力度,HTTPS数据将更快被Spider抓取到。
除了抓取,百度还表示过,https页面在权重上也有加分,原公告:“网站评价高、落地页评价高、搜索展示等收益优待。”其中Google几年前就开始对https页面提权。HTTPS是大势所趋,主要还是为了安全,搜索引擎对https页面在抓取、排名上也会有更多优待。建议站长尽快转移到https。
如何让百度蜘蛛不断抓取你的网站
1.网站上没有死链接
如果您的网站有许多死链接,则很难优化您的网站。
网站上过多的死链接极大地影响了蜘蛛的爬行和搜索引擎对网站权重排名的评估,也增加了网站服务器的负担。因此,有必要定期检查网站日志中是否有404个页面,以便蜘蛛能够在自己的网站上顺利运行。
2.高质量内容
高质量的内容可以吸引蜘蛛经常访问您的网站。如果您的网站是纯收集的,则会增加蜘蛛爬行的工作量,从而降低蜘蛛对您网站的敏感性。与其收集或更新垃圾内容,不如更新质量较低的内容。
3.网站代码简化
代码应该尽可能简单,最好选择只属于您的开源程序。
这是因为一些网站的代码相似度非常高,这导致蜘蛛不喜欢爬行,而独特的程序代码在同类网站中更为有利。
4.外部链资源
外部链和友好链接是非常大的流量门户,吸引蜘蛛抓取我们的网站。
网站管理员可以向主要博客、论坛和其他平台发布自己的高质量外部链,留下链接来引导蜘蛛进入您的网站。
5.按时间段更新内容
时间段是指网站内容应同时更新。例如,如果您在每天11:30更新网站内容,则蜘蛛会在每天11.30对您的网站进行爬网。
如果网站仍在进行HTTPS转换,且网站数据构建不好,建议网站采取以下措施避免蜘蛛爬行,以避免网站流量损失。
1.对于一台服务器下有多个域名的情况,建议不做HTTPS的网站设置HTTPS捕获返回失败码,或者将HTTPS站点301/302链接到HTTP,以避免捕获问题。
2.301和302从HTTPS到http。
3.如果HTTPS协议被阻止,则可以关闭端口443。
4.建议在修改HTTPS之前,网站不应提供超链接。