不同行业的网站在搜索引擎排名规则当中所表现的优化操作也是有差异的,比如网站抓取的差异性。今天大宝seo博客和朋友们分享一下关于百度搜索引擎抓取的相关问题,比如抓取频次过多或过少,如何判断爬虫IP是否属于百度并对用户站点进行了异常抓取,https站点抓取错误问题等,正文部分转载自百度资源平台。
1、抓取频次过少或过多?
抓起频次是根据网站的质量和内容决定的,建议您关注网站的实际的收录情况,并建议使用链接工具提交网站的优质内容,提交地址:http://zhanzhang.baidu.com/linksubmit/index/。如果网站抓取频次过大,您可以使用抓取频次工具设置百度抓取上限。如果问题依旧存在请点击这篇内容的出处部分所留下的锚文本链接进行反馈,同时建议您参考百度站长社区的相关讨论,百度站长社区地址:http://bbs.zhanzhang.baidu.com/。
2、如何判断爬虫IP是否属于百度并对用户站点进行了异常抓取
建议用户参考百度站长学院的的文章,使用反host的方式查看爬虫ip是否属于使用百度。如百度爬虫对您站造成了错误抓取或抓取频次过大,您可以在抓取频次工具下设置抓取上限或设置robots封禁不想被百度抓取的目录。同时建议您到站长社区参与相关问题讨论,百度站长社区地址:http://bbs.zhanzhang.baidu.com/,并其他站长一起找到更好的解决方案。
3、https网站抓取错误问题
如果网站是http转成https的话,建议先将网站设置http成301到https协议网址下,在使用抓取工具进行诊断。如果网站依旧无法抓取和收录,请点击这篇内容的出处部分所留下的锚文本链接进行反馈。
本篇内容出处地址:https://ziyuan.baidu.com/feedback/index