设为首页 | 加入收藏
 
济南网站建设电话


  • 济南铭竟信息科技有限公司
    电 话:0531-89008498
    在线客服QQ:448958541
    地址:山东济南市天桥区历山
    北路85号

有快照但打不开的链接对搜索引擎来讲影响很大吗?


发布者:济南建网站 发布时间:2019/7/29 18:19:09 阅读:444次 【字体:

 有快照但打不开的链接对搜索引擎来讲影响很大吗?,大量有快照但打不开的链接对搜索引擎来讲,有什么影响?

  1、几乎很多站都避免不了存在有快照但打不开的链接接,但有快照但打不开的链接率过高,会影响搜索引擎对网站的评分。

  2、搜索引擎对每个网站每天抓取的频次是限额的,若网站存在大量有快照但打不开的链接,会浪费掉抓取配额并影响正常页面的抓取。

  3、过多有快照但打不开的链接对网站用户来讲也是体验不好的表现。

  百度站长工具中有一个抓取异常,那么这个工具里面的异常数据是如何产生的呢?

  1、网站内部添加了错误的内部链接

  编辑失误或者程序员大意让页面产生了不存在页面的URL。

  2、原来正常页面因为程序或页面调整或改版无法打开

  因为程序的一个改动,导致了某些正常页面无法打开。

  3、网站短暂无法访问

  因为服务器、空间或程序问题导致网站无法访问,抓取异常中会出现大量的500错误页面。

  4、外部链接错误

  用户或者站长在站外发布了错误URL,蜘蛛爬取后产生错误页面;别的网站复制或采集了你们含有错误链接的页面;有些垃圾网站自动生成的静态搜索结果页,如 www。8875。org/desc/3715714444.html 这个页面中出现的很多链接在html前面有“...”。

  5、爬虫提取了不完整的URL

  个别爬虫在提取页面URL的时候,只提取部分URL或者把正常的URL后面的文字或字符也提取进去了。

  6、网站改版或管理员删除页面

  网站改版过程中处理不当导致部分老页面无法访问,或者网站管理员删除被黑、广告、过时、被灌水页面。

  出现了上述情况,我们该如何去解决

  1、修复错误页面 抓取异常中的很多错误页面是因为程序员大意或者我们程序问题导致的,本应该是正常页面,因为失误导致无法访问,对于此类页面,第一时间进行修复。

  2、提交有快照但打不开的链接接 但必定很多错误页面是本不应该存在的,那么我们要想办法获取此类页面URL,获取方式主要有三种:

  (1) 百度站长工具--抓取异常--找不到的页面--复制数据 [修正:此处有快照但打不开的链接不需我们提交了,百度站长工具自动提交有快照但打不开的链接];

  (2) 管理员在删除页面的时候手动或者程序自动保存被删页面URL;

  (3) 使用相关爬虫软件,爬取整站获取有快照但打不开的链接,如Xenu 。

  然后将上述数据合并并删除重复项(excel表格中能实现删重,wps表格更容易操作),然后再复制所有URL通过HTTP状态批量查询工具查询下[这个不错pl.soshoulu.com/webspeed.aspx],剔除掉非404返回码页面。

  然后整理上面处理好的数据粘贴到网站根目录中的一个文档中,再把文档地址提交到 百度站长工具--网页抓取--有快照但打不开的链接提交--添加新数据--填写有快照但打不开的链接文件地址。

  3、在robots中屏蔽抓取

  若大量的错误URL存在一定的规律,可以在robots文件中写一个规则禁止蜘蛛程序抓取此类链接,但前提一定要照顾好正常页面,避免屏蔽规则误伤正常页面,比如你的网站全部是静态URL,那么如果错误链接中含有?的话,规则写成Disallow:/*?*,如果错误链接中有/id...html 的话,规则写成Disallow:/*...* 。

  robots文件添加完规则后,一定要去百度站长的 robots工具 进行校验,将指定的错误页面放进去,看看是否封禁成功,再把正常的页面放进去看看是否被误封。

  相关注意事项:

  1、在百度站长工具中提交有快照但打不开的链接前,一定要确保提交的有快照但打不开的链接数据不存在活链接,或者存在HTTP状态码非404页面。一旦存在活链,会显示提交失败导致无法删除。

  2、由于很多网站程序问题,很多打不开的页面返回码并非404,这是一个大问题,比如明明是打不开的页面返回码是301、200、500,如果是200的话,会导致网站中出现不同URL获取相同内容。比如我的一个站,社区的帖子删除后,返回码却是500,后期发现了,立马进行了处理。大家尽量找出所有错误URL格式,.并设置打开后HTTP状态码为404。

  3、把所有的错误页面找到后,一定要寻找此类页面URL相同特征,并且和正常页面的特征有区分,写对应规则到robots文件中,禁止蜘蛛抓取,就算你已经在站长工具中提交了有快照但打不开的链接,也建议robots封禁抓取。

  4、robots只能解决蜘蛛不再抓取此类页面,但解决不了已经抓取页面的快照的删除问题,若你的网站被黑,删除了被黑页面,除了robots封禁被黑页面外,还应该将这些页面提交有快照但打不开的链接。提交有快照但打不开的链接是删除被黑页面快照的最快办法。

 
 


友情链接: 热镀锌方管 | 异型管 | 凹槽管 | 济南保洁 | 88同城 | 上海网站建设 | 吹氧管 | 济南便民网 | 椭圆管厂家 | 济南空调维修 | 济南信息网 | 热镀锌方管 | 济南办pos | 济南空调维修 | 大棚管 | 椭圆管厂家 | 扇形管厂家 | 日照渔家住宿 | 济南阳光房天棚帘 | 椭圆管 | 济南家政 | 济南网站建设 | 济南保洁 | 热镀锌方管 |

售前客服

售前客服

售后客服

技术支持

咨询热线:
0531-89008498
在线客服