什么是死链?死链就是服务器的地址已经改变了.无法找到当前地址位置。简单地讲,死链接指原来正常,后来失效的链接。死链接发送请求时,服务器返回404错误页面。死链包括协议死链、内容死链和跳转死链。协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
第一,协议死链:
协议死链是指通过HTTP协议状态码明确表示网页已无阅读价值。HTTP协议状态码很多,但百度协议死链首推404,即未找到文件。请尽量不要用其它状态码来代表死链。
第二,内容死链:
内容死链主要是由网站自身变化引起的,网页可以正常打开未发生跳转,但页面内容对爬虫来说没有收录价值,对用户来说也没有参考价值,如帖子被删除、内容已转移、空间被关闭、信息已过期、交易已关闭等。在这样无有价值信息的网页上,网站应该在明显位置直接给予提示文字,如:
·页面不存在(网页不存在)
·内容已转移
·帖子已删除
·域名过期或出售
·空间被关闭
·网站要备案
·信息已过期
·交易已关闭
对百度不友好的做法:现在很多网站追求个性化和用户体验,在页面内容失效后并未做协议死链处理,也就是说返回状态码依然是200,仅仅是在页面上做了一个有趣的个性化图片,通过图片告诉用户这个页面没有有价值内容——百度不会认为这是一个内容死链,不提倡大家这样做。
需要着重强调的是:站长在申请取消闭站保护的时候,百度除了检测站内协议死链外,还会同时检查内容死链的比例和数量。即使您不使用闭站保护功能,百度也提倡大家踊跃提交内容死链,以保证站点评级的稳定。
第三,跳转死链
跳转死链是指网站将无阅读价值的页面统一跳转到某一个页面,如前一级目录面、首页等等,跳转前后的两个网页主体内容不同,不存在可替代的关系。除了404协议死链和内容死链外,站长还需要向百度提交跳转死链。
死链出现原因:
1、 动态链接在数据库不再支持的条件下,变成死链接。
2、某个文件或网页移动了位置,导致指向它的链接变成死链接。
3、网页内容更新并换成其他的链接,原来的链接变成死链接。
4、网站服务器设置错误
5、网站还没有完全做好,就上传到服务器上去了,这样也很多死链的。
6、某文件夹名称修改,路径错误链接变成死链。
影响
一、有可能会让搜索引擎降权
二、用户体验较差
死链接其实就是不能打开的url,很可能会让浏览你的站点人对你的网站产生反感,而搜索引擎的蜘蛛程序爬到这里的时候,发现前方的路不通,它有可能就会丢弃,不再向前爬,这样给它的影响就不好。
搜索引擎是不太喜欢把一个带有死链的站点排在最前面的,当然这不是绝对的情况,是属于大部分的。
遇到网站出现死链接,解决的办法就是删除死链接或者修复死链接,让网站结构更加顺畅。
处理方法
检查死链的方法和工具很多,有能力的还可以自己开发,站长常用的处理网站死链接的方法主要有:
1、Google网站管理员工具,可以找出Google收录的网页上的死链接总个数以及链接形式,但只能是对经过验证的网站进行检查;
2、Xenu-死链接检测工具,一个需要安装的客户端软件,可以对所有网站进行马上检查。检查结果数据报告非常详细;
3、站长工具死链接检测,一个网页在线死链检测工具。
一个网站死链过多,对于访客来说,无法打开的链接是对于友好的用户体验的一大打击。而对于搜索引擎来说,站点如果存在过多的死链接,那么搜索引擎的蜘蛛就会慢慢的不再来爬行你的站点。其结果就是网站的快照不更新,收录量骤减,排名下降及访客的大量流失。
检查死链的技巧
第一种,使用sitemap生成器这个工具主要是用来生成网站地图。在生成网站地图的时候,它可以把网站中的死链接全部找出来。这样我们就知道了一个网站的死链。
第二种,使用Google网站管理员工具,使用Google网站管理员工具需要首先注册并验证你的网站。在使用Google管理员工具一段时间之后,Google会把不能抓取到的链接都列举出来。这些链接里面,大多数都是死链接。
上面说这么多都是扯淡,要是我,直接写个脚本,一步到位。