404状态码是一种http状态码,其意思是: 所请求的页面不存在或已被删除!通俗的讲就是当用户输入了错误的链接时,返回的页面。
404状态码和410状态码都是表示请求的网页不存在,而404状态码不排除日后该链接有效的可能性,而410状态码是永久性的,那当搜索引擎遇见这2个状态码时,处理上是否有什么不同呢?
搜索引擎确实在对待404和410状态码上有一点的不同,但绝大不多情况都是不用担心的,只是一点点的不同。在Googlebot抓取一个网页时,如果得到404状态码,他们会在24小时内在抓取系统中保护这个页面,以防这个页面的404状态码是无意的。 如果搜索引擎抓取的网页返回的是410状态码,蜘蛛就假定这个状态码是管理员故意的,因为一个网站管理员必须手动进入并输入410代码来指示一个页面已经一去不复返。这个时候搜索引擎不会保护这个页面,而是直接视它为错误页面。

自定义404错误页面是增强用户体验的很好的做法,但在应用过程中往往并未注意到对搜索引擎的影响,搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除,当然,删除过程有可能需要很长时间;自定义404错误页面的内容,这会导致出现复制网页问题。轻则被搜索引擎降权,重则会K掉网站