404頁面,相信基本上沒有網站管理員會對此感到陌生。每當在敲錯鍵盤時,都會出現404狀態代碼。它意味著請求的URL地址不存在。然而,與這個狀態代碼有關的一些技術細節還不是很清楚。
首先,很少有人能了解,伴隨著404狀態代碼,Web服務器也能夠傳送任何HTML內容——和202狀態代碼所做的一樣。事實上,人們通常把404和Web服務器的普通錯誤頁面關聯起來。但是這種情況并不是必須的。有些網站自定義了它們自己的404頁面,來加強用戶體驗。更高級的網站甚至可以根據在無效URL地址中輸入的關鍵字的意思,試著給訪問者一些建議。
不管404頁面是普通的還是自定義的,它都能通知搜索引擎頁面不存在;并且還會使得頁面從索引中清除。跟隨404狀態代碼一起發送的內容也不會被索引。
注意:
搜索引擎從不索引一個能導致404狀態代碼的頁面。
對于靜態網站,404錯誤是自動產生的——只要刪除了文件就會產生。不幸的是,許多動態網站根本沒有404的概念,因為它的實現需要額外的努力。典型情況是當一個產品從數據庫中被刪除時,產品頁面不再被網站的其他頁面所鏈接。然而,這個產品頁面由于被外部網站頁面鏈接而獲得了鏈接價值,并仍然被搜索引擎索引。
最糟糕的事情就是返回一個帶200狀態代碼的空頁面——這經常發生在當某個產品ID在數據庫中不再存在時。隨著時間推移,結果就是一些空頁面被搜索引擎索引,這將導致重復內容問題。其實應該返回404狀態代碼,再附帶一個友好的錯誤消息。
提示:
一個通常的錯誤是發送一個“沒有找到頁面”的消息,那意味著在處理404時卻使用200狀態代碼。Web主機服務常常允許設置一個用戶定義404頁面——也就是當用戶請求一個不存在的URL地址時,發送這個頁面作為響應。然而,他們可能不會正確設置404狀態代碼。這可能導致理論上有無限多個重復頁面出現在網站中。在網絡上有些工具,就可以檢驗發送的報頭信息是否正確。
講了這么多,其中心思想是什么?保持整潔環境。對所有被刪除的頁面都返回404狀態代碼。一些搜索引擎營銷人員建議將老的產品重定向至語義相關的產品,而不是返回404狀態代碼。這將保持鏈接價值,而404則做不到。
相關文章:用404頁面將用戶帶回正軌