12/08/2018, 14:00

Lỗi 404, nguyên nhân và cách phát hiện

1. Lỗi 404 là gì? Khi truy cập vào một trang web mà nhận được lỗi 404 (PAGE NOT FOUND), xuất hiện khi có một request được gửi tới web server không được thực hiện hoặc không tìm thấy request đó. Nói chung, 404 error page (usually a 404 HTTP status code) được trả lại khi truy cập một URL (địa chỉ) ...

1. Lỗi 404 là gì?

Khi truy cập vào một trang web mà nhận được lỗi 404 (PAGE NOT FOUND), xuất hiện khi có một request được gửi tới web server không được thực hiện hoặc không tìm thấy request đó. Nói chung, 404 error page (usually a 404 HTTP status code) được trả lại khi truy cập một URL (địa chỉ) không tồn tại – do đã xóa hoặc được chỉnh sửa URL đó nhưng lại không chuyển hướng (301 redirect) URL cũ tới eURL mới hay có thể do sai lỗi chính tả trong liên kết đó.

Selection_190.png

Thông báo lỗi liên kết gãy 404 là lỗi hoàn toàn bình thường và hay gặp phải của một trang web sau một thời gian phát triển bởi vì bạn sẽ khó kiểm soát hết các bài viết cũ cũng như mọi liên kết đến website của bạn. Tuy nhiên, trong SEO, lỗi này bị Google phạt rất nặng. Nếu bạn không kịp thời phát hiện và khắc phục, nó sẽ tác động rất xấu đến website của bạn.

Các lỗi hiển thị dưới dạng như sau:

  • “404 Error”

  • “404 Not Found”

  • “The requested URL [URL link ] was not found on this server.”

  • “HTTP 404 Not Found”

  • “404 Page Not Found”

2. Nguyên nhân xảy ra lỗi 404

Trong SEO thì lỗi không tìm thấy địa chỉ trang đích trên domain của bạn là một lỗi Google đánh rất nặng. Khi website gặp phải nhiều lỗi 404 Google sẽ thông báo việc gia tăng số lượng lỗi 404 và tiếp theo là việc website của bạn bị giảm hạng nhanh chóng trên Google. Vậy nguyên nhân xảy ra lỗi 404 này như thế nào, thông thường có 1 số nguyên nhân sau:

-Thay đổi URL – Đây là lý do phổ biến nhất để gây ra một lỗi 404. Khi bạn thay đổi đường dẫn cũ và không thông báo cho các công cụ tìm kiếm thì hiển nhiền các con BOT của Google sẽ không truy cập được và đánh lỗi 404 thông báo lên Google

-Mod Rewrite – Đôi khi, bạn đã chuyển hướng URL đến một trang khác nhưng khi bạn bật mod_rewrite trong .htaccess lên thì có gì sai sót chăng. Đây cũng là một nguyên nhân dẫn đến tính trạng lỗi 404 xảy ra hàng loạt.

-Sai Code – Bất kỳ một đoạn code nào có sai sót thì hậu quả cũng khôn lường. Ví dụ trong wordpress, file index.php hoặc archive.php chỉ không may thôi bạn code nhầm một dấu ” hoặc một chữ nào đó, thì tất nhiên nó sẽ lỗi rồi.

3. Các công cụ phát hiện ra các liên kết lỗi 404

3.1. W3C Link Checker

W3C còn gọi là World Wide Web Consortium. Đây là một công cụ rất thuận lợi, không cần gõ captcha, hoàn toàn miễn phí cho phép bạn kiểm tra tất cả các link trong website của bạn. Từng đường link kể cả các link bị khóa bởi file robot.txt cũng sẽ được hiển thị kết quả dưới dạng bảng.

Truy cập: http://validator.w3.org/checklink

Selection_191.png

3.2. ScreamingFrog Spider SEO

Công cụ này sau khi thu thập thông tin về web của bạn sẽ báo cáo một cách chi tiết nhất không chỉ lỗi 404 mà còn lỗi về tiêu đề, meta,…Ngoài ra, bạn cũng có thể tạo ra một XML sitemap cho website của mình với công cụ này. ScreamingFrog sẽ có vai trò như một phần mềm hỗ trợ SEO tốt hơn vì nó có thêm các chức năng phục vụ việc SEO như phân tích các chỉ số của liên kết, kiểm tra liên kết, kiểm tra SEO Onpage,….

Phần mềm này tuy miễn phí nhưng nó sẽ giới hạn bạn thu thập tối đa là 500 liên kết. Nếu bạn muốn dùng nhiều hơn thì sẽ trả phí là 99 bảng Anh mỗi năm.

Truy cập: https://www.screamingfrog.co.uk/seo-spider/

Selection_192.png

3.3. Xenu’s Link Sleuth

Công cụ này không chỉ tìm ra lỗi liên kết gãy 404 mà còn dò tìm toàn bộ liên kết website của bạn. Sau khi quét qua website của bạn, nó sẽ cung cấp đầy đủ các thông tin như URL, kích thước trang, tiêu đề trang,.. và tất nhiên là các lỗi 404 mà web bạn đang mắc phải.

Khi phát hiện ra link bị 404, bạn có thể ấn chuột phải vào nó rồi chọn URL Properties để xem link đó nằm trong trang nào để bạn biết.

Truy cập: http://linktiger.com/

Selection_193.png

3.4. Google Webmaster Tools

Google Webmaster Tools là một công cụ phổ biến, rất quen thuộc và có thể được bạn sử dụng hằng ngày. Bạn có thể tìm thấy các liên kết bị lỗi 404 trong trang Lỗi thu thập dữ liệu, ở phần Thu thập dữ liệu của menu chính vì thu thập và thống kê các liên kết bị lỗi chính là 1 trong những tính năng tuyệt vời của công cụ này.

Truy cập: https://www.google.com/webmasters/tools/home?hl=vi

Selection_194.png

3.5. LinkChecker

Nếu bạn là một người dùng Linux thì có thể sử dụng công cụ này để kiểm tra liên kết gãy, nó hỗ trợ rất nhiều nền tảng như Windows, Ubuntu, Linux (hỗ trợ command line) và thậm chí là bạn có thể cài nó vào Web Server rồi sử dụng trên môi trường web.

Công cụ này có nhược điểm là thời gian kiểm tra lâu, so với W3C thì còn thua xa về tốc độ và chất lượng.

Truy cập: http://www.brokenlinkcheck.com/

Selection_195.png

Nguồn: internet

0