Những lỗi thường gặp trong Google Search Console và cách xử lý
Views: 2,473
Chắc hẳn bạn đã biết cách cài đặt Google Search Console với những bước cơ bản ban đầu. Trong quá trình sử dụng công cụ này để phân tích, bạn sẽ gặp những thông báo lỗi trong phần tính năng nâng cao. Chúng có thể là tính khả dụng trên thiết bị di động, đường dẫn, tốc độ, biểu trưng, sản phẩm hay đoạn trích đánh giá. Đây là những lỗi thường gặp, vậy cách xử lý như thế nào và có những lỗi cụ thể như thế nào? Cùng tìm hiểu bài viết dưới đây nhé.
Sử dụng “Coverage” để tìm nội dung bị lỗi “Index”
Khi bạn bắt đầu viết nội dung cho các trang trên Website của bạn cũng là lúc mà Google Bot tìm đến và thu thập các dữ liệu trên trang. Tuy nhiên, chẳng may bạn sẽ gặp một vài vấn đề gì đó khiến cho việc thu thập bị gián đoạn và không thể Index được tất cả cá trang. Lúc này, tính năng Coverage trong Google Search Console sẽ tỏ ra cực kỳ hữu ích. Cùng tìm hiểu những nội dung bên dưới nhé.
>>> Tham khảo: Làm thế nào để SEO từ khóa lên TOP Google?
Coverage là gì? Nó có tác dụng gì?
Coverage (Sự bao phủ) sẽ cho bạn một bản báo cáo những trang nào trên Website của bạn đã được Index thành công, những trang nào không thể Index vì một điều gì đó. Khi bạn vào phần này, nó sẽ hiển thị cho bạn một số thông tin như:
- Error: Lỗi hiện tại đang có trên trang
- Valid with warnings: Trang đã được Index nhưng vẫn còn tồn tại một số cảnh báo
- Valid: Trang đã được Index thành công và không có lỗi nào
- Excluded: Trang không được Index.
Tìm lỗi index với báo cáo Error trong Coverage
Bạn tìm lỗi Index bằng cách nhấn vào Tab Error để kiểm tra những lỗi mà trang của bạn đang mắc phải nhé.
Lúc này bạn sẽ thấy một biểu đồ hiển thị rõ ràng số lượng các lỗi cùng với thời gian cụ thể mà nó đang tồn tại. Kéo xuống phía dưới là chi tiết cụ thể thông tin của mỗi loại lỗi.
Trên đây chỉ có 2 lỗi cơ bản, sau đây mình sẽ liệt kê một số lỗi khác mà các bạn thường gặp phải trong quá trình xem báo cáo.
Submitted URL seems to be a Soft 404
Lỗi này gặp phải là do không tìm thấy trang do trang không tồn tại nữa. Bạn kiểm tra xem có thể bài viết đã bị xóa
Redirect error
Trang được chuyển hướng 301 hoặc 302 tuy nhiên chưa chính xác và bị lỗi
Submitted URL not found (404)
Đây là trang không tồn tại hoặc bị xóa nên server trả về 404
Submitted URL has crawl issue
Lỗi này là lỗi xảy ra trong quá trình thu thập dữ liệu. Bạn cần click vào để xem chi tiết đây là lỗi gì để có hướng fix cụ thể.
Server errors (5xx)
Đây là lỗi liên quan đến máy chủ, máy chủ co thể bị sập hoặc thời gian chờ quá lấu (time-out) nên Googlebot không thể truy cập được vào server.
Bạn click vào từng lỗi để kiểm tra danh sách các trang đang bị lỗi. Bạn cần fix trước lỗi 404 vì chúng khá đơn giản. Tuy nhiên bạn cần kiểm tra sự tồn tại của URL đó trước khi sửa.
Cách xử lý URL bị lỗi 404
Thật không may, vào một ngày đẹp trời, bỗng nhiên bạn vào một trang bất kỳ hoặc Google Search Console báo những trang có lỗi 404. Vậy cách xử lý các trang 404 là gì?
Có 2 cách mà mình tích lũy được trong quá trình làm dịch vụ SEO trang web:
- Cách thứ nhất là đợi cho Google deindex trang đó (Sau một thời gian Google sẽ biết trang đó không có sản phẩm và bạn không cần trang đó nữa), cách này khá mất thời gian.
- Cách thứ hai là redirect sang một trang khác có liên quan, đó có thể là bài viết hoặc danh mục.
Giờ chúng ta hãy quay lại với chức năng Live Test URL bằng cách nhấn vào Inspect URL để kiểm tra xem URL này có vấn đề gì cần fix không.
Tiếp đến, bạn nhấn vào nút Test Live URL để kiểm tra thực tế tình trạng của đường dẫn ngay thời điểm hiện tại. Từ đây, bạn dựa vào những thông tin được cung cấp để fix lỗi nhé.
Cách Fix những lỗi khác
Nếu phía trên là cách fix lỗi 404 khá đơn giản, thì dưới đây là những lỗi khác có phần phức tạp hơn đôi chút.
Bị chặn Index
Bạn nhấn vào Test Robot.txt Blocking. Sau đó, bạn sẽ được chuyển sang phiên bản cũ để kiểm tra do phiên bản mới chưa cập nhật tính năng này.
Bạn kiểm tra thuộc tính bên góc dưới bên phải, nếu đang hiển thị là Allowed thì tức là không bị chặn và bạn có thể yên tâm. Trường hợp không phải thì bạn cần kiêm tra lại tập tin này để xem chúng có vấn đề gì không và đưa ra hướng xử lý.
Sửa các lỗi “Warning” trong Coverage
Thông thường, những lỗi Warning như thế này thường không được để ý và quan tâm lắm. Tuy nhiên, bất kỳ lỗi nhỏ nào ít nhiều cũng ảnh hưởng đến hiệu suất của Website. Chuyển qua Tab “Valid with Warnings” bạn sẽ thấy như sau:
Cũng như trường hợp ở trên, bạn click vào từng trang có lỗi để kiểm tra cụ thể nó đang bị lỗi gì. Ở trường hợp của mình là những đường dẫn này bị chặn bởi file Robot.txt. Để bỏ chặn bạn chỉ cần xóa dòng đó đi là được, đồng thời kiểm tra xem trong trang đó có bị gắn tag “Noindex” không và kiểm tra xem có phải bạn thực hiện không hay người khác và với mục đích gì.
Hướng dẫn loại bỏ URL khỏi Google Search
Nếu có bất kỳ trang nào mà bạn không mong muốn xuất hiện trên Google nữa, bạn hãy dùng tới chức năng Remove URLs trong phần Google Index ở phiên bản cũ.
Bạn chỉ cần điền đường dẫn trang mà bạn muốn chặn và nhấn Submit để xác nhận việc này. Lưu ý là là chức năng này có tác dụng trong vòng 90 ngày nên sẽ mất khá nhiều thời gian để chúng biến mất. Trong thời gian đó các con bot vẫn sẽ tiếp tục thu thập dữ liệu của trang đó. Vì thế nếu cần thiết bạn nên chặn bằng file Robot.txt.
Kiểm tra các trang đã được index
Tiếp theo bạn chuyển sang Tab thứ 3 để kiểm tra số lượng các trang đã được Index. Có 2 vấn đề bạn cần lưu ý sau đây là:
Tăng đột ngột hoặc giảm đột ngột số lượng trang được Index
Nếu trong biểu đồ này, bạn thấy có một lượng lớn các trang có sự biến động đột ngột bạn cần kiểm tra file robot.txt những trang đó có bị chặn không hoặc trong trang có bị gắn thẻ “Noindex”.
Số lượng trang được index cao bất thường
Bạn cần so sánh số lượng bài viết trên Website với số lượng Page được Index, nó có chênh lệch nhiều không. Nếu có hãy tìm nguyên nhân là do đâu. Nếu chênh lệch không quá nhiều thì bạn cũng không cần quá bận tâm.
Kiểm tra tab Excluded (bỏ không index)
Chuyển sang Tab cuối cùng là những trang không được Index. Đây có thể là chủ đích của người quản trị hoặc có thể do lỗi. Như bạn đó biết, không phải tất cả các trang trên Website đều được Index mà cần phải có sự chọn lọc.
Kéo xuống dưới một chút bạn sẽ thấy chi tiết những trang không được Index. Dưới đây là các loại thuộc về phần Excluded:
Excluded by ‘noindex’ tag
Thông thường đối với các trang bán hàng thương mại điện tử sẽ có rất nhiều thẻ tag trên trang, những thẻ tag này không nhất thiết phải được Index vì thế bạn nên chặn chúng.
Alternate page with proper canonical tag
Đây là những trang thay thế dưới tác dụng của thẻ Canonical vì vậy đây là điều hoàn toàn bình thường.
Crawled – currently not indexed
Đây là những trang mà đã được thu thập dữ liệu tuy nhiên lại không được Index. Có thể do nó chưa đạt những yêu cầu nhất định của Google như tỷ lệ trùng lặp quá cao, trang không có nội dung và không có mô tả trang. Trước mắt bạn cần làm mới lại chúng bằng cách bổ sung những thứ trên cho thật độc đáo và hấp dẫn.
Page with redirect
Đây là những trang đã được chuyển hướng sang một đường dẫn khác khác. Điều này là nên làm với những trang 404 mà mình đã trình bày ở trên.
Discovered – currently not indexed
Đây là những trang mà Googlebot đã thu thập dữ liệu nhưng chưa được Index. Có thể chúng sẽ được Index trong thời gian tới.
Crawl anomaly
Cá khá nhiều lý do cho việc này. Hãy nhấn vào từng Page để xem trực tiếp nhé.
Duplicate, submitted URL not selected as canonical
Đây là một tập hợp các trang có nội dung trùng lặp mà chưa được gắn thẻ Canonical. Bạn cần gắn thẻ Canonical để Google nhận biết được trang nào là trang chính và không bị lỗi trùng lặp nội dung.
>>> Xem thêm: Hướng dẫn cài đặt và kết nối website với Google Search Console