Nhiều website doanh nghiệp xây dựng bằng WordPress gặp tình trạng Google không thu thập dữ liệu hoặc không index trang, khiến khi tìm kiếm tên miền hoặc nội dung liên quan thì website không xuất hiện trên kết quả tìm kiếm. Vấn đề này thường xảy ra với website mới hoặc sau khi thay đổi cấu hình. Trong bài viết này, bạn sẽ được hướng dẫn cách kiểm tra nguyên nhân và khắc phục tình trạng Google không thu thập dữ liệu website WordPress, giúp website nhanh chóng được index và cải thiện khả năng hiển thị trên Google.
Bước 1: Kiểm tra xem website có đang bị chặn index hay không
Đây là nguyên nhân phổ biến nhất khiến Google không thể index website.
Khi mới tạo website hoặc trong quá trình phát triển, nhiều quản trị viên thường bật chế độ ngăn công cụ tìm kiếm đánh chỉ mục để tránh Google index website chưa hoàn thiện. Tuy nhiên nếu quên tắt tùy chọn này, Google sẽ không thu thập dữ liệu website.
Cách kiểm tra:
- Đăng nhập vào trang quản trị WordPress (wp-admin).
- Vào Settings (Cài đặt), chọn Reading (Đọc).
- Kiểm tra dòng: “Discourage search engines from indexing this site” (Ngăn chặn các công cụ tìm kiếm đánh chỉ mục website này).
- Nếu ô này được tick, bạn hãy bỏ tick đi rồi nhấn Save Changes (Lưu thay đổi). Sau khi thay đổi, Googlebot có thể cần 1-2 ngày để thu thập lại dữ liệu website.

Bước 2: Kiểm tra file robots.txt
File robots.txt có nhiệm vụ hướng dẫn bot của công cụ tìm kiếm những khu vực nào được phép hoặc không được phép crawl trên website.
Nếu file này cấu hình sai, Google có thể bị chặn truy cập toàn bộ website.
Cách kiểm tra:
- Truy cập đường dẫn: https://tenmien.com/robots.txt (thay
tenmien.combằng domain của bạn).

Nếu thấy dòng sau:
User-agent: *
Disallow: /hoặc
Disallow: /Có nghĩa là website đang bị chặn toàn bộ bot tìm kiếm.
Cách khắc phục:
Nếu bạn sử dụng plugin SEO như Yoast SEO hoặc Rank Math, có thể chỉnh sửa robots.txt trong phần:
- Tools
- File Editor
Một file robots.txt cơ bản và an toàn cho WordPress nên có dạng:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://tenmien.com/sitemap_index.xmlSau khi chỉnh sửa, bạn có thể kiểm tra lại bằng công cụ Robots.txt Tester trong Google Search Console.
Bước 3: Kiểm tra thẻ meta robots (noindex)
Ngoài robots.txt, website cũng có thể bị chặn index bởi thẻ meta robots trong HTML.
Một số plugin SEO tự động gắn thẻ <meta name="robots" content="noindex"> cho trang chủ hoặc các trang quan trọng. Thẻ này sẽ yêu cầu Google không index trang đó.
Cách kiểm tra:
- Mở trang chủ website.
- Nhấp chuột phải và chọn View Page Source (Xem nguồn trang).
- Tìm từ khóa:
noindex. - Nếu xuất hiện trong phần
<head>, có thể trang đang bị chặn index.

Cách khắc phục:
Nếu bạn dùng plugin SEO:
- Với Yoast SEO: Bạn vào SEO, chọn Search Appearance. Sau đó, bạn kiểm tra các mục Content Types và General, đảm bảo tùy chọn “Show pages in search results” được đặt là Yes.

- Với Rank Math: Bạn vào Titles & Meta, sau đó kiểm tra: Global Meta Robots và thiết lập cho từng Post/Page, đảm bảo trang không bị gắn noindex.

Bước 4: Khai báo website với Google Search Console và submit sitemap
Để Google nhanh chóng nhận diện và thu thập dữ liệu website, bạn cần kết nối website với Google Search Console.
Tham khảo hướng dẫn thực hiện: Cách cài đặt Google Search Console chi tiết cho người mới.
Bước 5: Một số nguyên nhân khác khiến Google không index website
Ngoài các lỗi cấu hình phổ biến, website WordPress có thể chưa được Google index vì một số lý do khác.
Website mới tạo
Website mới thường cần vài ngày đến vài tuần để Google index.
Bạn có thể tăng tốc bằng cách:
- Chia sẻ link website lên mạng xã hội.
- Đặt backlink từ website khác.
- Gửi URL trực tiếp trong Search Console.
Lỗi crawl (crawl error)
Trong Google Search Console, bạn vào mục: Page Indexing hoặc Coverage để kiểm tra các lỗi phổ biến như:
- 404.
- 5xx server error.
- Redirect chain.
- Blocked by robots.txt.
Sau đó sửa từng lỗi theo hướng dẫn.
Domain chưa chuẩn (www và non-www)
Nếu website có cả hai dạng: https://domain.com hoặc https://www.domain.com nhưng chưa redirect, Google có thể gặp lỗi trùng lặp.
Bạn nên thiết lập redirect 301 về một phiên bản duy nhất thông qua:
- .htaccess.
- Plugin Redirection.
- Cấu hình server.
Nội dung kém chất lượng hoặc trùng lặp
Google có thể không index những trang:
- Nội dung quá ngắn.
- Nội dung trùng lặp.
- Nội dung không mang lại giá trị.
Do đó, mỗi trang nên có nội dung unique, đầy đủ và tối ưu SEO on-page.
Tình trạng Google không thu thập hoặc không index website WordPress khá phổ biến nhưng thường có thể khắc phục nhanh nếu xác định đúng nguyên nhân. Bằng cách kiểm tra các yếu tố như cài đặt chặn index trong WordPress, file robots.txt, thẻ meta robots và gửi sitemap lên Google Search Console, website của bạn có thể sớm được Google thu thập dữ liệu trở lại. Đồng thời, hãy thường xuyên theo dõi tình trạng index và tối ưu nội dung để cải thiện khả năng hiển thị và thu hút thêm lưu lượng truy cập từ công cụ tìm kiếm.
VIETNIX – DỊCH VỤ HOSTING, VPS TỐC ĐỘ CAO, ỔN ĐỊNH, BẢO MẬT
- Địa chỉ: 265 Hồng Lạc, Phường Bảy Hiền, Thành Phố Hồ Chí Minh
- Điện thoại: 1800 1093
- Email liên hệ: sales@vietnix.com.vn
- Website: https://vietnix.vn/

