1. Hiện tại có một số member mạo danh BQT để giao dịch trên diễn đàn và đã LỪA ĐẢO khá nhiều tại chuyên mục Adwords... Mọi người cảnh giác và đọc bài: Giới thiệu giao dịch đảm bảo bởi @Admin

Làm thế nào để khắc phục lỗi crawl trong Google Search Console?

Thảo luận trong 'Onpage Seo - Tối ưu các yếu tố trên trang web' bắt đầu bởi thegioiseo, 25/9/16.

Lượt xem: 30,122
  1. thegioiseo

    thegioiseo Điều Hành Viên

    Gia nhập:
    22/5/11
    Bài viết:
    1,206
    Đã được thích:
    2,688
    (Thegioiseo) - Có rất nhiều thay đổi trong 5 năm qua kể từ lần tôi viết về Google Webmaster Tools (nay có tên gọi là Google Search Console). Google đã tung ra nhiều dữ liệu hơn, hứa hẹn sẽ vô cùng hữu ích cho SEO. Kể từ khi chúng ta bị mất dữ liệu từ khóa trong Google Analytics, chúng ta đã đến để dựa vào Search Console nhiều hơn bao giờ hết. Phần “Search Analytics” và “Links to Your Site” có 2 tính năng hàng đầu mà không tồn tại trong Webmaster Tools cũ.

    Chúng ta có thể không bao giờ hoàn toàn hài lòng với các công cụ của Google, họ đã phát hành một số thông tin hữu ích (theo thời gian). Để tin tưởng họ, Google đã phát triển nhiều tài liệu giúp đỡ và hỗ trợ các nguồn tài nguyên để hỗ trợ người dùng Search Console trong việc định vị và sửa lỗi.

    Mặc dù, thực tế là điều này không phải lúc nào cũng hài lòng như việc tạo ra nội dung 10x hay xem những từ khóa nào đã tăng trưởng trong bảng xếp hạng, danh mục này đối với SEO vẫn là cực kỳ quan trọng.

    Nhìn vào nó thông qua epic của Portent, việc sửa chữa các lỗi thu thập trong Search Console phù hợp với phần "infrastructure":

    Lam the nao de khac phuc loi crawl trong google search console

    Nếu bạn có thể phát triển những thói quen tốt và thực hành việc bảo trì, kiểm tra các lỗi thu thập hàng tuần để đảm bảo rằng chúng được kiểm soát. Tuy nhiên, nếu bạn bỏ qua hoàn toàn các lỗi, mọi thứ có thể nhanh chóng đi từ xấu đến tồi tệ hơn.

    Lỗi crawl layout

    Một sự thay đổi đã phát triển trong một vài năm trở lại đây là lỗi crawl layout trong Search Console. Search Console được chia thành 2 phần chính: lỗi trang web và lỗi URL.

    Việc phân loại lỗi theo cách này là khá hữu ích vì có sự khác bệt rõ rệt giữa các lỗi ở cấp độ trang web và các lỗi ở cấp độ trang. Vấn đề ở cấp độ trang web có thể là một thảm họa hơn vì nó có khả năng gây tổn hại đến khả năng sử dụng tổng thể của trang web. Lỗi URL là lỗi cho các trang cụ thể và do đó ít nghiêm trọng hơn.

    Cách nhanh nhất để truy cập lỗi crawl là từ bảng điều khiển. Bảng điều khiển chính sẽ cho bạn xem trước nhanh chóng trang web của bạn, hiển thị cho bạn 3 công cụ quản lý quan trọng nhất: Crawl Errors, Search Analytics và Sitemaps.

    Lam the nao de khac phuc loi crawl trong google search console 2
    Bạn có thể nhìn thấy nhanh các lỗi thu thập của bạn từ đây. Thậm chí nếu bạn chỉ nhìn lướt qua nó hàng ngày, bạn sẽ nhìn thấy nhiều hơn nữa.

    1. Site Errors

    Phần Site Errors hiển chị cho bạn các lỗi từ trang web của bạn. Đây là một lỗi ở mức độ cao có ảnh hưởng đến trang web của bạn, vì vậy đừng bỏ qua nó.

    Trong bảng điều khiển Crawl Errors, Google sẽ hiển thị cho bạn thấy các lỗi trong vòng 90 ngày. Nếu bạn có một số hoạt động trong 90 ngày đó, snippet của bạn sẽ trông như thế này:
    Lam the nao de khac phuc loi crawl trong google search console 3
    Nếu bạn có 100% error-free trong 90 ngày, nó sẽ hiển thị như thế này:

    Lam the nao de khac phuc loi crawl trong google search console 4
    Đó là mục tiêu - để có được một "Nice!" Từ Google. Nhưng hầu như chúng ta thường không nhận được bất kỳ sự xác nhận nào từ Google, do đó để được thưởng thức khoảnh khắc này thì quả là hiếm hoi.

    Bao lâu bạn nên kiểm tra lỗi trang web?

    Trong một thế giới lý tưởng, bạn sẽ đăng nhập hàng ngày để đảm bảo không có vấn đề gì xảy ra. Trong một thế giới không lý tưởng, bạn nên kiểm tra ít nhất 90 ngày để tìm kiếm các lỗi trước đó, vì vậy bạn có thể theo dõi trong tương lai - nhưng kiểm tra thường xuyên là cách tốt nhất.

    Chúng ta sẽ nói về việc thiết lập các cảnh báo và tự động hoá phần này sau nhưng bạn cần biết rằng phần này là rất quan trọng và bạn sẽ có 100% error-free trong phần này mỗi ngày. Không có vùng xám ở đây.

    A) DNS Errors

    Điều này có nghĩa là gì?

    Lỗi DNS rất quan trọng - và nó tác động nghiêm trọng đến trang web của bạn. Lỗi DNS (Domain Name System) là lỗi đầu tiên và nổi bật nhất vì nếu Googlebot có vấn đề DNS, có nghĩa là nó không thể kết nối với tên miền của bạn.

    Tên miền của bạn được lưu trữ với một công ty tên miền phổ biến như Namecheap hoặc GoDaddy hoặc với công ty lưu trữ web của bạn. Đôi khi tên miền của bạn được lưu trữ riêng biệt từ công ty lưu trữ trang web của bạn.

    Chúng quan trọng?

    Google tuyên bố rằng có nhiều vấn đề DNS cho phép Google kết nối với trang web của bạn nếu bạn đang có vấn đề nghiêm trọng với DNS, bạn nên hành động ngay lập tức.

    Vấn đề DNS là vô cùng quan trọng vì nó là bước đầu tiên trong việc tiếp cận trang web của bạn. Bạn nên hành động nhanh chóng nếu bạn đang gặp phải vấn đề với DNS.

    Làm thế nào để khắc phục?

    1. Đầu tiên, Google khuyến cáo sử dụng công cụ Fetch as Google của họ để xem cách Googlebot crawl trang của bạn.

    Lam the nao de khac phuc loi crawl trong google search console 5

    Nếu bạn chỉ tìm kiếm kết nối DNS và đang cố gắng để hành động một cách nhanh chóng, bạn có thể lấy fetch mà không cần render.

    2. Kiểm tra nhà cung cấp DNS của bạn. Nếu Google không thể fetch và render các trang của bạn đúng, bạn cần hành động. Kiểm tra nhà cung cấp DNS của bạn để xem nơi xảy ra vấn đề.

    3. Đảm bảo rằng máy chủ của bạn hiển thị mã lỗi 404 hoặc 500. Thay vì có một kết nối thất bại, máy chủ của bạn sẽ hiển thị một mã 404 hoặc mã 500. Các mã này là chính xác hơn so với việc có một lỗi DNS.

    Các công cụ khác

    - ISUP.me - Cho phép bạn biết ngay lập tức nếu trang web của bạn bị down.

    - Web-Sniffer.net - Cho phép bạn nhìn thấy những yêu cầu HTTP(s) hiện tại.

    B) Server Errors

    Lỗi máy chủ có nghĩa là máy chủ của bạn mất quá lâu để phản hồi và yêu cầu time out. Googlebot cố gắng để thu thập thông tin trang web của bạn chỉ có thể chờ đợi một lượng thời gian nhất định để tải trang web của bạn. Nếu bạn phải mất quá lâu, Googlebot sẽ ngừng việc cố gắng.

    Lỗi máy chủ khác với lỗi DNS. Lỗi DNS là Googlebot không thể tra cứu URL của bạn bởi vì các vấn đề DNS, trong khi lỗi máy chủ là Googlebot có thể kết nối với trang web của bạn, nó không thể tải trang do lỗi máy chủ.

    Lỗi máy chủ có thể xảy ra nếu trang web của bạn bị quá tải với lưu lượng truy cập quá nhiều cho máy chủ để xử lý. Để tránh điều này, hãy đảm bảo cung cấp dịch vụ lưu trữ của bạn để đáp ứng lưu lượng truy cập trang web. Mọi người đều muốn trang web của họ lan truyền nhưng không phải ai cũng sẵn sàng.

    Chúng có quan trọng không?

    Giống như lỗi DNS, lỗi máy chủ là vô cùng cấp bách. Đó là một lỗi cơ bản và làm tổn hại đến trang web của bạn. Bạn nên hành động ngay lập tức nếu bạn thấy lỗi máy chủ trong Search Console trên trang web của bạn.

    Đảm bảo Googlebot có thể kết nối đến DNS là một bước quan trọng đầu tiên nhưng bạn sẽ không nhận được nhiều hơn nữa nếu website của bạn không thực sự xuất hiện. Nếu bạn đang chạy vào các lỗi máy chủ, Googlebot sẽ không thể tìm thấy bất cứ điều gì để thu thập và nó sẽ cho lên sau một khoảng thời gian nhất định.

    Làm thế nào để khắc phục?

    Trong trường hợp trang web của bạn đang chạy tốt tại thời điểm bạn gặp lỗi này, có thể là lỗi máy chủ trong quá khứ. Mặc dù lỗi này có thể được giải quyết nhưng bạn vẫn nên thực hiện một số thay đổi để ngăn chặn nó xảy ra một lần nữa.

    Đây là hướng đi chính thức của Google để sửa lỗi máy chủ:

    "Sử dụng Fetch as Google để kiểm tra nếu Googlebot có thể thu thập trang web của bạn. Nếu Fetch as Google trả về nội dung của các trang web là không có vấn đề gì, bạn có thể giả định rằng Google có thể truy cập trang web của bạn đúng cách".

    Trước khi bạn có thể khắc phục vấn đề lỗi máy chủ, bạn cần phải chẩn đoán cụ thể loại mỗi máy chủ bạn đang nhận được vì có nhiều loại:

    - Timeout
    - Truncated headers
    - Connection reset
    - Truncated response
    - Connection refused
    - Connect failed
    - Connect timeout
    - No response

    Bạn có thể tham khảo Google Search Console đẻ có thể chẩn đoán các lỗi cụ thể.

    C. Robots failure

    Robots failure có nghĩa là Googlebot không thể truy xuất tập tin robots.txt của bạn, đặt tại [yourdomain.com]/robots.txt.

    Điều này có nghĩa là gì?

    Một trong những điều đáng ngạc nhiên nhất về tập tin robots.txt là nó chỉ cần thiết nếu bạn không muốn Google thu thập trang nhất định. Từ Search Console help, Google tuyên bố rằng:

    "Bạn cần một tập tin robots.txt nếu trang web của bạn bao gồm nội dung mà bạn không muốn công cụ tìm kiếm index. Nếu bạn muốn công cụ tìm kiếm index tất cả mọi thứ trong trang web của bạn, bạn không cần một tập tin robots.txt. Nếu bạn không có một tập tin robots.txt, máy chủ của bạn sẽ trả về 404 khi Googlebot yêu cầu nó và chúng tôi sẽ tiếp tục thu thập thông tin trang web của bạn”.

    Chúng có quan trọng?

    Đây là một vấn đề khá quan trọng. Đối với các trang web nhỏ hơn, tĩnh hơn mà không có nhiều thay đổi hoặc các trang mới, nó không phải là đặc biệt khẩn cấp. Nhưng vấn đề vẫn cần được khắc phục.

    Nếu trang web của bạn được xuất bản hoặc thay đổi nội dung mới hàng ngày, đây là một vấn đề cấp bách. Nếu Googlebot không thể tải robots.txt của bạn, nó không thu thập trang web của bạn và nó không index và thay đổi trang mới của bạn.

    Làm thế nào để khắc phục?

    Đảm bảo rằng tập tin robots.txt của bạn được cấu hình đúng. Kiểm tra kỹ những trang của bạn. Nếu tập tin của bạn theo thứ tự và bạn nhận được lỗi, sử dụng công cụ server header checker để xem nếu tập tin của bạn trả về lỗi 200 hoặc 404.

    Đối với một vài dòng văn bản, tập tin robots.txt có thể gây ra những hậu quả thảm khốc cho trang web của bạn. Hãy đảm bảo rằng bạn phải kiểm tra sớm và thường xuyên.

    2. Lỗi URL

    Lỗi URL khác với lỗi trang web vì chúng chỉ bị ảnh hưởng đến các trang cụ thể trên trang web của bạn.
    slide
    Google Search Console sẽ cho bạn thấy những lỗi URL trên mỗi danh mục - desktop, smartphone. Đối với các trang web lớn, điều này có thể không đủ dữ liệu để hiển thị tất cả các lỗi nhưng với đa số các trang web này sẽ nắm bắt được tất cả các vấn đề được biết đến.

    Nhiều chủ sở hữu trang web đã gặp phải vấn đề khi nhìn thấy một số lượng lớn các lỗi URL và hơi bối rối. Điều quan trọng cần nhớ là Google xếp hạng các lỗi quan trọng nhất đầu tiên và một vài lỗi này có thể đã được giải quyết.

    Nếu bạn đã thực hiện một số thay đổi mạnh trên trang web của bạn để sửa lỗi hoặc tin rằng rất nhiều lỗi URL không còn xảy ra, một trong những chiến thuật được sử dụng là đánh dấu tất cả các lỗi là fixed và kiểm tra lại chúng trong một vài ngày.
    Lam the nao de khac phuc loi crawl trong google search console 7
    Khi bạn làm điều này, lỗi của bạn sẽ bị xóa ra khỏi bảng điều khiển nhưng Google sẽ mang các lỗi trở lại trong thời gian tới khi nó thu thập trang web của bạn trong vài ngày tới. Nếu bạn đã thực sự fix các lỗi này trong quá khứ, họ sẽ không hiển thị lên một lần nữa. Nếu lỗi vẫn còn tồn tại, nó vẫn sẽ ảnh hưởng đến trang web của bạn.

    A) Soft 404

    Điều đó có nghĩa gì?

    Người dùng có thể nhìn thấy một trang 404 là nội dung của trang. Thông điệp có thể nhìn thấy cho người dùng biết trang họ yêu cầu đã bị bỏ qua. Thông thường, các chủ sở hữu trang web sẽ có một danh sách các liên kết có liên quan của người dùng.

    Lam the nao de khac phuc loi crawl trong google search console 8
    Flipside của một trang 404 là phản hồi crawler-visible. Mã hồi đáp header HTTP phải là 404 hoặc 410.

    Bạn có thể tìm hiểu thêm tại đây:
    Lam the nao de khac phuc loi crawl trong google search console 9
    Nguồn: Tuts Plus

    Nếu bạn đang trả lại trang 404 và nó được liệt kê như là một Soft 404, có nghĩa là mã phản hồi HTTP header không trả lại mã phản hồi 404. Google khuyến cáo rằng "bạn cần phải trả về mã phản hồi 404 hoặc 410 để yêu cầu một trang không tồn tại".
    Lam the nao de khac phuc loi crawl trong google search console 10
    Một tình huống khác là nếu bạn có các trang mà có chuyển hướng 301 đến một trang không liên quan, chẳng hạn như trang chủ của Google, hãy đề cập đến nó trong các thuật ngữ mơ hồ.

    Trên thực tế, theo kinh nghiệm của tôi nếu bạn đang chuyển hướng một số lượng lớn các trang đến trang chủ, Google có thể giải thích các URL được chuyển hướng đó như là soft 404s chứ không phải là chuyển hướng 301. Ngược lại, nếu bạn đã chuyển hướng một trang cũ tới một trang có liên quan thay vào đó, không chắc rằng bạn muốn kích hoạt cảnh báo soft 404 theo cách tương tự.

    Chúng quan trọng?

    Nếu các trang được liệt kê lỗi soft 404 là những trang không quan trọng và bạn không ngốn ngân sách thu thập của bạn bởi có một vài lỗi soft 404, đây không phải là một mục khẩn cấp cần phải sửa.

    Nếu bạn có các trang quan trọng trên trang web của bạn được liệt kê là soft 404s, bạn muốn hành động để sửa chữa chúng. Các trang quan trọng như trang sản phẩm, category hoặc các trang lead gen không nên được liệt kê là soft 404s nếu chúng là các trang sống. Đặc biệt chú ý đến các trang quan trọng với khả năng kiếm tiền của trang web.

    Nếu bạn có một số lượng lớn các lỗi soft 404 so với tổng số trang trên trang web của bạn, bạn nên hành động nhanh chóng. Bạn có thể ngốn ngân sách thu thập của Googlebot bằng cách cho phép các lỗi soft 404 đó tồn tại.

    Làm thế nào để khắc phục?

    Đối với các trang không còn tồn tại:

    - Cho phép để 404 hoặc 410 nếu trang được bỏ qua và không nhận được lưu lượng truy cập hoặc liên kết quan trọng. Đảm bảo rằng server header response là 404 hoặc 410 chứ không phải là 200.

    - Chuyển hướng 301 mỗi trang cũ đến một trang liên quan trên trang web của bạn.

    - Không chuyển hướng một lượng lớn các trang chết đến trang chủ của bạn. Chúng phải là trang 404 hoặc được chuyển hướng để chiếm đoạt các trang tương tự.

    Đối với các trang sống và không phải là soft 404:

    - Đảm bảo có một số lượng nội dung phù hợp trên trang vì nội dung sơ sài có thể kích hoạt lỗi soft 404.

    - Đảm bảo nội dung trên trang web của bạn không xuất hiện để đại diện một trang 404 trong khi phục vụ mã phản hồi 200.

    Soft 404s là lỗi lạ. Chúng mang đến nhiều rắc rối vì chúng khá lạ và những gì chúng gây ra không phải lúc nào cũng rõ ràng. Đảm bảo rằng các trang quan trọng nhất trên trang web của bạn không bị ném ra lỗi soft 404 và khi đó bạn đã có một khởi đầu tốt.

    B. 404

    Lỗi 404 có nghĩa là Googlebot cố gắng thu thập một trang không tồn tại trên trang web của bạn. Googlebot tìm thấy các trang 404 khi các trang web khác hoặc các trang khác liên kết đến trang không tồn tại.

    Chúng có ý nghĩa gì?

    Lỗi 404 là lỗi thu thập bị hiểu lầm nhiều nhất. Cho dù đó là một SEO trung gian hay là CEO thì phản ứng phổ biến nhất là sự sợ hãi và ghê tởm về các lỗi 404.

    Google nêu rõ trong hướng dẫn của họ:

    "Nhìn chung, lỗi 404 không ảnh hưởng đến thứ hạng trang web của bạn trong Google, vì vậy bạn có thể an toàn bỏ qua chúng".

    Tôi thừa nhận rằng "bạn có thể an toàn bỏ qua chúng" là một tuyên bố gây khá nhiều hiểu lầm cho những người mới bắt đầu. Bạn không thể bỏ qua chúng nếu chúng là lỗi 404 với các trang quan trọng trên trang web của bạn.

    Để phân biệt khi nào cần bỏ qua chúng và khi nào bạn cần phải ở lại để sửa chữa, Rand đã cung cấp một số lời khuyên về 404 trong năm 2009:

    Khi đối mặt với 404s, suy nghĩ của tôi là:

    - Nhận liên kết quan trọng từ các nguồn bên ngoài (Google Webmaster Tools là công cụ tuyệt vời để làm điều này)

    - Nhận được số lượng lớn lưu lượng khách truy cập

    - Có một URL rõ ràng mà khách truy cập/liên kết tiếp cận

    Nếu đó là 404:

    Hãy làm việc chăm chỉ để đưa ra quyết định những gì sẽ đủ điều kiện để giữ lại trên trang web của bạn và số lượng nội dung cho các URL cụ thể trên trang web của bạn.

    Annie Cushing cũng thích phương pháp Rand và khuyến cáo:

    "Hai trong số các chỉ số quan trọng nhất để xem xét là backlinks để đảm bảo bạn không bị mất các liên kết có giá trị nhất và tổng số lượng trang đích trong phần mềm phân tích của bạn".

    Một điều khác không được đề cập ở trên là chiến dịch marketing offline, podcast và phương tiện truyền thông khác.

    Chúng có quan trọng hay không?

    Đây có lẽ là một trong những vấn đề khó khăn nhất và đơn giản nhất trong số tất cả các lỗi. Số lượng lớn 404 sẽ tập trung nhiều vào các trang web lớn. Lỗi 404 là cấp bách nếu các trang quan trọng trên trang web của bạn được hiển thị như là 404s. Ngược lại, như Google cho biết, nếu một trang là khá lâu và không đáp ứng được các tiêu chuẩn chất lượng, bạn có thể nhìn thấy hàng trăm lỗi trong Search Console của bạn, bạn chỉ cần bỏ qua chúng.

    Làm thế nào để sửa chữa lỗi 404?

    Nếu trang quan trọng của bạn được hiển thị như là 404 và bạn không muốn nó, có những bước sau bạn có thể làm:

    - Đảm bảo trang của bạn được xuất bản từ hệ thống quản lý nội dung của bạn và không ở chế độ draft hoặc deleted.

    - Đảm bảo lỗi 404 URL là trang chính xác và không biến đổi

    - Kiểm tra xem lỗi này xuất hiện trên phiên bản www vs non-www và phiên bản http vs https.

    Nếu trang của bạn đã bị chết, hãy làm cho chúng được sống lại. Nếu bạn không muốn trang sống, chuyển hướng 301 nó vào đúng trang.

    Làm thế nào để ngăn chặn 404s cũ hiển thị trong báo cáo thu thập của bạn

    Nếu lỗi 404 URL khá lâu, hãy để cho nó chết. Chỉ cần bỏ qua nó như Google khuyến cáo. Tuy nhiên, để ngăn chặn nó hiển thị trong báo cáo lỗi thu thập của bạn, bạn sẽ cần phải làm thêm một vài điều.

    Đó là một dấu hiệu cho thấy sức mạnh của các liên kết, Google sẽ chỉ hiển thị các lỗi 404 ở vị trí đầu tiên nếu trang web của bạn hoặc một trang web external đang liên kết đến trang 404.

    Hay nói cách khác, nếu tôi nhập vào your-website-name.com/unicorn-boogers, nó sẽ không hiển thị trong bảng điều khiển lỗi thu thập, trừ khi tôi cũng liên kết đến nó từ trang web của tôi.

    Để tìm các liên kết đến trang 404 của bạn, đi đến phần Crawl Errors > URL Errors:

    Lam the nao de khac phuc loi crawl trong google search console 11

    Sau đó, click vào URL bạn muốn fix:
    Lam the nao de khac phuc loi crawl trong google search console 12
    Tìm kiếm trang của bạn với liên kết đó:

    Lam the nao de khac phuc loi crawl trong google search console 13

    Đó là một công việc siêng năng nhưng nếu bạn thực sự muốn dừng 404s cũ hiển thị trong bảng điều khiển của bạn, bạn sẽ phải loại bỏ các liên kết đến trang đó từ tất cả các trang liên kết đến nó.

    C.Truy cập bị từ chối

    Truy cập bị từ chối có nghĩa là Googlebot không thể crawl trang. Không giống như 404, Googlebot ngăn chặn việc thu thập trang ở nơi đầu tiên.

    Điều này có nghĩa là gì?

    Lỗi truy cập bị từ chối thường chặn Googlebot thông qua các phương pháp:

    - Bạn yêu cầu người dùng phải đăng nhập để thấy một URL trên trang web của bạn, do đó Googlebot bị chặn

    - Tập tin robots.txt của bạn chặn Googlebot từ URL riêng, toàn bộ thư mục hoặc toàn bộ trang web của bạn

    - Nhà cung cấp hosting của bạn đang chặn Googlebot từ trang web của bạn hoặc máy chủ yêu cầu người dùng xác thực bằng proxy.

    Chúng có quan trọng?

    Tương tự như soft 404s và 404, nếu các trang bị chặn là rất quan trọng với Google để crawl và index, bạn nên hành động ngay lập tức.

    Nếu bạn không muốn trang này được thu thập và index, bạn có thể an toàn bỏ qua lỗi truy cập bị từ chối này.

    Làm thế nào để khắc phục?

    Để khắc phục lỗi truy cập bị từ chối, bạn sẽ cần phải loại bỏ các yếu tố đang chặn truy cập của Googlebot.

    - Loại bỏ đăng nhập từ các trang mà bạn muốn Google thu thập

    - Kiểm tra tập tin robots.txt để đảm bảo các trang được liệt kê trên đó

    - Sử dụng robots.txt để xem các cảnh báo về tập tin robots.txt của bạn và để kiểm tra URL chống lại tập tin của bạn.

    - Sử dụng plugin user-agent switcher cho trình duyệt của bạn hoặc công cụ Fetch as Google để xem làm thế nào trang web của bạn xuất hiện với Googlebot

    - Scan trang web của bạn với Screaming Frog, nó sẽ nhắc nhở bạn đăng nhập vào các trang nếu trang yêu cầu nó.

    Mặc dù không phổ biến như lỗi 404, vấn đề truy cập bị từ chối vẫn có thể gây tổn hại đến khả năng xếp hạng trang web của bạn nếu các trang không đúng bị chặn. Hãy đảm bảo rằng bạn sẽ theo dõi các lỗi này và nhanh chóng sửa chữa bất kỳ vấn đề cấp bách.

    Không được follow

    Điều này có nghĩa là gì?

    Bạn không nên nhầm lẫn với một liên kết "nofollow", lỗi “not followed” nghĩa là Google không thể follow với URL cụ thể.

    Thông thường các lỗi này là khi Google gặp phải các vấn đề với Flash, Javascript, hoặc chuyển hướng.

    Chúng quan trọng hay không?

    Nếu bạn đang đối phó với vấn đề not followed trên một URL có ưu tiên cao thì điều này là quan trọng.

    Nếu vấn đề của bạn được bắt nguồn từ các URL cũ không còn hoạt động hoặc từ các thông số mà không được index và chỉ cần thêm một tính năng, mức độ ưu tiên này là thấp hơn nhưng bạn vẫn nên phân tích chúng.

    Làm thế nào để sửa chữa?

    Google xác định xác Googlebot và công cụ tìm kiếm khác có thể gặp khó khăn khi thu thập:

    - JavaScript
    - Cookies
    - Session IDs
    - Frames
    - DHTML
    - Flash

    Sử dụng trình duyệt Lynx text hoặc công cụ Fetch as Google, sử dụng Fetch and Render. Bạn cũng có thể sử dụng Chrome add-on như User-Agent Switcher để bắt chước Googlebot khi bạn duyệt các trang.

    Đối với các vấn đề thu thập, bạn cần phải xem cách Google hiện đang xử lý thông số của bạn. Chỉ rõ những thay đổi trong công cụ URL Parameters nếu bạn muốn Google xử ly các thông số khác của bạn.

    Với vấn đề not followed liên quan đến chuyển hướng, hãy đảm bảo rằng bạn fix các vấn đề sau:

    - Kiểm tra các chuỗi chuyển hướng. Nếu có quá nhiều "bước nhảy", Google sẽ dừng follow chuỗi chuyển hướng

    - Khi có thể, cập nhật kiến trúc trang web của bạn để cho phép tất cả các trang trên trang web của bạn sẽ nhận được từ các liên kết tĩnh

    Google sử dụng nhiều chi tiết trên phần Not Followed, có rất nhiều dữ liệu có thể có sẵn trong Search Console API.

    Các công cụ khác

    - Screaming Frog SEO Spider là một công cụ tuyệt vời cho phép quét các trang web trực tiếp và tìm ra các lỗi chuyển hướng.

    - Moz Pro Site Crawl

    - Raven Tools Site Auditor

    E. Lỗi máy chủ và lỗi DNS

    Dưới lỗi URL, Google lại liệt kê các lỗi máy chủ và lỗi DNS trong báo cáo Site Errors. Cả hai lỗi có sự khác biệt trong phần lỗi URL nếu các lỗi chỉ ảnh hướng đến URL riêng biệt, không phải là trên trang web. Nếu bạn có cấu hình riêng biệt cho từng URL, chẳng hạn như minisites hoặc một cấu hình khác cho URL cụ thể trên domain của bạn, chúng có thể hiển thị ở đây.

    Bây giờ, bạn là chuyên gia về các lỗi URL, bạn có thể in ra hoặc sử dụng trên máy tính để đọc và ghi nhớ.

    Lam the nao de khac phuc loi crawl trong google search console 14

    Kết luận

    Có một số công cụ SEO có thể khiến bạn phát khóc. Không ai muốn kiểm tra từng lỗi URL nếu nó không quan trọng hoặc ngược lại, sự hoảng sợ khi nhìn thấy hàng nghìn các lỗi trên trang web của bạn.

    Với kinh nghiệm của mình, bạn sẽ biết làm thế nào để phản ứng với các lỗi đó: điều đó là quan trọng và có thể được bỏ qua một cách an toàn.

    Nếu bạn chưa có, tôi khuyến khích bạn đọc các tài liệu chính thức của Google về Search Console.

    - Webmaster Central Help Forum
    - Webmaster Central FAQs: Crawling, indexing, & ranking
    - Webmaster Central Blog
    - Search Console Help Crawl Errors report

    Search Console là một con thú dữ, vì vậy hãy đọc thêm về cách sử dụng công cụ này và kiểm tra các hướng dẫn khác:

    - The Ultimate Guide to Using Google Search Console as a Powerful SEO Tool
    - The Ultimate Guide to Google Webmaster Tools
    - Yoast Search Console series

    Google đã hào phóng ban cho chúng ta một trong những công cụ mạnh nhất để chẩn đoán các lỗi trang web. Không chỉ sửa chữa các lỗi giúp bạn để cải thiện thứ hạng mà họ còn cung cấp một trải nghiệm người dùng tốt hơn và giúp đạt được mục tiêu kinh doanh của bạn nhanh hơn.

    Ghi nguồn www.thegioiseo.com khi đăng tải lại bài viết này.
    Link: Làm thế nào để khắc phục lỗi crawl trong Google Search Console?

    nguyenhuutinh1992 thích bài này.
  2. nguyenhuutinh1992

    nguyenhuutinh1992 Top 7

    Gia nhập:
    26/9/13
    Bài viết:
    1,778
    Đã được thích:
    165
    Web:
    Em thấy tình trạng khó khắc phục nhiều nhất là bài viết bị mất, cái này nó lặp lại nhiều lần luôn dù đã chuyển hướng 301 rồi, còn những lỗi như sever thì không quan trọng lắm.
  3. trần bá thái

    trần bá thái Top 8

    Gia nhập:
    27/8/16
    Bài viết:
    294
    Đã được thích:
    39
    Nơi ở:
    nha trang
    Web:
    mình thấy lỗi hay gặp nhất là lỗi 404. thỉnh thoảng trang mình vào cũng bị thế luôn
  4. Susukem

    Susukem Top 9

    Gia nhập:
    1/10/15
    Bài viết:
    231
    Đã được thích:
    16
    Nơi ở:
    Cầu giấy hà nội
    Mình cũng vậy! toàn 404 , viết bài xóa bài là hay bị lỗi đó luôn
  5. benhxahoihcm

    benhxahoihcm Top 8

    Gia nhập:
    23/10/15
    Bài viết:
    316
    Đã được thích:
    35
    Nơi ở:
    thiet ke shop Viky Design
    Web:
    Mình thì bị lỗi url của trang đã bị xóa cứ hiện lên suốt dù đã redirect link xóa đó về trang chủ rồi
  6. Suunhi123

    Suunhi123 Top 9

    Gia nhập:
    25/5/16
    Bài viết:
    187
    Đã được thích:
    15
    Mấy lỗi 404 thì không ảnh hưởng nhiều đâu bạn ah, của mình có gần 100 lỗi mà vẫn seo lên như bình thường, các lỗi khác như 200, 500 thì mới ảnh hưởng trực tiếp đến web.
  7. devtruong450

    devtruong450 Top 10

    Gia nhập:
    29/6/16
    Bài viết:
    20
    Đã được thích:
    2
    Nơi ở:
    Hồ Chí Minh, Việt Nâm
    Các bạn luôn chỉnh chu bài viết. Em đang gặp khó khăn với các bài viết "khuyến mãi" mà đã qua. không biết sử ly sao. không biết xóa hay để hay chỉnh sửa. vì để thị kh tìm thấy không hay
    tín nguyễn thích bài này.
  8. tiwenger

    tiwenger Top 9

    Gia nhập:
    19/5/14
    Bài viết:
    210
    Đã được thích:
    8
    Nơi ở:
    http://khudothikingbay.vn/
    Web:
    tùm lum lỗi mà cách sửa thì chưa chi tiết lắm,
  9. Đạt Popeye

    Đạt Popeye Top 9

    Gia nhập:
    31/8/16
    Bài viết:
    68
    Đã được thích:
    4
    Nơi ở:
    Hà Nội
    Web:
    Mình cũng bị tương tự, chắc phải xem lại thôi chứ cứ tình trạng này web mới sống sao
  10. thienbao

    thienbao Top 9

    Gia nhập:
    24/8/15
    Bài viết:
    444
    Đã được thích:
    14
    quá hay, mình vào webmaster tool hay thấy lỗi Crawl này lắm nhưng ko biết làm thế nào, giờ có bài này thì fix ngay và luôn :D
  11. bichthuy2293

    bichthuy2293 Top 9

    Gia nhập:
    6/7/16
    Bài viết:
    50
    Đã được thích:
    3
    Web:
    Thường thì lỗi 404 là hay gặp nhất nó ảnh hưởng rất nhiều đến website. Lần trước seo mãi ko lên TOP lúc đi tìm nguyên nhân thì mới biết 1 đống lỗi 404 trong site xử lí xong lên TOP luôn :D
  12. haopro

    haopro Top 8

    Gia nhập:
    2/8/13
    Bài viết:
    378
    Đã được thích:
    27
    Web:
    mình toàn bị báo lỗi bên mảng mobile ko mà không biết cách xử lý ra sao nữa
  13. Phuongxoan_49

    Phuongxoan_49 Top 8

    Gia nhập:
    27/11/14
    Bài viết:
    535
    Đã được thích:
    66
    Nơi ở:
    Xuân Thủy, Cầu Giấy
    Web:
    Phần đại đa số người làm seo không chuyên về code, nhiều người chuyên code lại không thích seo. Nên nhiều khi khắc phục vấn đề không đồng nhất :) nên cách xử lý đôi khi không được như mong muốn
  14. linh_seo_pro

    linh_seo_pro Top 9

    Gia nhập:
    31/1/15
    Bài viết:
    389
    Đã được thích:
    17
    Web:
    sao mình làm theo hướng dẫn mà vẫn không được nhỉ? Hay phải chờ vài ngày mới được.
  15. homedykisser

    homedykisser Top 9

    Gia nhập:
    29/8/16
    Bài viết:
    96
    Đã được thích:
    11
    Bài viết rất cụ thể, để hôm nào có vụ seo nào kiếm ngàn đô thì làm bài bán, giờ kiếm vài triệu từ mấy doanh nghiệp việt nên kệ bà nó, chán chả buồn làm bài bản
  16. loptiengnhat.edu.vn

    loptiengnhat.edu.vn Top 9

    Gia nhập:
    4/7/16
    Bài viết:
    61
    Đã được thích:
    5
    Nơi ở:
    http://loptiengnhat.edu.vn/
    Web:
    mình toàn 404 hazzz.. cách khách phục cũng khá đơn giản. check lại lick đó fix bài viết, nều không được thì khóa link đó lại luôn cho lành
  17. dien thoai chat

    dien thoai chat Top 10

    Gia nhập:
    17/9/16
    Bài viết:
    21
    Đã được thích:
    8
    Nơi ở:
    Hồ Chí Minh
    Web:
    Làm theo thớt mà tùm lum quá. Mãi chả xong. Đúng là seo không đơn giản. :(
  18. phamtienpt12345

    phamtienpt12345 Top 9

    Gia nhập:
    4/1/16
    Bài viết:
    578
    Đã được thích:
    4
  19. seohaytoppp

    seohaytoppp Top 9

    Gia nhập:
    13/9/16
    Bài viết:
    61
    Đã được thích:
    8
    Web:
    Mình cũng thường bị lỗi thu thập dữ liệu, mình sữa vào phần thu thập dữ liệu tới chỗ thu thập dữ liệu check đánh dấu ok là xong.
  20. truongphuotld

    truongphuotld Top 9

    Gia nhập:
    17/1/15
    Bài viết:
    353
    Đã được thích:
    16
    trang mình fixxed hoài mà vẫn bị hoài, ko sửa triệt để được.

Nội quy khi thảo luận:

Dù bạn có cố tình spam bằng cách nào khi BQT diễn đàn phát hiện sẽ lập tức banned nick và xoá toàn bộ bài viết của bạn. Ngoài ra khi phát hiện ra Spam hãy gửi thông báo cho BQT diễn đàn. Hãy suy nghĩ trước khi hành động..!
✓ Khi muốn trả lời ai đó, bạn gõ @ cộng thêm nick diễn đàn của người đó phía sau @, giống như tag tên trên Facebook.
✓ Yêu cầu khi bình luận, bạn phải gõ chữ rõ ràng, không viết tắt, gõ tiếng Việt đầy đủ dấu câu.
✓ Nên dùng font chữ mặc định của diễn đàn, không tô màu lòe loẹt hay dùng size chữ quá lớn khi bình luận.
✓ Bài viết, comment... không được phép quảng cáo dịch vụ, rao vặt, pr... Loại trừ ở chuyên mục Rao vặt đã cho phép.
✓ Nghiêm cấm các chủ đề dạng: Cứu em với, help me, giật tít, câu view... dưới mọi hình thức.
✓ Tất cả các thành viên tham gia diễn đàn cần đọc kỹ Nội quy chung và nghiêm túc tuân thủ.


Chia sẻ trang này

Đang tải...