1. Hiện tại có một số member mạo danh BQT để giao dịch trên diễn đàn và đã LỪA ĐẢO khá nhiều tại chuyên mục Adwords... Mọi người cảnh giác và đọc bài: Giới thiệu giao dịch đảm bảo bởi @Admin

Định Nghĩa Duplicate Content Và Các Cách Khắc Phục Lỗi Hiệu Quả Nhất.

Thảo luận trong 'Thủ thuật Seo - Seo tips' bắt đầu bởi vietnamurl1, 9/1/12.

Lượt xem: 2,750
  1. vietnamurl1

    vietnamurl1 Cựu mod

    Gia nhập:
    14/6/10
    Bài viết:
    1,520
    Đã được thích:
    145
    Nơi ở:
    Bắc Ninh
    Trong thực tế có rất nhiều trang web đang mắc lỗi trùng lặp nội dung. Sự cạnh tranh là rất lớn và kiến thức thì có hạn đôi khi khiến chúng ta phải đi sao chép lại các nội dung để thu hút được người truy cập. Tuy nhiên sau khi google tung ra Panda đặc biệt trong đợt cập nhật gần đây đã khiến cho nhiều website trùng lặp nội dung bị phạt. Điều này có thể gây ảnh hưởng đến kết quả seo.

    Với những trang web bị phạt sẽ không tránh được việc đặt câu hỏi vì sao và làm thế nào để giải quyết vấn đề duplicate hiệu quả nhất ?

    I) Vậy nội dung trùng lặp là gì ?

    [​IMG]

    Duplicate content bạn loại bỏ không ^^.

    Nói ra thì hơi thừa mình xin tóm gọn lại : Nội dung trùng lặp là những nội dung xuất hiện trên hai hay nhiều địa chỉ trang web hoặc trên các lĩnh vực giống nhau. Ngoài ra nội dung mà tương tự về ý cũng sẽ được xếp vào danh sách nội dung trùng lặp.
    Cụ thể thì mình chia làm 3 loại :

    • Bản sao Gốc : đây là dạng website có nội dung trùng lặp hoàn toàn, giống hệt với một trang web khác. Sự khác biệt giữa hai trang chỉ là đường URL.
    • Gần giống với bản gốc : Đây là một dạng biến tấu về nội dung . Nó gần giống bản gốc chỉ có sự khác biệt rất nhỏ về một số ngôn ngữ , một đoạn văn, hình ảnh hay kể cả thay đổi xáo trộn các cụm văn.
    • Cross Domain : Dạng giống một phần của nội dung. Cách này thường xảy ra khi một nội dung được chia sẻ trên 2 trang web khác nhau với mỗi trang web là một phần nội dung gốc. Nên nó có thể là dạng bản gốc hoặc dạng gần giống với bản gốc.

    II) Tại sao trùng lặp nội dung lại bị google panda phạt ?

    Theo quy định google, nội dung trùng lặp rõ nguồn gốc tác giả không mang tính lừa đảo không bị xếp vào nội dung xấu. Sau đây là một số nội dung trùng lặp không xấu :

    Tại diễn đàn, blog website : khi tạo ra 2 đoạn nội dung gần giống nhau, một nội dung là nguyên bản, một nội dung được rút gọn để hướng đến cho người sử dụng trên các phương tiện khác như mobile…
    Lưu trữ các thông tin hiển thị và liên kết thông qua nhiều URL , thông tin tốt cho người dùng.
    Chỉ in duy nhất một phiên bản của nội dung trên trang đó…
    Tuy nhiên đó chỉ là một số trang cơ bản, nhiều webmaster trong nỗ lực để nâng cao thứ hạng website , tăng lượng truy cập đã cố tình sử dụng các nội dung trùng lặp. Cách làm này không tốt và không thể tạo sự thân thiện với người dùng khi khách hàng thường xuyên gặp những bài trùng lặp như vậy.
    Trong phiên bản gần đây của google panda , việc đánh giá nội dung trùng lặp này khá là quan trọng. Nếu trang web của bạn bị google panda đánh giá là không tốt , các thuật toán của nó sẽ tác động đến website của bạn, làm cho trang trùng lặp mất điểm thậm chí bị phạt mất nội dung, thứ hạng trên SERP.

    III ) Những phương pháp giúp bạn có thể sửa lỗi duplicate content một cách hiệu quả

    Nếu bạn muốn khách hàng của mình luôn hài lòng với những thông tin mà họ có thể tìm được trên website hãy đảm bảo chỉnh sửa các lỗi duplicate content xấu.

    1) 404 (Not Found)

    Nếu bạn cảm thấy nội dung dung trùng lặp thực sự không đem lại lợi ích cho người tìm kiếm hay nó không đem lại cho bạn những liên kết hay traffic cách đơn giản là cứ xóa nó đi và để lỗi 404.

    2) Redirect 301

    Khi sử dụng chuyển hướng 301 đồng nghĩa với việc bạn thông báo cho cả người dùng và bọ tìm kiếm rằng trang web mà họ trang truy cập đã chuyển đến một địa chỉ khác. Và công cụ này sẽ chuyển hướng người dùng đến một url mới. Đây là một cách làm tốt nếu nội dung trùng lặp đó nằm trên URL gắn thẻ canonical.

    3) Robot.txt

    Đây là phương pháp được dùng khi bạn muốn nội dung trùng lặp hiển thị với người dùng nhưng ngăn chặn không cho bọ tìm kiếm thu thập thông tin. Điều này được thực hiện khá đơn giản. Tuy nhiên nó chỉ hiệu quả với các trang chưa index , còn với các trang đã được index thì nó vô tác dụng.

    4) Meta Robots Tag

    Cách này được áp dụng nếu bạn muốn điều hướng khả năng tìm kiếm thông tin của bots tại trang. Nó sẽ thông báo cho bots tìm kiếm không index trang này hoặc các liên kết trong đó. Cái này được khá nhiều công ty SEO áp dụng và làm cho trang thân thiện hơn với search engine so với sử dụng Robot.txt

    5) Rel=canonical

    “Rel-Ca nàynonical” hoặc là “Canonical Tag” là cách làm giúp webmaster có thể tạo ra canonical cho bất kỳ trang nào. Vì vậy, khi bots tìm kiếm thu thập thông tin trên một trang có gắn thẻ canonical nó sẽ hiểu và loại bỏ nội dung trùng lặp trên URL đó.

    6) Google URL Removal

    Cách làm này theo tôi là phương pháp cuối cùng nếu phải thực hiện việc xóa bỏ các nội dung trùng lặp. Nó được sử dụng trong google webmaster tool. Để làm được bạn làm theo các bước sau : Vào google webmaster tool rồi Click vào “Site Configuration” => click tiếp “Crawler Access” . Sau bước này bạn sẽ thấy hiển thị ra 3 tab. Hãy click vào cái thứ 3 “Remove URL” . Bác nào hay sử dụng webmaster tool sẽ rất rõ.
    Tuy nhiên bạn sẽ cần làm một số việc trước để có thể thực hiện xóa là với trang cần xóa bạn cần 404, Robots.txt blog hay thẻ meta Noindex.

    Trên đây là bài viết theo ý kiến riêng. Có thể nó đúng hoặc sai tại một số điểm, các bạn có thể bổ sung ý kiến để bài viết hoàn thiện hơn nhé. Thân.

    Chia sẻ bài viết vui lòng nghi rõ nguồn : www.vietnamseo.org

  2. thietbibaotrom.net

    thietbibaotrom.net Top 9

    Gia nhập:
    22/8/11
    Bài viết:
    142
    Đã được thích:
    8
    Web:
    Cảm ơn nhiều vì bài viết khá chi tiết của bạn.
  3. quyen.hong

    quyen.hong Top 9

    Gia nhập:
    26/1/11
    Bài viết:
    307
    Đã được thích:
    21
    Web:
    Cái vụ nội dung trùng lặp này mình vẫn thấy gg nó chưa phạt nặng lắm, lý do mình nói như thế là vì, mình có 30 cái site, cùng 1 nội dung, có thể nói, chỉ khác cái tên miền, và URL thì mình thay đổi cho mỗi site nó khác đi - thêm một vài ký tự khác biệt các url của các site.
    và mình thấy thì site mình vẫn lên bình thường, khi các backlink tăng đều, index vẫn tốt,

    còn vụ copypast thì cuối bài viết nên để từ (source, hoặc nguồn) để tôn trọng tác giả!

    + về việc thay đổi, biến tấu, để trùng lặp nội dung thì điều này hoàn toàn có thể, mà gg t nghĩ nó chưa giỏi đến mức so sanh cả 1 đoạn văn dài để biết được là copy đâu!

    nó chỉ so sanh cái title vs lại các thẻ meta thôi! nội dung thì lọc tìm các key thui! @@!

    Nếu tối ưu tốt onpage thì không cần phải quan tâm đến nội dung nó có bị copy hay ko đâu!


    Ý kiên trên của mình, chắc cũng có phần sai, phần đúng, anh em đọc tham khảo thôi! chứ mình thì mình đã làm như thế , ví dụ cho các bác 3 site giống hệt nhau nội dung:

    + http://www.relaxindochina.com
    + http://www.vietnamtourism.pro
    + http://www.vietnamtourhotels.com

    Các bác cứ check nhé!
  4. xulynuoc

    xulynuoc Top 9

    Gia nhập:
    10/5/11
    Bài viết:
    84
    Đã được thích:
    2
    Web:
    Mình nghỉ Duplicate Content là vấn đề gây tranh cải, site A copy của site B nhưng chưa chắc thứ hạng(tính riêng trang đó) của site A thấp hơn. Và 1 ví dụ về Duplicate Content giữa 2 site mua bán điện thoại di động, tất nhiên những thông số kỹ thuật sẽ là trùng nhau.
  5. lananhplus

    lananhplus Top 9

    Gia nhập:
    7/1/11
    Bài viết:
    92
    Đã được thích:
    4
    Theo quyen.hong mình cũng từng thấy có nhiều site nội dung copy từ các site khác nhưng vẫn PR và keyword vẫn lên được. Nhưng theo ý kiến cá nhân mình thì nên đề phòng sớm. Không sớm thì muộn vấn đề này sẽ xảy đến.
  6. BabyWolf

    BabyWolf SEO vietsol.net

    Gia nhập:
    10/7/10
    Bài viết:
    698
    Đã được thích:
    119
    Nơi ở:
    TP.HCM
    Web:
    @lananhplus: Việc site khác copy nội dung mà vẫn rank cao là vì còn rất nhiều yếu tố tương tác khác. Đừng bao giờ chỉ dựa vào một tiêu chí khi nói về thứ hạng. :)

    @quyen.hong: Vấn đề copy nội dung và việc tìm ra nơi đâu là bản gốc quả là không phải dễ đối với Google. Đặc biệt là đối với tình trạng copy mà không dẫn nguồn thậm chí cũng không để backlinks. Thủ thuật để chống copy nội dung thì cũng có nhiều cách, nhưng chống làm sao mà vẫn giữ được thứ hạng cũng là cả một vấn đề. Google sẽ không phạt nặng mà chỉ hạ thấp giá trị nội dung đó thôi.
  7. vietnamurl1

    vietnamurl1 Cựu mod

    Gia nhập:
    14/6/10
    Bài viết:
    1,520
    Đã được thích:
    145
    Nơi ở:
    Bắc Ninh
    @Quyen Hong + Lananhplus : Google không thể phạt nội dung trùng lặp tại các site khác nhau nếu tác giả của nội dung đó không khiếu kiện. Thuật toán của google đã được cải thiện rất nhiều vì vậy những nội dung post lần đầu tiên sẽ không bị tụt sau những trang post lại như trước đây.
    Một trường hợp mình gặp sau khi coppy nội dung và sau khi bị report google đã bị phạt tụt hạng site coppy. Vì vậy nên cẩn thận vẫn hơn là việc coppy rồi ghi tên mình là tác giả phải không nào . ;)
    Ở VN thì rất nhiều site coppy tuy nhiên chưa bị khiếu kiện lên Google nhiều như ở nước ngoài mà vãn chỉ mang tính nói miệng nhiều. Vì vậy việc bị phạt là ít hơn.
  8. songanh999

    songanh999 Top 9

    Gia nhập:
    15/11/12
    Bài viết:
    37
    Đã được thích:
    1
    Web:
    Các webisite dùng VBB thường rất bị duplicate content. Điều này VBB chưa tối ưu dc seo
  9. thienduongcacanh

    thienduongcacanh Top 9

    Gia nhập:
    11/6/13
    Bài viết:
    68
    Đã được thích:
    5
    Mình cũng đang nhức đầu với vbb vê cái vụ này, nhờ các cao thủ hướng dẫn cách khắc phục trùng lặp dạng phân trang cho vbb như thế này
    HTML:
    http://thienduongcacanh.com/forums/mua-ban-cac-loai-ca-khac/
    http://thienduongcacanh.com/forums/mua-ban-cac-loai-ca-khac/page-2
    http://thienduongcacanh.com/forums/mua-ban-cac-loai-ca-khac/page-3
    Khác nhau chỗ Page-1,page-2,page-3

    Link page2 và page 3 được cho là trùng lặp title với link gốc này:
    http://thienduongcacanh.com/forums/mua-ban-cac-loai-ca-khac/
    Last edited: 19/12/14
  10. gameboom

    gameboom Seo Newbie

    Gia nhập:
    11/7/13
    Bài viết:
    11
    Đã được thích:
    1
    Thật ra nội dung chỉ cần thay đối 1 tí là được

Nội quy khi thảo luận:

Dù bạn có cố tình spam bằng cách nào khi BQT diễn đàn phát hiện sẽ lập tức banned nick và xoá toàn bộ bài viết của bạn. Ngoài ra khi phát hiện ra Spam hãy gửi thông báo cho BQT diễn đàn. Hãy suy nghĩ trước khi hành động..!
✓ Khi muốn trả lời ai đó, bạn gõ @ cộng thêm nick diễn đàn của người đó phía sau @, giống như tag tên trên Facebook.
✓ Yêu cầu khi bình luận, bạn phải gõ chữ rõ ràng, không viết tắt, gõ tiếng Việt đầy đủ dấu câu.
✓ Nên dùng font chữ mặc định của diễn đàn, không tô màu lòe loẹt hay dùng size chữ quá lớn khi bình luận.
✓ Bài viết, comment... không được phép quảng cáo dịch vụ, rao vặt, pr... Loại trừ ở chuyên mục Rao vặt đã cho phép.
✓ Nghiêm cấm các chủ đề dạng: Cứu em với, help me, giật tít, câu view... dưới mọi hình thức.
✓ Tất cả các thành viên tham gia diễn đàn cần đọc kỹ Nội quy chung và nghiêm túc tuân thủ.


Chia sẻ trang này

Đang tải...