1. Hiện tại có một số member mạo danh BQT để giao dịch trên diễn đàn và đã LỪA ĐẢO khá nhiều tại chuyên mục Adwords... Mọi người cảnh giác và đọc bài: Giới thiệu giao dịch đảm bảo bởi @Admin

Robots.txt cho nhiều tên miền

Thảo luận trong 'Thủ thuật Seo - Seo tips' bắt đầu bởi thuongnm, 1/12/10.

Lượt xem: 3,914
  1. thuongnm

    thuongnm HELU Team

    Gia nhập:
    24/4/10
    Bài viết:
    136
    Đã được thích:
    100
    Nơi ở:
    Lý thái tổ
    Như các bạn đã biết, các Doanh nghiệp thường hay mua nhiều tên miền cho website của họ. Ở đây tôi không thảo luận về lý do tại sao họ lại làm như vậy, nhưng thực tế rõ ràng là có rất nhiều tên miền trỏ về cùng 1 hosting (1 website có nhiều tên miền khác nhau). Thế thì xét theo nguyên tắc của SEO, chúng ta sẽ có nhiều website và những website này trùng lặp nội dung.


    Tôi được 1 số bạn đặt vấn đề cụ thể như sau:
    - Họ có 3 domain: abc.com | def.com | xyz.com
    - 3 domain này cùng 1 hosting
    - Họ chọn abc.com là tên miền chính, họ không muốn spider index các URL xuất phát từ 2 tên miền còn lại


    Oh, quá dễ, dùng robots.txt chặn (disallow) là xong.
    Nhưng khổ nỗi, robots.txt không phân biệt được tên miền, nên chúng ta không thể


    - Disallow: /def.com
    - Disallow: /zyz.com

    Làm sao?

    Và đây là giải pháp. Chúng ta chuẩn bị 3 file robots.txt tương ứng cho từng tên miền và kiểm tra nếu request của user xuất phát từ tên miền nào thì “gọi” file robots.txt cho tên miền đó.


    robots_abc.txt <– file robots.txt cho tên miền abc.com
    User-agent: *
    Disallow: /administrator/
    Disallow: /cache/
    Disallow: /components/
    Disallow: /images/
    Disallow: /includes/
    Disallow: /installation/
    Disallow: /language/
    Disallow: /libraries/

    robots_def.txt <– file robots.txt cho tên miền def.com
    User-agent: *
    Disallow: /

    robots_xyz.txt <– file robots.txt cho tên miền xyz.com
    User-agent: *
    Disallow: /

    Nhiệm vụ còn lại của chúng ta là viết lại đường dẫn file robots.txt tương ứng cho từng tên miền tại file .htaccess


    RewriteCond %{HTTP_HOST} ^abc.com$ [NC]
    RewriteRule ^robots\.txt$ robots_abc.txt [L]
    RewriteCond %{HTTP_HOST} ^def.com$ [NC]
    RewriteRule ^robots\.txt$ robots_def.txt [L]
    RewriteCond %{HTTP_HOST} ^xyz.com$ [NC]
    RewriteRule ^robots\.txt$ robots_xyz.txt [L]

    Đến đây thì các bạn an tâm, spider chỉ có thể index như chỉ dẫn trong file robots_abc.txt, còn với những URL xuất phát từ tên miền def.com và xyz.com sẽ không bao giờ được index nên việc trùng lặp nội dung không thể xảy ra.

    Link gốc: Robots.txt cho nhiều tên miền

  2. toanvoc

    toanvoc Top 7

    Gia nhập:
    18/4/10
    Bài viết:
    804
    Đã được thích:
    2,480
    Giải pháp này khá tốt cho cách bạn đang sử dụng nhiều tên cho 1 website mà không muốn bị duplicate content...Cảm ơn thuongnm đã chia sẻ
  3. thanchet

    thanchet Top 9

    Gia nhập:
    18/10/10
    Bài viết:
    248
    Đã được thích:
    5
    Web:
    Bài viết khá hay, giờ mình mới biết, vì trước mình cũng không để ý đến vấn đề này, joint gần 10 domain vào 1 domain chính ... hichic ! Thank you thuongnm nhá !
  4. nuochoa4u

    nuochoa4u Seo Newbie

    Gia nhập:
    7/7/10
    Bài viết:
    22
    Đã được thích:
    0
    Trường hợp này mình thường xử lý bằng code
    vd: mình có 2 domain "mayanh.com" và "maychuphinh.com"
    mình xử lý như sau:

    define('DOMAIN_NAME', $_SERVER['SERVER_NAME']);

    switch (DOMAIN_NAME)
    {
    case 'mayanh.com':
    case 'www.mayanh.com':
    define('DOMAIN_NAME_SEO', 'MayAnh.com');
    define('KEY_WORD_SEO', 'may anh');
    define('KEY_WORD_SEO_VN', 'máy ảnh');
    break;
    case 'maychuphinh.com':
    case 'www.maychuphinh.com':
    define('DOMAIN_NAME_SEO', 'MayChupHinh.com');
    define('KEY_WORD_SEO', 'may chup hinh');
    define('KEY_WORD_SEO_VN', 'máy chụp hình');
    break;
    //v...v....
    }

    Trong template hình sẽ nhét DOMAIN_NAME_SEO, KEY_WORD_SEO, KEY_WORD_SEO_VN vào các phần meta title, discription, keyword
    Ngoài ra trong phần content của site mình sẽ nhét KEY_WORD_SEO, KEY_WORD_SEO_VN vào attribute title của thẻ a, alt của thẻ img v...v...
    Trước khi post 1 bài viết trong site mình sẽ xử lý replace tất cả các từ "máy ảnh" "máy chụp hình" bằng KEY_WORD_SEO_VN
    v....v....
    Cứ với if, else trong code bạn có thể có 2 site khác nhau về cả template, logo, banner, css, menu, resource path, sitemap v....v.
    Cuối cùng mình có 2 site không hề duplicate hoàn toàn dynamic, site mayanh.com seo cho kw "may anh", site maychuphinh.com seo cho kw "may chup hinh"

    Ý kiến chủ quan của mình là 2 site sẽ ko bị duplicate, mong nhận những ý kiến đóng góp của mọi người về cách này.
    Thân chào.
  5. vavietnam

    vavietnam Cựu Administrator

    Gia nhập:
    18/4/10
    Bài viết:
    145
    Đã được thích:
    22
    Trường hợp này là chỉ 1 file robots.txt:

    .htaccess
    Mã:
    RewriteEngine On
    RewriteRule ^robots.txt$ robots.php [L]
    
    robots.php
    PHP:
    <php?
    $site $_SERVER['SERVER_NAME'];
    header("Content-Type:text/plain");
    if(
    $site=="www.thegioiseo.com"){
    echo <<<EOF
    User-agent: *
    Disallow: /seo/
    EOF

    elseif(
    $site=="*******.us"){
    echo <<<EOF
    User-agent: *
    Disallow: /***/
    Disallow: /video/
    EOF
    }
    else {
    echo <<<EOF
    User-agent: *
    EOF
    }
    ?>
  6. ganhat_TGS

    ganhat_TGS Top 9

    Gia nhập:
    12/11/10
    Bài viết:
    292
    Đã được thích:
    9
    Hơ hơ. Lại có cả Lx dot us nữa kìa. Pác Vavietnam này thiệt là...
  7. SEOnoob

    SEOnoob Top 10

    Gia nhập:
    28/6/10
    Bài viết:
    14
    Đã được thích:
    1
    Công phu thế. mà tạo chi nhiều domain rồi lại mất công thế? Cứ nhét dòng 301 redirect trong htaccess lên 2 domain phụ hoặc vào cpanel 301 cho nó lành :D
  8. giaiphaplienket.com

    giaiphaplienket.com Cựu Administrator

    Gia nhập:
    7/4/10
    Bài viết:
    401
    Đã được thích:
    164
    Nó dính đến thương hiệu nữa nên họ không làm redirect
  9. trungbatigol

    trungbatigol Top 8

    Gia nhập:
    3/12/10
    Bài viết:
    739
    Đã được thích:
    52
    Web:
    DẠ, em quan tâm tới vấn đề này nhưng là asp.net ạ :(
  10. sonoko125

    sonoko125 Top 9

    Gia nhập:
    27/10/10
    Bài viết:
    53
    Đã được thích:
    3
    Nhìn cm của bác em mới thấy , ví dụ nhạy cảm quá . Thanks vì bài viết rất bổ ích :D
  11. VatPhamPhongThuy.com

    VatPhamPhongThuy.com Top 9

    Gia nhập:
    8/11/10
    Bài viết:
    30
    Đã được thích:
    1
    Nơi ở:
    Vật Phẩm Phong Thủy
    Cách nhanh lẹ gọn là: 301 redirect trong htaccess, còn sợ ảnh hưởng đến thương hiệu mà không redirect như bác giaiphaplienket.com nói thì xài iframe thôi, đơn giản :D

Nội quy khi thảo luận:

Dù bạn có cố tình spam bằng cách nào khi BQT diễn đàn phát hiện sẽ lập tức banned nick và xoá toàn bộ bài viết của bạn. Ngoài ra khi phát hiện ra Spam hãy gửi thông báo cho BQT diễn đàn. Hãy suy nghĩ trước khi hành động..!
✓ Khi muốn trả lời ai đó, bạn gõ @ cộng thêm nick diễn đàn của người đó phía sau @, giống như tag tên trên Facebook.
✓ Yêu cầu khi bình luận, bạn phải gõ chữ rõ ràng, không viết tắt, gõ tiếng Việt đầy đủ dấu câu.
✓ Nên dùng font chữ mặc định của diễn đàn, không tô màu lòe loẹt hay dùng size chữ quá lớn khi bình luận.
✓ Bài viết, comment... không được phép quảng cáo dịch vụ, rao vặt, pr... Loại trừ ở chuyên mục Rao vặt đã cho phép.
✓ Nghiêm cấm các chủ đề dạng: Cứu em với, help me, giật tít, câu view... dưới mọi hình thức.
✓ Tất cả các thành viên tham gia diễn đàn cần đọc kỹ Nội quy chung và nghiêm túc tuân thủ.


Chia sẻ trang này

Đang tải...