1. Hiện tại có một số member mạo danh BQT để giao dịch trên diễn đàn và đã LỪA ĐẢO khá nhiều tại chuyên mục Adwords... Mọi người cảnh giác và đọc bài: Giới thiệu giao dịch đảm bảo bởi @Admin

Định nghĩa đơn giản về thuật ngữ LDA

Thảo luận trong 'Thuật ngữ Seo - Seo glossary' bắt đầu bởi thegioiseo, 16/10/13.

Lượt xem: 6,021
  1. thegioiseo

    thegioiseo Điều Hành Viên

    Gia nhập:
    22/5/11
    Bài viết:
    1,206
    Đã được thích:
    2,687
    Có thể bạn đã nghe qua "phân tích ngữ nghĩa", "phân tích ngữ nghĩa ẩn" hoặc "Phân phối Dirichlet ẩn" (Đều gọi tắt là LDA) trong các cuộc nói chuyện của chuyên gia SEO hay SEO newbies, những người muốn thể hiện sự hiểu biết của bản thân. Đây là một chủ đề phức tạp mà hiện chưa có tài liệu SEO nào chính thức nói về nó. Dưới đây sẽ giải thích đơn giản về chủ đề này:

    Phân phối Dirichlet ẩn là mẫu dùng để xác định ý nghĩa của một từ hoặc một tài liệu dựa vào ngữ cảnh xung quanh.

    Đơn giản phải không? Nhưng phức tạp ở chỗ chúng ta không hiểu cách Google sử dụng LDA này trong các thuật toán của nó như thế nào.

    Làm sao Google biết được chúng ta muốn gì?

    Để biết được chính xác ý định của người dùng, SE phải biết ngữ cảnh mà người dùng đang tìm kiếm. Ví dụ Ice (cửa hàng vàng bạc đá quý) và ice (dạng vật chất được cấu tạo bởi 2 nguyên tử hydro và một nguyên tử oxy) là 2 truy vấn hoàn toàn khác nhau, và có thể bạn sẽ bực mình khi cái mà bạn đang muốn tìm cách làm tan chay hoàn toàn một khối băng chứ không phải hình ảnh của mấy chiếc vòng đeo tay hay đôi bông tai vàng chóe.

    [​IMG]
    Link ảnh ice

    Vậy làm thế nào để Google phân biệt được? Bằng cách xem xét các từ ngữ xuất hiện cùng từ khóa, SE có thể suy luận ra ý nghĩa chính xác của từ khóa đang tìm kiếm. Ví dụ khi “ice" xuất hiện cùng các như chuông, quà tặng, Valentine, v.v… thì SE có thể suy luận rằng khách hàng đang muốn tìm cửa hàng đồ trang sức hay cái gì đó tương tự. Nhưng nếu “ice” xuất hiện cùng các từ như đông lạnh, phía bắc, nhà bếp, nó sẽ thiên về các kết quả liên quan đến nước .

    Nếu bạn chỉ cần tìm hiểu thế này là đủ thì hãy xuống dưới, bấm tweet cho bài viết này hoặc điền email đăng ký nhận những bài viết hay khác. Nếu bạn thực sự muốn hiểu tường tận về LDA, mời bạn đọc tiếp.

    Chi tiết về Phân phối ẩn LDA

    LDA hoạt động dựa trên giả định xác suất. Thông qua máy học tập, một chương trình có thể tổng hợp các từ và ý nghĩa của chúng dựa vào ngữ cảnh xung quanh. Sau đây là một ví dụ:

    Michael Jordan là một trong những nhà nghiên cứu LDA hàng đầu. Khi nghe đến cái tên này bạn sẽ nghĩ ngay đến cầu thủ bóng rổ Michael Jordan phải không. Google cũng vậy. Tất cả kết quả trả về là cầu thủ bóng rổ Michael Jordan cùng với các từ liên quan như bóng rổ, thể thao, Nike, v.v… Tuyệt nhiên không một kết quả nào trả về trang nói về vị học giả Michael Jordan. Trừ khi thêm vào một từ nhận diện như máy học tập, nhà nghiên cứu hay trí tuệ nhân tạo.

    [​IMG]
    Michael Jordan basketball player

    Giả định rằng chủ đề của một tài liệu và nội dung của nó liên quan mật thiết với nhau. Các thuật toán thu thập dữ liệu liên quan đến từ khóa tìm kiếm và ngữ cảnh xuất hiện của nó, khi đó kết quả trả về sẽ phù hợp hơn. Kết quả của truy vấn “Michael Jordan” là các kết quả liên quan đến môn bóng rổ nếu không có các từ nhận diện như “nhà nghiên cứu”, làm thay đổi ngữ nghĩa của từ khóa này.

    Tại sao mật độ từ khoá không có tác dụng

    Thuật toán sẽ nhận dạng, xử lý và “gán” nghĩa cho từ, cụm từ khóa đang tìm kiếm giúp SE trả về các kết quả chính xác hơn. Điều này cũng có nghĩa là kết quả không nhất thiết phải chính xác từng từ trong truy vấn của người tìm kiếm.

    Bởi vì "Michael Jordan " thường xuất hiện cùng với các từ liên quan đến bóng rổ, cho nên khi người ta tìm kiếm bằng cái tên này, nó sẽ trả về kết quả là cầu thủ bóng rổ Michael Jordan hơn là nhà nghiên cứu trùng tên, mặc dù Michael Jordan là một nhà nghiên cứu có tầm ảnh hưởng lớn trong lĩnh vực thống kê .

    Tiếp tục ví dụ, tìm kiếm bằng cụm từ "số liệu thống kê Michael Jordan ", kết quả trả về là một trang có tiêu đề "Michael Jordan thống kê số liệu nghề nghiệp", cho thấy ý định kết hợp ở mặt bên của Google.

    Đây chính là một trong những lý do tại sao mật độ từ khóa không còn tác dụng. Nhồi nhét hàng tá từ khóa dù có chính xác với truy vấn đến đâu cũng không tốt, vì SE có thể suy ra ý nghĩa của các truy vấn tìm kiếm mà không cần dựa vào nội dung bài viết. Và bởi vì SE có thể giải thích (ở một mức độ nhất định) ý nghĩa của cụm từ để phù hợp với mục đích cơ bản. Hơn nữa, SE có thể mở rộng phân tích chất lượng cả bài viết, nếu bài viết bị nhồi nhét từ khóa một cách gượng gạo, không tự nhiên, thì bài viết đó chắc chắn sẽ không có thứ hạng cao trong bảng xếp hạng.

    Điều này cũng có nghĩa là trật tự sắp xếp hay từ loại của từ trong tìm kiếm cũng không ảnh hưởng nhiều đến kết quả. Tìm kiếm "Michael Jordan" và "Jordan Michael" đều trả lại kết quả tương tự. Google biết những gì người dùng đang tìm kiếm, và trả về các kết quả phù hợp nhất cho câu hỏi của họ , hơn là trả về chính xác các từ trong truy vấn tìm kiếm.

    Nhưng cũng phải thừa nhận rằng, những đoạn văn bản chính xác với truy vấn tìm kiếm vẫn được ưu tiên, hay những tên miền trùng với truy vấn vẫn thu hút người dùng vào xem nhiều hơn.Phân phối Dirichlet ẩn LDA là một bước nhay vọt trong phân tích ngữ nghĩa, bộ máy có khả năng “thấu hiểu” tốt ý định của người dùng, tránh những nội dung đáp ứng các truy vấn một cách khô khan.

    Vì vậy, đừng do dự khi không biết nên viết vào ô tìm kiếm "bán bóng đèn huỳnh quang" hay "bóng đèn huỳnh quang bán", cứ thoải mái viết, Google “hiểu những điều bạn muốn”.

    Phân phối Dirichlet ẩn không giả quyết mọi vấn đề

    Bạn có thể tưởng tượng kết quả khi SE đoán sai ý định của người dùng hoặc do cách dùng từ quá phức tạp. Những nhà văn thích chơi chữ luôn là thử thách đối với SE.

    Một bài viết về ban nhạc Rolling Stones nhưng lại giới thiệu về nhóm bằng những từ ngữ ẩn dụ như những viên “đá quý”, sáng loáng, không bám bụi rong rêu. SE có lẽ sẽ phải mất thời gian khá lâu mới có thể xác định được nội dung chính xác của bài biết này, do sự đa dạng nghĩa của các từ mà tác giả dùng trong bài viết. Đây chỉ là một ví dụ điển hình, và tôi cũng không chắc chắn liệu SE có phân biệt được ý nghĩa của cụm từ này (Rolling stones) trong bài viết kia không, nhưng lý thuyết là vậy.

    Ngoài ra bạn có thể tham khảo thêm bài viết: LDA là gì? Khám phá bí mật LDA trong tối ưu hóa onpage? và bạn, bạn nghĩ như thế nào? Bạn muốn biết thêm gì về LDA nữa không? Cứ thoải mái đưa ra bình luận, ý kiến hoặc thắc mắc nhé!

    - Bài viết của tác giả Mitch Monsen (whitefireseo).
    - Ghi rõ nguồn www.thegioiseo.com khi đăng lại bài viết này.

    Iron Man thích bài này.
  2. justlife84

    justlife84 Top 9

    Gia nhập:
    31/8/12
    Bài viết:
    241
    Đã được thích:
    8
    Với mình định nghĩa này là hoàn toàn mới. :)
  3. Iron Man

    Iron Man Seo Newbie

    Gia nhập:
    23/5/13
    Bài viết:
    7
    Đã được thích:
    0
    Đọc không hiểu được gì mới đau chứ :|
  4. ngonhaidang2013

    ngonhaidang2013 Top 9

    Gia nhập:
    1/10/13
    Bài viết:
    36
    Đã được thích:
    2
    Hết thuật toán rồi giờ đến thuật ngữ. Nhìn thấy mà phát ngán. Ngày càng khó khăn phức tạp, xem các trang web không ra gì cả
  5. hoaxumi89

    hoaxumi89 Top 9

    Gia nhập:
    2/7/13
    Bài viết:
    126
    Đã được thích:
    17
    Web:
    thuật ngữ thật sự rất mới vwois mình. đọc đi đọc lại 3 lần vẫn chưa hiểu hết được bản chất và ứng dụng của nó :(
  6. hanh92

    hanh92 Seo Newbie

    Gia nhập:
    21/7/16
    Bài viết:
    10
    Đã được thích:
    0
    qua bài viết này nó đã làm thay đổi khái niệm ve thuật ngữ LDA mà minh từng biết . Cảm ơn bạn đã chia sẻ
  7. dieuhoa

    dieuhoa Top 9

    Gia nhập:
    12/9/15
    Bài viết:
    291
    Đã được thích:
    19
    bài viết của bạn khó hiểu quá
  8. huutrienlh12345

    huutrienlh12345 Top 9

    Gia nhập:
    12/2/17
    Bài viết:
    145
    Đã được thích:
    12
    bài viết này giúp ích cho mình rất nhiều
  9. tulanh1

    tulanh1 Top 9

    Gia nhập:
    7/10/15
    Bài viết:
    79
    Đã được thích:
    4
    khó hiểu về cách làm seo của bạn lắm bạn à
  10. devondale

    devondale Top 8

    Gia nhập:
    13/3/17
    Bài viết:
    120
    Đã được thích:
    29
    Web:
    Giờ ăn giấc ngủ, thích làm gì em nghxi google nó biết cả, mình làm gì nó cũng theo dõi hết thế nên quảng cáo của nó mới chính xác hơn được
  11. seotop102

    seotop102 Top 9

    Gia nhập:
    15/1/17
    Bài viết:
    212
    Đã được thích:
    11
    định nghĩa về lda thật là đơn giản
  12. nhatlang

    nhatlang Top 9

    Gia nhập:
    29/8/15
    Bài viết:
    433
    Đã được thích:
    18
    bjo mình mới hiểu về thuật ngữ lda

Nội quy khi thảo luận:

Dù bạn có cố tình spam bằng cách nào khi BQT diễn đàn phát hiện sẽ lập tức banned nick và xoá toàn bộ bài viết của bạn. Ngoài ra khi phát hiện ra Spam hãy gửi thông báo cho BQT diễn đàn. Hãy suy nghĩ trước khi hành động..!
✓ Khi muốn trả lời ai đó, bạn gõ @ cộng thêm nick diễn đàn của người đó phía sau @, giống như tag tên trên Facebook.
✓ Yêu cầu khi bình luận, bạn phải gõ chữ rõ ràng, không viết tắt, gõ tiếng Việt đầy đủ dấu câu.
✓ Nên dùng font chữ mặc định của diễn đàn, không tô màu lòe loẹt hay dùng size chữ quá lớn khi bình luận.
✓ Bài viết, comment... không được phép quảng cáo dịch vụ, rao vặt, pr... Loại trừ ở chuyên mục Rao vặt đã cho phép.
✓ Nghiêm cấm các chủ đề dạng: Cứu em với, help me, giật tít, câu view... dưới mọi hình thức.
✓ Tất cả các thành viên tham gia diễn đàn cần đọc kỹ Nội quy chung và nghiêm túc tuân thủ.


Chia sẻ trang này

Đang tải...