Trang website này là về cái gì?
Với tư cách của nhà tiếp thị, thì việc tối ưu hóa các trang web là một trong những công việc quan trọng, nó giúp cho chúng ta trả lời những câu hỏi cơ bản nhất. Những công cụ tìm kiếm này không thể đọc được những trang web mà con người có thể đọc được; vì thế, việc chúng ta cần làm là kết hợp những cấu trúc và manh mối của chúng lại với nhau, đúng theo như những gì mà nội dung của chúng ngụ ý. Điều này, giúp cung cấp các yếu tố có liên quan đến việc tối ưu hóa công cụ tìm kiếm phù hợp với truy vấn đến những kết quả có ích khác.
Việc hiểu được các kĩ thuật được sử dụng là để nắm bắt được ý nghĩa của chúng, cũng như sẽ giúp cung cấp những dấu hiệu tốt hơn như những gì mà nội dung của trang web có liên quan đến và cuối cùng là giúp nó có được thứ hạng cao trong kết quả tìm kiếm. Bài vết này, nhằm khám phá hàng loạt các “kĩ thuật on-page” không những là việc xây dựng 1 trang web dựa trên một trang web khác mà còn có thể được kết hợp theo những cách tinh vi khác
Trong khi Google không tiết lộ chính xác chi tiết những thuật toán của nó, thì trong những năm qua chúng tôi,đã thu thập được hàng trăm bằng chứng từ những các cuộc phỏng vấn, các bài nghiên cứu, các hồ sơ sáng chế của Mỹ và quan sát từ hàng trăm những nhà nghiên cứu về tiếp thị để có thể khám phá ra các tiến trình này. Xin gửi lời cảm ơn đặc biệt tới Bill Slawki đã có bài viết về “SEO The Sea” từ đó đã dẫn tới việc đưa ra nhiều nghiên cứu phụ vụ cho công tác này.
Còn với một đọc giả, thì xin hãy nhớ rằng, đây chỉ là những cách mà Google có thể xác định những trang web có liên quan đã được tối ưu hóa với các công cụ tìm kiếm và những trang web có liên quan này cũng không hoàn toàn theo quy luật. Dù sao thì việc trải nghiệm trên trang web riêng của bạn vẫn luôn là những hướng giải quyết tốt nhất.
1/ Cách sử dụng từ khóa:
Ở giai đoạn đầu, thì những từ khóa đã xuất hiện trên hầu hết các trang web. Khái niệm đã được hiểu như sau: Nếu một trang web của bạn tập trung vào một chủ đề nhất định thì công cụ tìm kiếm sẽ tập trung và các phần quan trọng trên web như: thẻ Title, các headline h1, h2, h..., các thuộc tính của hình ảnh và tất cả text trong nội dung web. Những người làm SEO sẽ giúp trang web của họ được xếp hạng bằng cách đặt những từ khóa này vào các phần quan trọng ở trên.
Thậm chí, cho tới ngày nay, thì chúng ta vẫn bắt đầu với việc tìm kiếm bằng các từ khóa, và chúng thì vẫn còn duy trì như là hình thức phổ biến nhất là “tối ưu hóa on-page”
Cụm từ khóa: “Sửa chữa tự động”
Sửa chửa tự động của Tom àYếu tố phụ đề
http://nhungchiecxehoicuatom.com/suachuatudong/ àURL (định vị tài nguyên thống nhất)
Hầu hết những công cụ “SEO on-page” này vẫn dựa vào vị trí của những từ khóa để xếp hạng các trang web. Và trong khi nó vẫn được xem như một nơi tốt để bắt đầu cho tất cả mọi việc thì những nghiên cứu đã cho thấy ảnh hưởng của nó đã giảm. Trong khi điều quan trọng là việc để đảm bảo trang web của bạn vẫn duy trì ở một mức truy cập tối thiểu như bạn muốn thì không chắc rằng vị trí các từ khoá sẽ có nhiều ảnh hưởng tới vị trí xếp hạng trang web của bạn.
2/ Tần số xuất hiện của 1 từ trong văn bản (TF) và tần số nghịch của 1 từ trong tập văn bản (IDF):
Đó không phải là mật độ phân bố của một từ khoá, mà nó là một thuật ngữ thể hiện tần số xuất hiện của 1 từ trong văn bản (TF) và tần số nghịch của 1 từ trong tập văn bản (TDF). Các nhà nghiên cứu của Google đã gần đây đã miêu tả TF-IDF đã được sử dụng trong thời gian dài để chỉ mục các trang web và các biến thể của TF và TDF xuất hiện như là một thành phần trong các bằng sáng chế nổi tiếng của Google.
TF-IDF thì không đo lường được mức độ xuất hiện thường xuyên của một trang web nhưng nó là một thước đo quan trọng bằng cách nó sẽ so sánh mức độ xuất hiện thường xuyên của một từ khoá với kỳ vọng được thu thập từ một tập hợp lớn các văn bản.
Nếu chúng ta so sánh cụm từ “bóng rổ” với cụm “cầu thủ bóng rổ” dưới góc độ người xem Ngram của Google thì sẽ có một điều dễ nhận thấy rằng cụm từ “cầu thủ bóng rổ” sẽ hiếm xuất hiện hơn so với cụm từ “bóng rổ”. Và dựa trên tần số xuất hiện này, chúng ta có thể kết luận rằng, cụm từ “cầu thủ bóng rổ” là một từ quan trọng trên trang web đó, trong khi đó thì ngưỡng cửa cho việc tìm kiếm từ “cái rổ” thì vẫn xuất hiện với mức độ cao hơn nhiều.
Với mục đích SEO, khi chúng ta đo lường mức độ tương quan của TF-IDF với mức xếp hạng cao hơn, nó chỉ thể hiện tương đối đối hơn với việc dùng 1 từ khoá riêng biệt. Nói cách khác, việc tạo ra một điểm số TF-IDF cao nói chung là chưa đủ trước mong đợi quá cao của việc tăng cường SEO. Thay vì thế, lẽ ra chúng ta nên nghĩ rằng TF-IDF là một nhân tố quan trọng hơn của khái niệm ”on-page”.
3/ Từ đồng nghĩa và biến thể gần:
Với 6 tỷ nghiên cứu mỗi ngày, Google có rất nhiều thông tin hữu ích để xác định những người tìm kiếm thực sự đang tìm gõ nội dung truy vấn gì vào mục tìm kiếm.
Nghiên cứu của Google cho thấy, từ đồng nghĩa thực sự đóng vai trò quan trọng lên tới 70% tong các nghiên cứu.
Để giải quyết vấn đề này, công cụ tìm kiếm kiểm soát 1 tập văn lớn các từ đồng nghĩa, và các biến thể gần với hàng tỷ cụm từ, nó cho phép bạn kết hợp nội dung với các truy vấn; ngay cả khi những người tìm kiếm sử dụng các từ khác với văn bản của bạn. Một ví dụ như với truy vấn là những hình ảnh của loàichó, thì có thể bạn cũng đang ngụ ý những truy vấn sau: hình về loài chó, ảnh về loài chó, hình ảnh về loài chó, bức ảnh về những chú chó…
Trái lại, truy vấn hình ảnh cho những cử chỉ của loài chó thì ý nghĩa của truy vấn này là khác hoàn toàn, và điều quan trọng là làm sao cho công cụ tìm kiếm thấy được sự khác biệt đó.
Từ quan điểm của một SEO thì điều này có nghĩa là việc tạo ra ngôn ngữ tự nhiên với các biến thể, thay vì sử dụng cùng các từ khoá nghiêm ngặt hơn và hơn thế nữa.
Sử dụng các biến thể cho chủ để chính cũng có thể chấm phá thêmchút ý nghĩa và ngữ nghĩa cho đoạn văn của bạn và giúp giải quyết vấn đề không khó hiểu của câu, khi mà các cụm từ khoá quan trọng có thể ám chỉ tới nhiều hơn một nghĩa.
Nhà máy và xí nghiệp, 2 tên gọi này có thể ám chỉ tới một nhà máy sản xuất, trong khi cây cối và cây bụi thì lại ám chỉ tới loài thực vật.
Ngày nay, thuật toán chim ruồi (Hammingbird) của Google cũng sử dụng sự xảy ra đồng thời để xác định việc dùng từ đồng nghĩa cho việc thay thế truy vấn dữ liệu.
Dưới sự ảnh hưởng của ‘Thuật toán chim ruồi”, việc đồng thời xảy ra được sử dụng để xác định những từ mà chúng có thể đồng nghĩa với nhau trong những bối cảnh nhất định; theo đó, việc lựa chọn một trang nhất định để đáp ứng với một truy vấn mà ở đây như là một sự thay thế được xảy ra với xác suất cao.
Bill Slawski - SEO by the Sea
4/ Phân khúc trang:
Nơi mà bạn đặt những lời nói của mình trên 1 trang web nào đó thì nó cũng quan trọng như chính những lời mà bản thân nó mang theo ý nghĩa.
Mỗi trang web được cấu thành từ nhiều phần riêng biệt: phần đầu trang, thanh bên của trang (sidebar) và còn nhiều thành phần nữa… Công cụ tìm kiếm từ lâu đã vận hành để xác định phần quan trọng nhất của 1 trang nhất định.
Cả Google và Microsoft đã có 1 số bằng sáng chế cho thấy rằng nội dung trong các phần có liên quan của HTML có trọng lượng hơn. Phần nội dung nằm trong phần thân bài chính của 1 đoạn văn, có tầm quan trọng hơn là văn bản được đặt tại vị trí thanh bên Sidebar hoặc những vị trí thay thế khác. Việc lặp lại đoạn văn được đặt tại những nơi được soạn thảo sẳn, hoặc trình duyệt Chrome, sẽ làm tăng nguy cơ bị xem nhẹ, thậm chí nhiều hơn nữa.
Phân khúc trang trở nên quan trọng hơn đáng kể khi mà chúng ta dịch chuyển về phía mảng di động, nơi mà một số phần khi hiện trên trang di động sẽ bị ẩn đi mất. Công cụ tìm kiếm muốn phục vụ người dùng có thể thấy được phần rõ ràng và quan trọng trong trang web của bạn, vì thế đoạn văn trong những phần này đáng được tập trung vào nhất.
Để tiến một bước xa hơn, HTML5 đã cung cấp thêm một số yếu tố ngữ nghĩa như: , , điều này có thể xác định rõ các phần trong trang web của bạn.
5/ Khoảng cách ngữ nghĩa và mối liên hệ thuật ngữ:
Khi nói về việc tối ưu hoá “on-page”, thì khoảng cách ngữ nghĩa thường ám chỉ tới mối quan hệ giữa những từ và cụm từ khác nhau trong văn bản. Điều này, khác với khoảng cách vật lý giữa cụm từ và tập trung vào cách kết nối các thuật ngữ với các câu, các đoạn và những yếu tố HTLM khác.
Làm thế nào để công cụ tìm kiếm biết đến thuật ngữ “Labrador” có liên quan tới tên của một giống chó khi mà hai cụm từ không nằm cùng trong một câu?
Các công cụ tìm kiếm đã giải quyết vấn đề này bằng việc đo lường khoảng cách giữa những từ khác biệt và cụm từ trong những yếu tố HTLM. Định nghĩa càng gần với ngữ nghĩa hơn, thì định nghĩa đó càng liên quan hơn. Cụm từ nằm trong cùng một đoạn văn thì gần gũi hơn về ngữ nghĩa so với những cụm từ nằm cách xa vài khối văn bản.
Ngoài ra, các phần tử HTLM có thể làm ngắn đi khoảng cách ngữ nghĩa giữa các khái niệm, đồng thời cũng kéo chúng lại gần nhau hơn. Ví dụ như danh sách các mục có thể không mấy liên quan với nhau và “tiêu đề của một tài liệu có thể được xem như khá gần gũi và liên quan với một thuật ngữ trong tài liệu”
Bây giờ đúng là một dịp thuận lợi để đề cập tới trang web “schema.org”. Đánh dấu Schema có thể đưa ra cách để tái cấu trúc những phần trong đoạn văn của bạn theo các ngữ nghĩa, đồng thời xác định mối quan hệ giữa các thuật ngữ.
Lợi thế tuyệt vời của Schema là nó đề xuất không để lại bất cứ phỏng đoán nào cho công cụ tìm kiếm. Những mối liên hệ đã được xác định một cách rõ ràng. Thức thức ở đây là nó đòi hỏi những nhà quản trị các trang web phải sử dụng các đánh dấu đặc biệt. Cho tới tận bây giờ, các nghiên cứu cho thấy nó vẫn chưa được áp dụng rộng rãi. Phần còn lại của các khái niệm được liệt kê ở đây có thể làm việc trên bất kì trang web nào có chứa văn bản.
6/ Sự xảy ra đồng thời và chỉ mục dựa trên cụm từ:
Tính đến thời điểm này, chúng ta đã thảo luận về những từ khoá cá nhân vàmối quan hệ giữa chúng. Công cụ tìm kiếm cũng sử dụng những phương pháp các trang chỉ mục, phương pháp này dựa trên những cụm từ đầy đủ và cũng tiến hành xếp hạng các trang web theo những cụm từ có liên quan. Chúng ta biết rằng tiến trình này chính là chỉ mục dựa trên những cụm từ.
Điều thú vị nhất về quá trình này không phải là việc Google đã làm như thế nào để xác định những cụm từ quan trọng nhất cho những trang web, nhưng làm thế nào mà Google lại có thể dùng những cụm từ này để xếp hạng cho một trang web, dựa trên độ liên quan của những cụm từ.
Việc sử dụng khái niệm về việc đồng thời xảy ra, các công cụ tìm kiếm biết được rằng những cụm từ nhất định sẽ có xu hướng dự đoán được những cụm từ khác có liên quan. Nếu cụm từ chính của bạn nhằm mục tiêu là tìm kiếm cụm từ “John Oliver” thì cụm từ này sẽ kéo theo các kết quả có liên quan như “diễn viên hài kịch đêm khuya”, “buổi biểu diễn hàng ngày”, và “kênh phim HBO”. Một trang web mà có chứa những cụm từ liên quan như vậy sẽ cung cấp nhiều thông tin có liên quan về Oliver hơn là những trang web không cung cấp những cụm từ có liên quan trên.
Thêm vào các liên kết này từ những trang web có các cụm từ đồng thời xảy ra có liên quan. Bằng cách đó, bạn đã cho trang web của mình một dấu hiệu về sức mạnh của ngữ cảnh.
7/ Nét nổi bật của một thực thể:
Nhìn về tương lai, các công cụ tìm kiếm đang khám phá ra hàng loạt cách về việc sử dụng các mối liên hệ giữa các thực thể, mà không chỉ là từ khoá để xác định sự liên quan của chủ đề.
Một kĩ thuật đã được xuất bản như 1 bài nghiên cứu khoa học của Google, miêu tả việc chỉ ra sự liên quan thông qua nét nổi bật của các thực thể.
Nét nổi bật của thực thể vượt xa những kĩ thuật từ khoá truyến thống, như TF-IDF, cho việc tìm kiếm những thuật ngữ có liên quan trong một tài liệu bằng cách tận dụng các mối liên hệ được biết đến giữa các thực thể. Một thực thể là bất cứ thứ gì có trong tài liệu, nó là 1 sự khác biệt và được xác định rõ.
Mối liên hệ của một thực thể mạnh mẽ hơn những thực thể khác trong một trang web, mà quan trọng hơn là những gì mà1 thực thể có thể trở thành.
Trong sơ đồ trên, một bài viết có chứa các chủ đề như Người sắt, Tony Stark, pepper potts, và khoa học viễn tưởng… Cụm từ “Truyện tranh ly kì” có mối quan hệ thực thể chặt chẽ với tất cả các thuật ngữ trên. Thậm chí, nó chỉ xuất hiện một lần thì nó vẫn là một dấu hiệu quan trọng trong các tài liệu.
Mặc khác, cụm từ “phim màn ảnh rộng” đã xuất hiện vô số lần thì cụm từ này vẫn có mối quan hệ thực thể không chặt chẽ cho lắm và nó không cho ta thấy được dấu hiệu quan trọng của nó.
Những lời mách nhỏ cho việc “Seo on-page” của bạn trở nên tốt hơn
Khi chuyển đổi từ sự thay thếtừ khoá tìm kiếm bằng những chủ đề tập trung rõ nét hơn vào điều mà ta cần tìm thì thật dễ dàng để kết hợp những khái niệm này vào nội dung của bạn. Trong khi hầu hết chúng ta, không có các phương tiện sẳn có để tính toán các mối liên hệ về ngữ nghĩa và sự xảy ra của các thực thể, thì có một số bước đơn giản sau đây mà bạn có thể sử dụng khi tạo nội dung để tối ưu hoá các trang mà mình mong muốn.
1/ Nghiên cứu từ khoá để tạo thành cơ sở dữ liệu của bạn. Thậm chí , một số từ khoá cá nhân không còn đủ nữa để có thể tạo thành nền tảng nội dung của bạn. Mọi thứ bắt đầu với việc nghiên cứu một từ khoá hay. Bạn cần phải biết được thuật ngữ nào bạn đang tìm kiếm và những từ khoá không liên quan nào sẽ xuất hiện theo cùng với những từ khoá trên, cũng như sự phổ biến của các thuật ngữ ấy. Cuối cùng, mục đích của bạn là kết nối nội dung với loại từ khoá mà bạn đang tìm kiếm và nói vào ô tìm kiếm.
2/ Nghiên cứu quanh chủ đề của bạn. Không tìm kiếm những từ khoá đơn lẽ, thay vào đó là tìm kiếm những chủ đề từ khoá của bạn. Với mỗi từ khoá, nên kiểm tra lại 2 lần trước khi tìm kiếm. Khi mà người khác nói tới chủ đề của bạn thì những từ nào mà họ sẽ dùng để miêu tả chủ đề ấy. Cái gì là những thuộc tính đối tượng của bạn? Sử dụng những cụm từ khoá hổ trợ như là việc bạn “tuyển chọn” diễn viên cho một bộ phim để xây dựng nội dung cho chủ đề trung tâm của bạn.
3/ Khi tạo nội dung cho mình, bạn có thể trả lời được càng nhiều câu hỏi của chính mình thì càng tốt. Nội dung tốt nhất là câu trả lời cho những câu hỏi trên và về nội dung ngữ nghĩa có liên quan sẽ phản ánh nên điều này. Một bảng xếp hạng hàng đầu cho bất kì truy vấn nào có nghĩa là công cụ tìm kiếm tin rằng nội dung của bạn là câu trả lời tốt nhất. Khi cấu trúc nội dung của bạn có liên quan hơn tới chủ đề, hãy chắc chắn rằng trang web của bạn xứng đáng được xếp hạng đầu bằng việc trả lời những câu hỏi và cung cấp cho người dùng một trãi nghiệm tốt hơn đối thủ làm được.
4/ Sử dụng ngôn ngữ tự nhiên và các biến thể. Trong suốt quá trình tìm kiếm các từ khoá của bạn, sẽ chẳng có gì hữu ích hơn nếu bạn xác định được những cách phổ biến mà người tìm kiếm khác “tham khảo” chủ đề của bạn và được bao gồm luôn trong nội dung. Nghiên cứu ngữ nghĩa của từ khoá thường là một điều vô giá trị đối với tiến trình này.
5/ Thay thế nội dung quan trọng thành những phần quan trọng nhất. Tránh đặt những nội dung quan trọng vào phần cuối trang hoặc thanh bên “sidebar”. Tránh việc đánh lừa công cụ tìm kiếm bằng những CSS ưa thích hoặc thủ thuật JavaScript. Nội dung quan trọng nhất của bạn nên được nằm nơi dễ nhìn thấy và nhận biết cho người đọc.
6/ Cấu trúc lại nội dung của bạn,một cách thích hợp; Tiêu đề, đoạn văn, danh sách và các bảng tất cả đều cung cấp một cấu trúc cho nội dung để cho công cụ tìm kiếm có thể dễ dàng hiểu được chủ đề mục tiêu của bạn là gì. Một trang web tốt sẽ cung cấp những cấu trúc rõ ràng, giống như một bảng điểm đẹp củathời Đại học vậy. Dùng phần giới thiệu, kết luận thích hợp; chủ đề phải được tổ chức theo từng đoạn, ngữ pháp, chính tả và trích dẫn nguồn phải hợp lí.
Và cuối cùng, thì chúng ta không cần một siêu máy tính để tạo ra một nội dung hay hơn hoặc dễ hiểu hơn. Nếu chúng ta viết một chủ đề gì đó cho con người thì trước hết nội dung sẽ là 1 bước tiến một bước dài trong việc làm cho các công cụ tìm kiếm trở nên tối ưu hoá. Thế những lời mách nước nào bạn muốn dành cho “SEO on-page” và chủ đề chính của mình?