Tại sao google cần che giấu thuật toán tìm kiếm của mình?
Trong lịch sử google luôn tìm cách che giấu thuật toán tìm kiếm và thậm chí họ còn cập nhật nó thường xuyên trong im lặng, chỉ những người làm SEO chuyên nghiệp mới nhận ra những sự thay đổi của google khi vô tình những bài viết của họ bị tụt hạng (hoặc tăng hạng) một cách bất thường. Tại sao google lại cần làm vậy?
Việc google che giấu thuật toán của mình cũng có lý do của nó. Thứ nhất họ không muốn SEOers thao túng thuật toán tìm kiếm. (SEOers là những người chuyên SEO website). Ví dụ nếu chúng ta biết rằng google coi trọng việc click vào 1 URL bài viết, những SEOers sẽ viết tool để click liên tục vào bài viết muốn SEO, khiến cho bài viết có lượt click ảo rất nhiều và tự động lên top tìm kiếm, mặc dù chất lượng bài viết không tốt, hoặc thậm chí bài viết đó đưa ra những thông tin sai lệch.
Google còn đưa ra tuyên bố ngược rằng, họ không coi trọng việc một URL được click nhiều hay ít mà chỉ quan tâm đến chất lượng của bài viết đó thôi. Nhưng tài liệu rò rỉ lại đưa ra kết quả ngược lại, rằng họ đánh giá rất cao lượt click. Dự là sau sự kiện này sẽ có nhiều người tập trung vào việc xây dựng hệ thống click ảo để đánh lừa google.
Lý do thứ hai đó là google che dấu việc họ âm thầm thu thập thao tác của người dùng. Tài liệu trên đã để lộ ra rằng google thu thập hành vi của người dùng, đặc biệt là trên trình duyệt Chrome, trình duyệt gà cưng của google. Việc họ thu thập thao tác của người dùng để nghiên cứu thuật toán SEO thì chẳng có vấn đề gì nghiêm trọng, nhưng, họ đã thu thập thao tác được, vậy những thứ bí mật riêng tư khác của người dùng như lịch sử truy cập, các thông tin nhạy cảm, thông tin bảo mật, tất cả google cũng sẽ thu thập được. Đừng ngạc nhiên khi bạn vừa gõ "thức ăn cho cá" trên google tìm kiếm, chỉ ít phút sau bạn đi đâu cũng thấy quảng cáo thức ăn cho cá tràn ngập.
Google cố tình để lộ?
Một giả thuyết nghe khá vô lý nhưng lại rất thuyết phục của một youtuber nổi tiếng trong ngành SEO đưa ra, đó là Google cố tình để lộ những trang tài liệu này. Theo như anh chàng này chia sẻ, google thời gian gần đây đã đưa ra những cập nhật nóng hổi nhất trong thuật toán tìm kiếm của google, đó là tích hợp AI đánh giá nội dung bài viết thay vì dựa vào hành vi của người dùng. Ngoài ra AI này cũng có thể phân biệt chính xác đâu là bài viết do con người viết, đâu là bài viết của AI. Thậm chí những kỹ thuật gian lận khác trong SEO từ trước tới nay đều sẽ bị AI này nắm thóp. Từ đó AI này sẽ xếp hạng tất cả những bài viết trên thế giới này một cách đúng thứ hạng của nó. Nhưng bất kỳ AI nào muốn học được thuật toán cũng đều cần tới 1 thứ, đó chính là dữ liệu. Làm sao google có thể thu thập dữ liệu một cách nhanh chóng đây? Họ nghĩ tới kế sách xưa của Gia Cát Lượng.
Họ cố tình tung 2500 trang tài liệu đó lên Internet vì họ biết rằng một khi AI được tích hơp, những thuật toán trên sẽ trở nên vô nghĩa. Họ muốn dùng những trang tài liệu trên để thúc đẩy việc những kẻ gian lận và thao túng thuật toán tìm kiếm tăng lên, tạo cơ hội để AI này học cũng như thực nghiệm một cách nhanh và hiệu quả nhất. Đó chính là kế sách "Thuyền cỏ mượn tên" của Gia Cát Lượng mà mình đã đề cập trước đó.
"Các bạn hãy để ý chi tiết, 2500 trang tài liệu tồn tại tận 1 tuần trên trang Github của Google như thể phơi bày ra giữa bàn dân thiên hạ mà mãi tận 7 ngày sau Google mới nhận ra sai lầm của mình? Tôi nghĩ chắc chắn google đã cố tình chuẩn bị cho sự cố này" - Nichole James, youtuber người Australia chia sẻ trên kênh youtube triệu người đăng ký của mình.
2500 trang tài liệu thuật toán tìm kiếm google có gì?
Dưới đây là những tóm tắt chính của mình về 2500 trang tài liệu này và mình sẽ nêu những ý chính quan trọng, một số thuật toán phức tạp và ít quan trọng hơn mình sẽ nói chi tiết ở bài sau:
- Lượt click của người dùng là vô cùng quan trọng trong đánh giá một bài viết (đặc biệt là click dài hay ngắn), ví dụ click và rê chuột đến hết bài viết sẽ được đánh giá cao, ngược lại click ngắn và rời đi nhanh chóng sẽ khiến cho bài viết bị đánh giá thấp.
- Lượt truy cập liên kết trong bài viết: Khi người dùng truy cập bài viết và có thao tác đi sang bài viết khác trên trang sẽ được đánh giá cao.
- Thẻ keywords trong meta: Google tuyên bố rằng họ chính thức khai tử thẻ meta keywords vào năm 2015 nhưng sự thực họ vẫn đánh giá cao thẻ này (bấy lâu nay họ đã lừa người dùng để hạn chế việc họ thao tùng tìm kiếm bằng cách spam keywords)
- Tìm kiếm vòng tròn: (Thuật ngữ này mình cũng không biết gọi chính xác như nào) Ví dụ khi người dùng tìm kiếm từ khóa Zreview, kết quả chỉ xuất hiện từ khóa Zreview mà không xuất hiện Nam Em, sau đó họ lại tìm kiếm lại Nam Em và lại xuất hiện bài viết Zreview đầu tiên, họ click vào trang đó. Lập tức bài viết đó sẽ được đánh giá cao (Khối người sẽ lợi dụng thuật toán này để SEO website cho coi)
- Hành vi người dùng: Mọi hành vi của người dùng trên trình duyệt Chrome sẽ bị google ghi lại để đánh giá chất lượng của một website là tốt hay xấu. Thậm chí cả lịch sử và thói quen truy cập của họ.
- Bài viết mới: Những bài viết mới sẽ có thứ hạng cao hơn so với bài viết cũ (độ ưu tiên cao hơn), nhưng sự ưu tiên này chỉ tồn tại trong vòng 24h từ khi được xuất bản, sau đó thứ hạng của bài viết mới sẽ bị đưa về bình đẳng như những bài viết khác. Do đó việc cập nhật thường xuyên bài viết có thể đánh lừa được google.
- Tuổi website: Mặc dù trước đó google tuyên bố rằng tuổi website không ảnh hưởng tới SEO nhưng thực tế 2500 trang tài liệu kia để lộ rằng tuổi website là yếu tố quan trọng để xếp hạng thứ hạng của bài viết, và tuổi website sẽ được tính theo đơn vị tuần.
Trên đây là một số thông tin chính mà google để lộ trái ngược với tuyên bố của họ hoặc cố tình che dấu, còn nhiều chi tiết khác thì hầu hết mọi người chuyên SEO đã biết rồi nên mình sẽ không đề cập thêm.