Google tấn công chống lại spam
Đây là một bài đăng của khách bởi Lior Levin.
Máy bay chiến đấu spam hàng đầu của Google, Matt Cutts, gần đây đã đăng một bài viết blog dài về trạng thái trận chiến của Google với những người gửi spam.
Trong bài viết, Cutts nói rằng, trong khi thư rác trong chỉ mục của Google chỉ bằng một nửa so với năm năm trước, thì thư rác đã tăng lên trong chỉ mục của Google trong những tháng gần đây và, đối với một số truy vấn nhất định, đã trở nên đáng chú ý hơn.
Theo Cutts, thay đổi này không chỉ là do thực tế là có nhiều kẻ gửi thư rác hơn bao giờ cố gắng lừa gạt thứ hạng công cụ tìm kiếm cao hơn, nhưng vì cập nhật Caffeine gần đây của Google có công cụ tìm kiếm lập chỉ mục nhiều nội dung hơn bao giờ hết, bao gồm cả spam.
Tuy nhiên, ông đã vạch ra kế hoạch của Google để chống lại sự gia tăng này và ngăn cản nó trở thành một vấn đề nghiêm trọng hơn. Cụ thể, anh đã vạch ra ba thay đổi đối với Google mà anh hy vọng sẽ cải thiện chất lượng kết quả của Google và cải thiện trải nghiệm tìm kiếm cho mọi người.
Thay đổi đầu tiên, mà Google đã khởi chạy gần đây, được nhắm mục tiêu vào chính những người gửi spam và là " trình phân loại cấp tài liệu được thiết kế lại ", thực hiện công việc phát hiện nội dung spam trên một trang tốt hơn. Điều này bao gồm những thứ như các từ lặp lại trong văn bản cũng như một số loại spam nhận xét nhất định.
Cải tiến thứ hai, hiện đang được đánh giá, là một thay đổi thuật toán được nhắm mục tiêu tại các trang web sao chép nội dung từ các trang khác, thường không được phép. Các trang web này thường sao chép các khối nội dung lớn với rất ít tài liệu gốc nhưng đôi khi chúng xếp hạng rất tốt, bao gồm cả các trang web đã tạo nội dung ban đầu.
Tuy nhiên, đó là thay đổi thứ ba và cuối cùng đã tạo ra cuộc thảo luận nhiều nhất. Theo Cutts, Google đang tìm cách để tiếp tục giảm thứ hạng của cái gọi là "trang trại nội dung" hoặc các trang web sản xuất một lượng lớn nội dung với giá rẻ, thường thông qua lao động hợp đồng thường có chất lượng đáng ngờ. Điều này bao gồm các công ty như Demand Media, hoạt động eHow, Livestrong cũng như các trang web khác.
Theo Cutts, Google đã thực hiện hai thay đổi trong năm 2010 để giảm tác động của các trang trại nội dung này nhưng hiểu rằng mọi người đang yêu cầu thực hiện hành động mạnh mẽ hơn nữa. Các trang web, tuy nhiên, đã được gây tranh cãi bởi vì, mặc dù họ thường có nội dung chất lượng thấp hơn, họ không được coi là thư rác web truyền thống.
Cho rằng Demand Media chỉ có một IPO trị giá 1, 5 tỷ đô la, nó rất dễ dàng để xem có bao nhiêu giá trị công ty đã có thể phát triển thông qua nội dung của nó "canh tác". Những gì còn lại để được nhìn thấy là nếu Google sẽ có thể ngăn chặn sự phổ biến của nó trong các kết quả, đặc biệt là cho các tìm kiếm đuôi dài nó nhắm mục tiêu.
Điều rõ ràng là, ngay cả sau một thập kỷ trong ngành, Google vẫn đang vật lộn với các vấn đề về chất lượng nội dung trong chỉ mục của nó và đang đấu tranh để giữ cho những người gửi spam, những kẻ lừa đảo và những người nông dân nội dung ở vịnh.
Mặc dù nó chắc chắn đã đạt được tiến bộ trong thập kỷ qua, vẫn còn rất nhiều việc phải làm và Google đang chuẩn bị làm điều đó.
Tất cả những gì chúng ta có thể làm là ngồi lại, xem điều gì xảy ra và hy vọng rằng các trang web hợp pháp, chất lượng cao không vô tình bị cuốn vào hỗn hợp.