Mỗi ngày có hàng triệu nội dung spam vô ích được tạo ra và google chống spam bằng cách kết hợp các thuật toán máy tính với việc đánh giá thủ công.
* Các website spam làm mọi cách để giành vị trí đứng đầu trong các liên kết tìm kiếm, thông qua nhiều kỹ thuật đại loại như là lặp đi lặp lại từ khóa, mua liên kết mà pagerank chấp nhận hoặc là tạo văn bản ẩn trên màn hình. Điều nay anh hưởng không tốt tới tìm kiếm vì các website có liên quan bị vùi lấp và sẽ không có lợi cho những website chân chính, vì website của họ sẽ khó tìm kiếm hơn . Tin tốt hơn là các thuật toán của google hiện tại sẽ phát hiện ra phần lớn spam và tự động giảm thứ hạng, và google cũng cho biết là đối những website spam với cách khác sẽ được đánh giá bằng thủ công với nhóm của google.
* Xác định spam.
- Các website spam xuất hiện với nhiều dạng khác nhau, có một số website có những văn bản vô nghĩa và không hữu ích khiến người dùng không hiểu. Dưới đây là một số hình ảnh đã được google sử lý spam.
- Spam thuần túy
Có vẻ như trang web sử dụng các kỹ thuật spam có tính công kích chẳng hạn như nội dung vụn vặt, che giấu, văn bản vô nghĩa được tạo tự động từ các trang web khác và/hoặc vi phạm nghiêm trọng hoặc tái vi phạm Nguyên tắc quản trị trang web của Google.
- Nhà cung cấp DNS động và máy chủ lưu trữ miễn phí gây ra spam
Trang web được lưu trữ bởi dịch vụ lưu trữ miễn phí hoặc nhà cung cấp DNS động chứa một phần đáng kể nội dung spam.
- Nội dung nghèo nàn có ít hoặc không có giá trị gia tăng
Có vẻ như trang web bao gồm các trang có chất lượng thấp hoặc hời hợt không cung cấp cho người dùng nhiều giá trị gia tăng (chẳng hạn như các trang liên kết nghèo nàn, trang ngõ, các trang web giống nhau hàng loạt, nội dung được tạo tự động hoặc nội dung được sao chép).
- Liên kết bất thường từ trang web
Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng xuất phát từ trang web này. Đây có thể là kết quả của việc bán liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.
- Liên kết bất thường tới trang web
Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng trỏ đến trang web. Đây có thể là kết quả của việc mua các liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.
- Spam do người dùng tạo
Có vẻ trang web chứa nội dung spam do người dùng tạo. Nội dung có vấn đề có thể xuất hiện trên các trang diễn đàn, các trang lưu bút hoặc tiểu sử người dùng.
* Các website spam làm mọi cách để giành vị trí đứng đầu trong các liên kết tìm kiếm, thông qua nhiều kỹ thuật đại loại như là lặp đi lặp lại từ khóa, mua liên kết mà pagerank chấp nhận hoặc là tạo văn bản ẩn trên màn hình. Điều nay anh hưởng không tốt tới tìm kiếm vì các website có liên quan bị vùi lấp và sẽ không có lợi cho những website chân chính, vì website của họ sẽ khó tìm kiếm hơn . Tin tốt hơn là các thuật toán của google hiện tại sẽ phát hiện ra phần lớn spam và tự động giảm thứ hạng, và google cũng cho biết là đối những website spam với cách khác sẽ được đánh giá bằng thủ công với nhóm của google.
* Xác định spam.
- Các website spam xuất hiện với nhiều dạng khác nhau, có một số website có những văn bản vô nghĩa và không hữu ích khiến người dùng không hiểu. Dưới đây là một số hình ảnh đã được google sử lý spam.
Nguồn ảnh từ google
Nguồn ảnh từ google
Nguồn ảnh từ google
* Các loại spam.
- Kỹ thuật che giấu và/hoặc chuyển hướng lén lút
Trang web dường như đang sử dụng kỹ thuật che giấu (hiển thị nội dung cho người dùng khác với cho công cụ tìm kiếm) hoặc đang chuyển hướng người dùng đến trang khác với trang mà Google thấy.
- Trang web bị tấn công
Một số trang trên trang web này có thể đã bị bên thứ ba tấn công nhằm hiển thị nội dung hoặc các liên kết spam. Chủ sở hữu trang web phải thực hiện hành động ngay lập tức để làm sạch trang web của họ và sửa bất kỳ lỗ hổng bảo mật nào.
- Văn bản ẩn và/hoặc nhồi nhét từ khóa
Một số trang có thể chứa văn bản ẩn và/hoặc bị nhồi nhét từ khóa.
- Tên miền trỏ hướng
Tên miền trỏ hướng là các trang web giữ chỗ với rất ít nội dung duy nhất, do vậy Google thường không đưa các trang web này vào kết quả tìm kiếm.
- Spam thuần túy
Có vẻ như trang web sử dụng các kỹ thuật spam có tính công kích chẳng hạn như nội dung vụn vặt, che giấu, văn bản vô nghĩa được tạo tự động từ các trang web khác và/hoặc vi phạm nghiêm trọng hoặc tái vi phạm Nguyên tắc quản trị trang web của Google.
- Nhà cung cấp DNS động và máy chủ lưu trữ miễn phí gây ra spam
Trang web được lưu trữ bởi dịch vụ lưu trữ miễn phí hoặc nhà cung cấp DNS động chứa một phần đáng kể nội dung spam.
- Nội dung nghèo nàn có ít hoặc không có giá trị gia tăng
Có vẻ như trang web bao gồm các trang có chất lượng thấp hoặc hời hợt không cung cấp cho người dùng nhiều giá trị gia tăng (chẳng hạn như các trang liên kết nghèo nàn, trang ngõ, các trang web giống nhau hàng loạt, nội dung được tạo tự động hoặc nội dung được sao chép).
- Liên kết bất thường từ trang web
Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng xuất phát từ trang web này. Đây có thể là kết quả của việc bán liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.
- Liên kết bất thường tới trang web
Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng trỏ đến trang web. Đây có thể là kết quả của việc mua các liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.
- Spam do người dùng tạo
Có vẻ trang web chứa nội dung spam do người dùng tạo. Nội dung có vấn đề có thể xuất hiện trên các trang diễn đàn, các trang lưu bút hoặc tiểu sử người dùng.
Nguồn : Google





0 nhận xét:
Post a Comment