| Search Engine Bots (Crawler) | Thu thập dữ liệu để lập chỉ mục (index website) cho các công cụ tìm kiếm | Google (Googlebot), Bingbot, Baidu, v.v. | Tốt / Trung bình | ✅ Tích cực | Có thể có | Tăng pageviews hoặc session ảo trong analytics nếu không lọc bot traffic |
| Monitoring Bots | Giám sát uptime website hoặc kiểm tra bảo mật | UptimeRobot, Pingdom, SSL Labs, v.v. | Nhẹ | ✅ Tích cực | Có thể có | Có thể tăng nhẹ traffic khi kiểm tra định kỳ |
| Scraper Bots | Thu thập nội dung website trái phép (hình ảnh, mô tả sản phẩm, bài viết, v.v.) | Bên thứ ba (đối thủ, tool AI, spammer) | Trung bình đến nặng | ❌ Tiêu cực | Có | Tăng traffic không thực (sessions), làm sai bounce rate, thời gian trên site giảm |
| Spam Bots | Gửi form rác, bình luận spam, đăng ký giả, hoặc truy cập lặp | Spammer, tool tự động | Nặng | ❌ Tiêu cực | Có | Dữ liệu form, số chuyển đổi (conversion), email giả — làm sai lệch tỉ lệ chuyển đổi |
| Click Bots / Ad Fraud Bots | Tự động click quảng cáo để tạo doanh thu giả hoặc gây tổn thất | Hacker, đối thủ, ad fraud tool | Rất nặng | ❌ Tiêu cực | Có nhiều | Tăng CPC ảo, CTR sai, ngân sách quảng cáo tiêu hao sai cách, ảnh hưởng dữ liệu quảng cáo |
| Social Bot / Crawler mạng xã hội | Lấy preview bài viết (ảnh, tiêu đề, mô tả khi chia sẻ link) | Facebook (Facebot), Twitterbot, LinkedIn | Nhẹ | ✅ Tích cực | Ít hoặc không | Có thể tạo hit truy cập nhẹ nếu nhiều người chia sẻ link cùng lúc |
| Testing Bots | Kiểm thử chức năng website (QA, automation testing, CI/CD tool) | Dev nội bộ / công ty | Tùy theo tần suất | ✅ Trung lập | Có | Nếu không tắt tracking trong quá trình test — có thể gây traffic ảo |
| AI Bots / Language Model Bots | Dùng để thu thập dữ liệu cho mô hình AI (đọc content, đánh giá hành vi, v.v.) | OpenAI, Anthropic, You.com, v.v. | Đang tăng | ❌ Trung lập | Có | Truy cập sâu, có thể tăng pageviews không thực, hoặc khiến tốc độ server chậm |
| Malicious Bots (DDoS/Exploit) | Tấn công DDoS, dò lỗ hổng, tấn công brute-force | Hacker, botnet | Cực kỳ nặng | ❌ Rất tiêu cực | Không chính xác | Không nhằm mục đích lấy dữ liệu nhưng có thể khiến website ngừng hoạt động hoặc mất dữ liệu |