Question 1

Nên đặt file robots.txt ở đâu?

Accepted Answer

File robots.txt phải ở thư mục gốc tên miền, truy cập được tại example.com/robots.txt. Bot tìm file ở vị trí chính xác này. Nếu dùng subdomain, mỗi cái cần robots.txt riêng.

Question 2

Robots.txt có ngăn trang xuất hiện trên Google không?

Accepted Answer

Không hoàn toàn. Robots.txt chặn thu thập, nhưng Google có thể lập chỉ mục URL nếu tìm thấy trong liên kết từ trang khác, dù không thấy nội dung. Để tránh lập chỉ mục, dùng thẻ meta noindex trên trang. Robots.txt và noindex có mục đích khác nhau và bổ sung nhau.

Question 3

Có thể chặn bot AI như ChatGPT không?

Accepted Answer

Có. Thêm quy tắc cho User-agent: GPTBot và User-agent: ChatGPT-User với Disallow: / để chặn bot thu thập của OpenAI. Tương tự, ClaudeBot là user-agent của Anthropic. Tuy nhiên, không phải tất cả bot AI đều tuân thủ robots.txt.

Question 4

Cong cu nay co mien phi khong?

Accepted Answer

Co, hoan toan mien phi va khong can dang ky.

Question 5

Co hoat dong tren dien thoai khong?

Accepted Answer

Co, hoat dong hoan hao tren moi thiet bi.

Tạo robots.txt

Trình tạo robots.txt cho SEO và kiểm soát thu thập web

Câu hỏi thường gặp