Các công cụ phát hiện AI đang ngày càng trở nên phổ biến, nhưng đồng thời cũng nổi tiếng về độ thiếu chính xác. Chúng thường xuyên đánh dấu các bài viết do con người tạo ra là “có dấu hiệu AI” vì những lý do như ngữ pháp, lựa chọn từ ngữ và phong cách viết. Điều này gây ra không ít vấn đề cho sinh viên, người làm nội dung và bất kỳ ai phụ thuộc vào văn bản viết. Nếu bạn cũng đang gặp phải tình trạng bài viết của mình bị gắn cờ AI một cách khó hiểu, bài viết này của Thuthuatonline.net sẽ phân tích sâu các nguyên nhân và đưa ra những giải pháp thiết thực để bạn có thể khắc phục.
Ngữ Pháp Quá Hoàn Hảo Có Thể Khiến Bài Viết Bị Gắn Cờ AI
Một trong những cách mà các trình kiểm tra AI dùng để phát hiện nội dung do AI tạo ra là dựa vào mức độ hoàn hảo của ngữ pháp và việc sử dụng các cấu trúc câu chuẩn, phổ biến. Về lý thuyết, AI được lập trình để không mắc lỗi ngữ pháp, trong khi ngay cả những người viết giỏi nhất cũng có thể mắc lỗi nhỏ khi viết. Tương tự, nếu bài viết của bạn ít có rủi ro về phong cách, sử dụng ngữ pháp quá “sách vở” và thiếu đi dấu ấn cá nhân, điều này có thể kích hoạt các công cụ phát hiện AI.
Để minh họa, chúng tôi đã sử dụng một đoạn văn bản được tạo bởi ChatGPT dựa trên bài viết gốc và dán vào GPTZero. Kết quả cho thấy đoạn văn này bị gắn cờ với tỷ lệ cực kỳ cao: 100% là do AI tạo ra.
Kết quả GPTZero hiển thị đoạn văn bản được tạo bởi AI với độ tin cậy 100%
Nếu chúng ta thử thêm một vài lỗi ngữ pháp nhỏ, như xóa một số dấu phẩy hoặc thêm lỗi chính tả, cùng với một vài thay đổi nhỏ về phong cách, điểm số của GPTZero giảm đáng kể xuống còn 81%. Điều này cho thấy sự nhạy cảm của các công cụ này đối với sự “hoàn hảo” trong ngữ pháp.
GPTZero giảm độ nhận diện AI xuống 81% sau khi chỉnh sửa ngữ pháp và phong cách
Sử Dụng Từ Ngữ Phổ Biến Mà AI Thường Dùng
Khi đọc một đoạn văn, nhiều người trong chúng ta đã phát triển một cảm giác trực quan về việc liệu nó có phải do AI viết hay không, chẳng hạn như các đoạn văn “phù phiếm” và những từ ngữ mà AI thường xuyên sử dụng. Các từ như “delve” (đi sâu vào), “highlight” (nổi bật), “underscore” (nhấn mạnh), “pose” (đặt ra), “the world of” (thế giới của), “strive” (phấn đấu) và vô số từ/cụm từ khác. Điều này được thể hiện rõ ràng qua sự gia tăng đáng kể của từ “delve” trong các bài nghiên cứu học thuật vào năm 2023, trùng hợp với thời điểm ChatGPT ra mắt.
Sử dụng cùng đoạn văn trong ví dụ trên, nếu chúng ta thực hiện một vài thay đổi nhỏ đối với những đoạn văn bị gắn cờ “AI” nhiều nhất, điểm số GPTZero tiếp tục giảm xuống còn 49% – một điểm số được coi là “do con người tạo ra”, mặc dù vẫn chưa thoát khỏi sự giám sát học thuật. Rõ ràng, các trình kiểm tra AI có thể dễ dàng bị đánh lừa chỉ với một vài chỉnh sửa nhỏ, đây là một trong nhiều ví dụ làm nổi bật sự kém hiệu quả của chúng.
GPTZero nhận định đoạn văn bản là do con người tạo với tỷ lệ 49% sau khi thay đổi từ ngữ
Đáng chú ý, những người nói tiếng Anh như ngôn ngữ thứ hai thường phàn nàn nhiều hơn về việc nhận được kết quả “false positive” (gắn cờ sai) từ các trình kiểm tra AI. Các công ty AI khi xây dựng mô hình ngôn ngữ lớn thường thuê ngoài việc chú thích dữ liệu cho các quốc gia nơi tiếng Anh là ngôn ngữ thứ hai phổ biến. Do đó, một số từ chúng ta liên kết với văn phong AI, chẳng hạn như “delve”, có thể xuất phát từ việc những người nói tiếng Anh thứ hai sử dụng các từ này trong vốn từ vựng của họ. Điều này càng phức tạp hơn khi nhiều người thành thạo tiếng Anh như ngôn ngữ thứ hai thường hiểu và nắm vững các quy tắc ngữ pháp tốt hơn những người bản xứ (thường tiếp cận ngôn ngữ một cách trực quan hơn). Kết quả là, người nói tiếng Anh thứ hai có thể phải đối mặt với rủi ro gấp đôi khi bị gắn cờ sai bởi các công cụ kiểm tra AI, do ngữ pháp chuẩn xác và lựa chọn từ vựng cụ thể của họ.
Công Cụ Hỗ Trợ Viết AI Cũng Có Thể Gây Nghi Ngờ
Hai vấn đề trên có thể xảy ra ngay cả khi bạn không sử dụng công cụ AI tạo sinh. Nếu bạn nỗ lực viết bài gốc nhưng lại quá phụ thuộc vào các công cụ hỗ trợ viết như Grammarly, bài viết của bạn có nhiều khả năng bị gắn cờ là do AI viết. Đây là một vấn đề gây tranh cãi trong học thuật, vì các công cụ này về cơ bản là trợ lý AI tạo sinh, và sinh viên thường sử dụng chúng để thay thế việc học hơn là như một công cụ bổ trợ hữu ích. Khi một tỷ lệ đáng kể văn bản của bạn được viết lại theo gợi ý của trợ lý AI, thì một phần lớn bài viết của bạn thực sự đã được tạo bởi AI. Do đó, khi sử dụng các công cụ như Grammarly, hãy cẩn thận nếu bạn quá phụ thuộc vào chúng; hãy xem các gợi ý của Grammarly như cơ hội học hỏi thay vì chấp nhận chúng một cách mù quáng.
Sao Chép Trực Tiếp Từ ChatGPT Là Một “Dấu Hiệu AI” Chắc Chắn
Cuối cùng và hiển nhiên nhất, nếu bạn thực sự sử dụng ChatGPT và không chỉnh sửa gì đáng kể đầu ra của nó, các trình kiểm tra AI gần như chắc chắn sẽ gắn cờ bạn; đây không phải là một “false positive” mà là một kết quả chính xác. Tuy nhiên, như đã phân tích, ngay cả khi bạn nỗ lực viết bài hoàn toàn gốc, không có sự hỗ trợ, ngữ pháp hoàn hảo và một số lựa chọn từ vựng, cách diễn đạt nhất định vẫn có thể khiến bạn bị gắn cờ sai.
Các công cụ kiểm tra AI hiện tại vẫn còn nhiều hạn chế và thường xuyên tạo ra “false positive”. Điều quan trọng là hiểu được cách chúng hoạt động và các “dấu hiệu” mà chúng tìm kiếm. Bằng cách điều chỉnh phong cách viết, thêm “lỗi con người” một cách tự nhiên (như cấu trúc câu đa dạng, từ vựng phong phú không bị trùng lặp với cách diễn đạt của AI), và không quá lạm dụng các công cụ hỗ trợ, bạn có thể giảm thiểu nguy cơ bài viết của mình bị gắn cờ sai. Hãy luôn ưu tiên văn phong tự nhiên, chân thực, mang đậm dấu ấn cá nhân để đảm bảo nội dung của bạn được công nhận là do con người tạo ra. Hãy chia sẻ trải nghiệm của bạn với các công cụ kiểm tra AI trong phần bình luận bên dưới nhé!