Đừng để AI "ảo giác" thay con người

Là con người, khó tránh khỏi việc đôi khi chúng ta sẽ thấy những điều không tồn tại. Trong tâm lý học, người ta gọi đó là ảo giác. Trí tuệ nhân tạo (AI) cũng có thứ "ảo giác" khi chúng tạo ra kết quả không tồn tại trong thực tế, thậm chí vô nghĩa hoặc sai lệch, nói cách khác là hệ thống đã "nhìn thấy" hoặc "nghĩ ra" thứ chưa từng có và có thể không bao giờ có. Điều này thường dễ xảy ra với các hệ thống nhận dạng hình ảnh, với kết quả đầu ra là những thứ kỳ quái, siêu thực.

Phản ánh và khuếch đại định kiến

Năm 2022, Galactica của Meta bị gỡ bỏ nhanh chóng chỉ sau vài ngày ra mắt do cung cấp thông tin sai lệch và có thành kiến trong câu trả lời. Technology Review khi đó bình luận rằng AI của Meta giống như "con bot không có đầu óc", không thể phân biệt thật giả, vốn là yêu cầu cơ bản với mô hình ngôn ngữ được thiết kế để tạo ra văn bản khoa học. Những sai sót có thể không qua mặt được các nhà khoa học, nhưng có thể khiến những người chưa am hiểu hiểu nhầm, kéo theo nhiều hệ lụy đáng lo ngại.

Đừng để AI
Ảo giác của AI đem đến những phản hồi "nghe có vẻ" đúng đắn và thuyết phục (Ảnh đồ họa của Thomas Fuller/SOPA Images/LightRocket qua Getty Images)

Năm 2017, Joy Buolamwini triển khai dự án Gender Shades để kiểm thử các hệ thống nhận diện khuôn mặt thương mại của các tập đoàn lớn như IBM, Microsoft và Megvii với công nghệ Face++. Nghiên cứu sử dụng bộ dữ liệu Pilot Parliaments Benchmark gồm 1.270 khuôn mặt đại diện đa dạng về giới tính và tông màu da, tập trung đánh giá độ chính xác phân loại giới tính. Kết quả cho thấy sự chênh lệch đáng kể trong độ chính xác giữa các nhóm: các hệ thống này cho kết quả tốt nhất với nhóm nam giới có làn da sáng, trong khi nhóm nữ giới có làn da tối lại có tỷ lệ phân loại sai cao nhất.

Nguyên nhân chính được xác định là do dữ liệu huấn luyện thiếu đa dạng, có thiên lệch tập trung nhiều hình ảnh nam giới da sáng hơn, khiến thuật toán không thể nhận diện chính xác các nhóm khác. Nghiên cứu này đã làm nổi bật vấn đề định kiến trong AI, góp phần nâng cao nhận thức về sự cần thiết của công bằng, minh bạch và đa dạng trong phát triển các công cụ AI. Dự án Gender Shades được xem là dấu mốc quan trọng mở ra cuộc thảo luận rộng rãi về các hệ quả xã hội và đạo đức của định kiến trong AI.

Những công cụ AI tạo sinh như Stable Diffusion cũng vướng phải những vấn đề tương tự. Nghiên cứu năm 2023 về hơn 5.000 hình ảnh do Stable Diffusion tạo ra cho thấy hệ thống này có cả định kiến giới và sắc tộc. Không chỉ riêng AI tạo ảnh, các công cụ tạo văn bản như ChatGPT cũng nhiều lần tạo ra nội dung mang định kiến, thiên lệch hoặc không hề căn cứ trên thực tế song thoạt nhìn lại rất thuyết phục. Vấn đề nghiêm trọng ở chỗ khi nhận kết quả và phản hồi từ các công cụ công nghệ, con người có xu hướng tin tưởng hơn và ít thừa nhận rằng dữ liệu đầu ra có thể sai lệch.

Con dao 2 lưỡi từ sự tự tin của AI

Các nhà khoa học và nghiên cứu chỉ ra rằng ảo giác AI thường bắt nguồn từ một số yếu tố.

Thứ nhất, là "quá khớp mô hình" (overfitting), hiện tượng xảy ra khi mô hình học thuộc lòng dữ liệu huấn luyện thay vì học quy luật tổng quát, dẫn đến dự đoán sai trong tình huống mới. Mô hình tạo sinh hoạt động giống như công cụ tự động hoàn thành, dựa trên mẫu đã quan sát và tiếp nhận, với mục tiêu là tạo ra nội dung "hợp lý", chứ không phải kiểm chứng tính đúng đắn. Công nghệ đằng sau các công cụ AI tạo sinh chưa được thiết kế để phân biệt sự thật với giả và ngay cả khi được huấn luyện chỉ trên dữ liệu chính xác, mô hình vẫn có thể tạo ra thông tin mới nhưng sai lệch khi kết hợp các mẫu dữ liệu.

Thứ hai, do thiên lệch hoặc lỗi dữ liệu huấn luyện. Nếu dữ liệu đầu vào thiếu cân bằng hoặc không đại diện, mô hình sẽ suy diễn sai, phản ánh các định kiến hoặc tạo ra mẫu ảo. Các mô hình AI tạo sinh được huấn luyện trên khối lượng dữ liệu khổng lồ từ Internet, vốn chứa đa dạng thông tin, có chính xác và cũng có cả sự sai lệch, và tất nhiên, không thể bỏ qua những định kiến xã hội - văn hóa. Các mô hình chỉ mô phỏng các mẫu trong dữ liệu mà không phân biệt đúng - sai do đó có thể tái tạo những sai sót hoặc thiên kiến vốn có.

Thứ ba, ảo giác có thể xuất hiện khi mô hình có sự phức tạp quá cao, với số lượng tham số hoặc dữ liệu quá lớn, khiến chúng có xu hướng đưa ra những phản hồi khó giải thích.

Theo OpenAI, các bài kiểm thử nội bộ cho thấy mô hình o3 có tỷ lệ trả lời sai tới 33% trong bài kiểm tra PersonQA, vốn yêu cầu trả lời câu hỏi về nhân vật của công chúng; và lên đến 51% trong bài SimpleQA với những câu hỏi dữ kiện ngắn. Mô hình o4-mini, vốn được thiết kế gọn hơn để tối ưu tốc độ, thậm chí sai tới 79% trong bài kiểm tra SimpleQA. Điều đáng nói là phiên bản ChatGPT mới nhất GPT-4.5, ra mắt tháng 2/2025, có tỷ lệ sai thấp hơn - khoảng 37,1% trong SimpleQA - con số cho thấy những cải tiến nhưng chưa đủ để giải quyết triệt để vấn đề.

Các thử nghiệm độc lập của Vectara, công ty hàng đầu trong lĩnh vực phát hiện và ứng phó mối đe dọa mạng từ AI, cũng cho thấy tình hình tương tự. DeepSeek R1, mô hình của Trung Quốc, có tỷ lệ sai 14,3%, cao hơn hẳn DeepSeek-V2.5 (2,4%). IBM Granite 3.2, phiên bản 2B, có tỷ lệ sai lên đến 16,5%, cao hơn các thế hệ trước.

Đừng để AI
 AI có thể bị ảo giác khi "quá tải" (Ảnh: aitificial.blog)

Các công ty phát triển AI đều đã lên tiếng thừa nhận thực tế này. OpenAI cho biết mô hình o3 có xu hướng trả lời dứt khoát hơn, khiến số câu trả lời đúng tăng nhưng số câu sai cũng nhiều hơn. CEO Sam Altman thậm chí cho rằng hiện tượng này giống "tính năng" hơn là "lỗi", vì "nhiều giá trị của hệ thống đến từ việc chúng luôn có câu trả lời". Google, Microsoft và Anthropic đều đang phát triển các công cụ cảnh báo như Microsoft Correction hay Google Vertex để gắn cờ những thông tin có khả năng sai, dù giới chuyên môn nhận định đây chỉ là giải pháp giảm thiểu chứ không khắc phục tận gốc rủi ro.

Theo một số nhà nghiên cứu, tuy khó có thể loại bỏ hoàn toàn ảo giác của AI, các nhà phát triển hoặc bản thân người dùng có thể giảm thiểu nguy cơ bằng cách dạy mô hình biết thừa nhận khi không biết câu trả lời, không hoàn toàn chắc chắn hoặc tự ý đặt giả thuyết nội dung, hoặc dùng các công cụ khác để truy xuất dữ liệu tin cậy trước khi trả lời, nâng cao chất lượng và độ đa dạng dữ liệu huấn luyện.

Không thể thay thế tư duy và trách nhiệm của con người

AI vận hành dựa trên thuật toán và dữ liệu huấn luyện do đó người dùng luôn cần thận trọng và kiểm chứng độ chính xác của nội dung trả ra từ phản hồi của AI. Đa dạng hóa nguồn tham khảo, kiểm tra chéo hoặc đối chiếu với những thông tin chính thống là cách đơn giản để "nắm đằng chuôi" trong cuộc chơi này.

Những công cụ có khả năng truy xuất dữ liệu, nói đơn giản là tìm kiếm thông tin từ nguồn tin cậy  như giáo trình, bài nghiên cứu, văn bản pháp luật đang mở ra thêm những hướng nghiên cứu và phát triển mới để bổ sung cho năng lực mạnh mẽ của AI.

AI là công nghệ, là thuật toán, do đó yêu cầu càng rõ ràng và có cấu trúc mạch lạc càng dễ tạo ra phản hồi chi tiết. Chất lượng đầu ra của AI phụ thuộc nhiều vào cách đặt câu hỏi của người dùng. Những câu hỏi mơ hồ thường dẫn đến câu trả lời mơ hồ hoặc sai lệch. Một số nhà nghiên cứu đã chứng minh một kỹ thuật có tên "Chain of Thought Prompting" (gợi ý theo chuỗi suy luận) giúp tăng tăng minh bạch và độ chính xác trong các nhiệm vụ phức tạp. Kỹ thuật này có thể hiểu đơn giản là buộc mô hình giải thích từng bước, từ đó giúp tăng tính minh bạch do có diễn giải cụ thể cho người dùng cách mô hình suy luận.

Tham số đo lường sự sáng tạo cho AI, gọi là "nhiệt độ" (temperature), trong ngữ cảnh của các mô hình ngôn ngữ lớn là một siêu tham số được sử dụng để điều chỉnh sự ngẫu nhiên và sự sáng tạo của văn bản, nội dung được AI tạo ra. Đây là khái niệm được mượn từ vật lý thống kê và được tích hợp vào hoạt động của các mô hình ngôn ngữ lớn, cho phép người dùng điều chỉnh sự cân bằng giữa sự sáng tạo và tính nhất quán khi yêu cầu AI phản hồi.

AI tạo sinh là bước tiến công nghệ quan trọng nhưng đi kèm với đó là những rủi ro thông tin ngày càng phức tạp. Điều chúng ta chưa biết về vẫn nhiều hơn rất nhiều so với những gì đã nắm rõ, và khoảng cách ấy sẽ còn tiếp tục mở ra khi công nghệ hoàn toàn có thể phát triển nhanh hơn khả năng kiểm soát của con người. Vì vậy, điều quan trọng không chỉ là khai thác được sức mạnh của AI, mà còn phải chủ động đặt ra giới hạn, tiêu chuẩn và cơ chế giám sát.

Thái Hân

Các tin khác

Trinh thám trên không trong thời đại mới

Trinh thám trên không trong thời đại mới

Trinh thám trên không đã và đang là một trong các nhân tố chủ đạo trong chiến tranh hiện đại. Sự xuất hiện dày đặc của nhiều mẫu máy bay không người lái (UAV) phục vụ công tác tình báo, theo dõi và do thám (ISR) trên chiến trường lại càng khẳng định vai trò của trinh thám trên không.

Mặt Trăng đang trở thành chiến trường quyền lực mới

Mặt Trăng đang trở thành chiến trường quyền lực mới

Sau hơn nửa thế kỷ, con người sắp in dấu chân trở lại Mặt Trăng. Tuy nhiên, “lục địa thứ 8” giờ đây đang chật chội hơn trước rất nhiều. Đấy không chỉ là cuộc đối đầu song phương giữa Mỹ và Liên Xô như thời Chiến tranh lạnh, mà đã trở thành một sân chơi đa cực với sự tham gia quyết liệt của nhiều quốc gia và cả những liên minh.

Khi AI vừa là mũi giáo vừa là tấm khiên?

Khi AI vừa là mũi giáo vừa là tấm khiên?

Trí tuệ nhân tạo (AI) đang dần thoát ly khỏi vai trò công cụ hỗ trợ để trở thành tác nhân cốt lõi làm thay đổi diện mạo an ninh mạng toàn cầu. Từ khả năng tìm kiếm lỗ hổng bảo mật với tốc độ ánh sáng của các mô hình ngôn ngữ lớn đến những "tác nhân AI" tự vận hành cuộc tấn công, trí tuệ nhân tạo đang mang đến những thách thức chưa từng có trong lĩnh vực này.

Kinh tế thế giới trước ngã rẽ khủng hoảng đa chiều?

Kinh tế thế giới trước ngã rẽ khủng hoảng đa chiều?

Diễn ra từ ngày 13 tới ngày 18/4, Hội nghị Mùa xuân do Quỹ Tiền tệ Quốc tế (IMF) và Ngân hàng Thế giới (WB) đồng tổ chức thu hút sự tham gia của hơn 190 bộ trưởng tài chính, thống đốc ngân hàng trung ương, cùng hàng nghìn đại diện các tổ chức quốc tế, học giả và doanh nghiệp. Những cuộc thảo luận của giới tài chính toàn cầu ở Washington lần này đã khép lại với những cảm giác ảm đạm, song hành với sự đồng thuận thay đổi rõ rệt trong nhận thức chung: Cộng đồng tài chính quốc tế đã và đang buộc phải chuyển sang chế độ quản lý khủng hoảng, trong khi guồng máy kinh tế thế giới đối mặt với sự rạn nứt cấu trúc sâu sắc, thay vì chỉ là một đợt suy thoái mang tính chu kỳ.

Quân đội Đức và tham vọng làm chủ “chiến trường thủy tinh”

Quân đội Đức và tham vọng làm chủ “chiến trường thủy tinh”

Quân đội Đức đang đẩy nhanh lộ trình tích hợp trí tuệ nhân tạo (AI) và hạ tầng vệ tinh quy mô lớn nhằm biến chiến trường trở nên "trong suốt như thủy tinh". Với tư duy lấy dữ liệu làm trung tâm, họ kỳ vọng sẽ rút ngắn chu kỳ ra quyết định từ nhiều ngày xuống còn vài phút, tạo ra lợi thế áp đảo trước các đối thủ tiềm tàng thông qua khả năng quan sát vượt trội và phản ứng tốc độ cao.

Chuyện “trong nguy có cơ” tại eo biển Hormuz

Chuyện “trong nguy có cơ” tại eo biển Hormuz

Eo biển Hormuz, "yết hầu năng lượng" của thế giới, là nơi chứng kiến khoảng 20 triệu thùng dầu, tương đương 15 - 20% nguồn cung toàn cầu, được trung chuyển mỗi ngày. Kể từ cuối tháng 2/2026, khi xung đột giữa Mỹ, Israel và Iran bùng phát, trật tự quen thuộc nhanh chóng bị phá vỡ. Số lượng tàu qua lại eo biển giảm mạnh, từ khoảng 135 chuyến/ngày xuống chỉ còn trung bình khoảng 6 chuyến/ngày trong tháng 3/2026, thậm chí có thể còn thấp hơn. Thị trường năng lượng chịu một cú sốc nguồn cung rõ rệt, giá dầu Brent tăng mạnh, có thời điểm vượt mốc 100 USD/thùng và kéo theo áp lực lạm phát lan rộng.

Giải mã những vũ khí lần đầu thực chiến trong xung đột tại Iran

Giải mã những vũ khí lần đầu thực chiến trong xung đột tại Iran

Từ hệ thống đánh chặn bằng tia laser Iron Beam, tên lửa PrSM, phi đội drone tự hành Lucas cho tới tên lửa siêu vượt âm Fattah-2, cuộc xung đột tại Iran đã trở thành nơi trình làng hàng loạt vũ khí thế hệ mới. Các khí tài này tham gia rất hiệu quả vào các kịch bản tác chiến cường độ cao, tạo ra những khác biệt rõ rệt trên chiến trường.

Trái đất “cựa mình”, AI sẽ lên tiếng

Trái đất “cựa mình”, AI sẽ lên tiếng

Những vết nứt nhỏ trên bậc thềm, những thân cây nghiêng bất thường hay lớp tuyết lặng lẽ tích tụ trên sườn núi - tất cả từng là dấu hiệu khó nhận biết của thảm họa. Nhưng giờ đây, khi Trái Đất chuyển động, trí tuệ nhân tạo đang giúp con người nhìn thấy những điều tưởng như vô hình, mở ra cơ hội cứu sống hàng nghìn sinh mạng mỗi năm.

Tiền lệ pháp lý định hình lại kỷ nguyên mạng xã hội

Tiền lệ pháp lý định hình lại kỷ nguyên mạng xã hội

Một phán quyết mang tính bước ngoặt tại Mỹ đã lần đầu tiên buộc hai ông lớn ngành công nghệ là Meta và Google phải chịu trách nhiệm không phải vì những gì người dùng đăng tải, mà vì chính cách các nền tảng này được thiết kế để cuốn người trẻ vào những vòng lặp vô tận của màn hình điện thoại. Được ví như "khoảnh khắc thuốc lá" của thế kỷ 21, phán quyết này mở ra làn sóng kiện tụng và siết chặt pháp lý để kiểm soát cách thức các nền tảng số được thiết kế và vận hành.

Khi cỗ máy tự quyết định, ai sẽ là người chịu trách nhiệm?

Khi cỗ máy tự quyết định, ai sẽ là người chịu trách nhiệm?

Vào năm 1942, khi thế giới còn đang chìm trong khói lửa của Chiến tranh thế giới thứ hai, nhà văn khoa học viễn tưởng Isaac Asimov đã thai nghén một ý tưởng đầy tính nhân văn: "Ba định luật Robot". Đó là bộ quy tắc được "cài đặt" trong bộ não của robot để đảm bảo chúng không làm hại con người. Hơn 80 năm sau, thế giới đã bước vào một kỷ nguyên mà những cỗ máy biết tự "suy nghĩ" và "hành động" không còn là nhân vật trong tiểu thuyết. Câu hỏi được đặt ra lúc này là liệu chúng ta có cần một bộ luật tương tự để bảo vệ chính chúng ta khỏi những cỗ máy?

Chiếc kính thiên lý

Chiếc kính thiên lý

Kính thiên lý (kính viễn vọng) được đưa vào Việt Nam sớm nhất qua các giáo sĩ phương Tây và thương nhân trong thời các chúa Nguyễn (thế kỷ XVII - XVIII). Sử sách cho biết, các chúa Nguyễn đã mua loại kính này để phục vụ quân đội và làm phần thưởng cho các tướng lĩnh.

Cuốn lịch và quyền lực của triều đình

Cuốn lịch và quyền lực của triều đình

Thời phong kiến, phạm vi quyền lực triều đình không chỉ được thể hiện qua việc sử dụng niên hiệu, tước phong, tên và cấp địa phương được ban cho, mà còn thể hiện trong việc áp dụng bộ lịch của triều đại ấy.

Đằng sau nghề thương thuyết ransomware

Đằng sau nghề thương thuyết ransomware

Mối họa từ phần mềm độc hại chuyên dùng để tống tiền (ransomware) ngày càng trở nên cấp bách. Công ty Nghiên cứu an ninh mạng Cybersecurity Ventures (Mỹ) thống kê được giá trị thiệt hại mà các doanh nghiệp, tổ chức trên toàn cầu phải chịu vì ransomware đã lên tới 57 tỷ USD trong năm 2025. Ransomware nở rộ cũng kéo ngành an ninh mạng phát triển theo, trong đó nổi bật là lĩnh vực thương thuyết. "Nghề" thương thuyết với tin tặc đang trở nên phổ biến hơn bao giờ hết, đồng thời đóng vai trò quan trọng trong mạng lưới an ninh mạng toàn cầu.

Làn sóng tội phạm mạng thứ năm: Khi AI trở thành “mạch máu” của thế giới ngầm

Làn sóng tội phạm mạng thứ năm: Khi AI trở thành “mạch máu” của thế giới ngầm

Trong vài năm gần đây, công nghệ trí tuệ nhân tạo (AI) đã thúc đẩy một bước chuyển biến chưa từng có trong lịch sử tội phạm mạng: từ công cụ hỗ trợ đến cơ sở hạ tầng cốt lõi của các chiến dịch tấn công quy mô toàn cầu. Quá trình này không chỉ khiến các hệ thống an ninh đối mặt với mức độ tinh vi mới, mà còn đặt ra những thách thức chính sách, pháp luật và thực thi mà chưa một thời đại số nào từng chứng kiến.

Bùng nổ xung đột Pakistan - Afghanistan: Ngọn lửa mâu thuẫn chưa tắt hai bên đường Durand

Bùng nổ xung đột Pakistan - Afghanistan: Ngọn lửa mâu thuẫn chưa tắt hai bên đường Durand

Những cuộc bắn phá ác liệt dọc biên giới Pakistan - Afghanistan những ngày gần đây không phải là một biến cố bất ngờ, mà là sự bùng phát mới của một mâu thuẫn kéo dài hơn một thế kỷ. Từ đường Durand lịch sử, vấn đề sắc tộc Pashtun bị chia cắt, cho tới sự trỗi dậy của các nhóm vũ trang xuyên biên giới sau khi Taliban trở lại nắm quyền năm 2021, nhiều lớp xung đột chồng chéo lên nhau, biến khu vực thành một trong những điểm nóng nguy hiểm nhất của Nam Á.

Tuyển bổ quan lại thực thi pháp luật thời xưa

Tuyển bổ quan lại thực thi pháp luật thời xưa

Ngay từ đầu triều Hậu Lê, Vua Lê Thái Tông đã nói với quần thần rằng: "Phép trị nước lấy hình pháp gọn nhẹ làm gốc. Các quan xét xử phải giữ phép công bằng, không được nhận đút lót mà làm sai, để có người bị oan uổng. Các vụ kiện lớn thì mới cho tâu thẳng lên".

Cơn sốt AI và cuộc thanh lọc cần thiết

Cơn sốt AI và cuộc thanh lọc cần thiết

Sau hơn 3 năm hưng phấn tột độ kể từ cơn địa chấn ChatGPT thu hút sự chú ý của các nhà đầu tư khắp thế giới, cơn sốt trí tuệ nhân tạo (AI) đã bắt đầu lắng xuống. Với một cái nhìn thực tế hơn, giới chuyên môn đã đặt ra một câu hỏi mới: Liệu cơn sốt AI có phải là một bong bóng sắp nổ, hay đây thực sự là nền tảng cho một kỷ nguyên tăng trưởng mới?

Phục dựng di tích điện Kính Thiên?

Phục dựng di tích điện Kính Thiên?

Cuối tháng 12/2025, Trung tâm Bảo tồn Di sản Thăng Long - Hà Nội phối hợp với Viện Khảo cổ học công bố kết quả sơ bộ khai quật khảo cổ khu vực nền điện Kính Thiên năm 2025. Kết quả này cho thấy nhiều thông tin giá trị, bổ khuyết cho nhiều kiến giải trước đây. Nhưng câu hỏi đặt ra là chúng ta đã thực sự đủ cơ sở tư liệu khoa học để góp phần nghiên cứu phục dựng di tích điện Kính Thiên? Câu chuyện này sẽ cần thời gian dài mới có thể trả lời một cách thỏa đáng.

Ngựa trong pháp luật thời xưa

Ngựa trong pháp luật thời xưa

Ngựa là loài vật gần gũi trong cuộc sống người Việt từ lâu, không chỉ dùng để kéo xe mà còn là phương tiện nghi lễ, giao thông và đánh trận, do đó, nó cũng được xuất hiện khá nhiều trong hình luật thời xưa.

Tản mạn Thần Bạch Mã

Tản mạn Thần Bạch Mã

Thần Bạch Mã là vị thần hiện được thờ cúng tại đền Bạch Mã ở phố Hàng Buồm, Hà Nội. Từ thời Lý, đó là ngôi đền trấn phía Đông, tương ứng với đền Quán Thánh trấn phía Bắc, đền Kim Liên trấn phía Nam và đền Voi Phục trấn phía Tây thành Thăng Long.