UNITE -  AI tiên tiến phát hiện video deepfake

Deepfake không chỉ là những khuôn mặt bị hoán đổi nữa mà giờ đây còn bao gồm cả cảnh quan, giọng nói và bối cảnh được tạo ra hoàn toàn giả mạo.

Khi video giả trông giống thật ngày càng dễ tạo và được sử dụng rộng rãi hơn để phát tán thông tin sai lệch, nhắm vào cá nhân và gây hại, một nhóm nhà nghiên cứu tại Đại học California, Riverside (UCR, Mỹ) và Google hợp tác tạo ra UNITE, một hệ thống trí tuệ nhân tạo (AI) tiên tiến cho phép phát hiện video deepfake ngay cả khi không nhìn thấy khuôn mặt.

image001-1754880083737.jpg
UCR và Google xây dựng một AI có khả năng phát hiện deepfake  bằng cách phân tích chuyển động và các manh mối nền, AI này sẽ vạch trần những video giả mạo ẩn mình.

Không giống như những công cụ cũ dựa trên tín hiệu khuôn mặt, UNITE phân tích toàn bộ khung hình video - bao gồm cả chuyển động và sự không nhất quán của nền - để phát hiện nội dung giả mạo hoặc bị thao túng. Khi video do AI tạo ra ngày càng trở nên thuyết phục hơn, hệ thống phát hiện mạnh mẽ này trở nên thiết yếu trong việc bảo vệ các tòa soạn báo chí, nền tảng xã hội và niềm tin của công chúng.

Vạch trần video giả mạo

Amit Roy-Chowdhury, giáo sư kỹ thuật điện, máy tính và nghiên cứu sinh tiến sĩ Rohit Kundu từ Trường Kỹ thuật Marlan và Rosemary Bourns của UCR, hợp tác với một nhóm tại Google xây dựng một mô hình trí tuệ nhân tạo có thể nhận diện thao tác chỉnh sửa video, ngay cả khi nó liên quan đến nhiều thứ hơn là chỉ hoán đổi khuôn mặt đơn giản hoặc thay đổi âm thanh.

Roy-Chowdhury cũng là đồng giám đốc Viện Nghiên cứu và Giáo dục Trí tuệ nhân tạo (RAISE) của UC Riverside, một trung tâm liên ngành mới được thành lập tại UCR. Công cụ này, được gọi là Mạng lưới toàn cầu nhận dạng video giả mạo và tổng hợp (UNITE), hoạt động bằng cách phân tích toàn bộ khung hình video thay vì chỉ tập trung vào khuôn mặt. UNITE kiểm tra mọi chi tiết nền và mô hình chuyển động, khiến nó trở thành một trong những hệ thống đầu tiên có khả năng phát hiện cảnh quay bị chỉnh sửa hoặc hoàn toàn tổng hợp mà không phụ thuộc vào những dấu hiệu trên khuôn mặt.

Kundu phát biểu: “Deepfake đã phát triển. Chúng không chỉ đơn thuần là hoán đổi khuôn mặt nữa. Mọi người giờ đây đang tạo ra những video hoàn toàn giả mạo - từ khuôn mặt đến phông nền - bằng cách sử dụng các mô hình tạo hình mạnh mẽ. Hệ thống của chúng tôi được xây dựng để nắm bắt tất cả những điều đó”.

UNITE ra mắt đúng vào thời điểm mọi công cụ chuyển văn bản thành video và hình ảnh thành video dựa trên AI đang ngày càng dễ dàng tiếp cận trực tuyến. Những công nghệ này cho phép hầu như bất kỳ ai cũng có thể tạo ra những video giả mạo có độ chân thực cao, gây ra những lo ngại đáng kể cho nhân vật của công chúng. Kundu nhận định: “Thật đáng sợ khi thấy những công cụ này dễ tiếp cận đến thế. Bất kỳ ai có kỹ năng ở mức trung bình đều có thể vượt qua bất cứ bộ lọc an toàn nào và tạo ra những video chân thực về những nhân vật của công chúng nói những điều họ chưa từng nói”.

Máy dò không cần khuôn mặt

Kundu giải thích rằng các công cụ phát hiện deepfake trước đây hầu như chỉ tập trung vào những dấu hiệu trên khuôn mặt: “Nếu không có khuôn mặt nào trong khung hình, nhiều máy dò sẽ không hoạt động. Nhưng thông tin sai lệch có thể xuất hiện dưới nhiều hình thức. Việc thay đổi bối cảnh của một cảnh quay cũng có thể dễ dàng bóp méo sự thật”.

Để giải quyết vấn đề này, UNITE sử dụng mô hình học sâu dựa trên bộ biến đổi để phân tích từng đoạn video. UNITE phát hiện những điểm không nhất quán tinh tế về không gian và thời gian - những tín hiệu thường bị bỏ qua bởi các hệ thống trước đây. Mô hình này dựa trên một khuôn khổ AI nền tảng được gọi là SigLIP, có khả năng trích xuất mọi đặc điểm không bị ràng buộc với một người hoặc vật thể cụ thể. Một phương pháp đào tạo mới, được gọi là “mất tập trung do đa dạng sự chú ý”, sẽ nhắc hệ thống theo dõi nhiều vùng thị giác trong mỗi khung hình, ngăn không cho nó chỉ tập trung vào khuôn mặt.

Một mô hình để phát hiện tất cả

Kết quả là một máy dò đa năng có khả năng phát hiện nhiều loại hình giả mạo - từ việc hoán đổi khuôn mặt đơn giản đến các video phức tạp, hoàn toàn tổng hợp được tạo ra mà không có bất kỳ cảnh quay thực nào. Kundu giải thích: “Đây là một mô hình cho phép xử lý tất cả các tình huống này. Đó là lý do tại sao nó có tính phổ quát”.

Nhóm nhà nghiên cứu trình bày phát hiện của họ tại Hội nghị cấp cao năm 2025 về thị giác máy tính và nhận dạng mẫu (CVPR) tại Nashville, Tennessee. Với tiêu đề “Hướng tới một bộ phát hiện video tổng hợp phổ quát: Từ thao tác khuôn mặt hoặc nền đến nội dung hoàn toàn do AI tạo ra”, bài báo do Kundu dẫn đầu, phác thảo kiến trúc và phương pháp đào tạo của UNITE. Nhóm đồng tác giả bao gồm các nhà nghiên cứu của Google là Hao Xiong, Vishal Mohanty và Athula Balachandra. Được đồng tài trợ bởi Hiệp hội Máy tính IEEE và Quỹ Thị giác máy tính, CVPR là một trong những địa điểm xuất bản khoa học có tác động cao nhất trên thế giới.

Sự hợp tác với Google cung cấp quyền truy cập vào các tập dữ liệu mở rộng và tài nguyên điện toán cần thiết để đào tạo mô hình trên nhiều nội dung tổng hợp, bao gồm video được tạo từ văn bản hoặc hình ảnh tĩnh - những định dạng thường làm khó các máy dò hiện có. Mặc dù vẫn đang trong quá trình phát triển, UNITE hứa hẹn sớm đóng vai trò quan trọng trong việc ngăn chặn thông tin sai lệch từ video. Những người dùng tiềm năng bao gồm các nền tảng mạng xã hội, đơn vị kiểm tra thông tin và các tòa soạn đang nỗ lực ngăn chặn video bị thao túng lan truyền.

Kundu kết luận: “Mọi người xứng đáng được biết liệu những gì họ đang thấy có phải là thật hay không. Và khi AI ngày càng giỏi hơn trong việc giả mạo thực tế, chúng ta cũng phải giỏi hơn trong việc phơi bày sự thật”.

Trang Thuần (Tổng hợp)

Các tin khác

Cảm biến lượng tử truy tìm tín hiệu vô tuyến

Cảm biến lượng tử truy tìm tín hiệu vô tuyến

Giữa môi trường tác chiến điện từ ngày càng phức tạp, nơi hàng trăm nguồn phát tín hiệu có thể xuất hiện đồng thời trên chiến trường, quân đội Mỹ đang tìm kiếm những công cụ mới để nâng cao năng lực nhận thức tình huống. Trong nỗ lực đó, các nhà khoa học thuộc Phòng thí nghiệm Nghiên cứu Lục quân Mỹ (ARL) vừa trình diễn một cảm biến lượng tử thế hệ mới có khả năng xác định hướng của trường điện từ tần số vô tuyến trong không gian ba chiều.

UAV cải tiến có thể tự “săn mồi” trong vùng gây nhiễu

UAV cải tiến có thể tự “săn mồi” trong vùng gây nhiễu

Chiến trường tương lai có thể không còn được quyết định bởi số lượng UAV, mà bởi khả năng chúng tiếp tục chiến đấu khi bị "làm mù" và "cắt đứt liên lạc". Một công bố mới từ Trung Quốc về thuật toán AI HG-STR đang thu hút sự chú ý của giới quân sự khi tuyên bố giúp bầy UAV tự phối hợp truy tìm mục tiêu trong môi trường tác chiến điện tử phức tạp.

Bóng đen sau cánh cửa 37 quốc gia

Bóng đen sau cánh cửa 37 quốc gia

Tháng 2/2026, khi Palo Alto Networks công bố báo cáo về một chiến dịch gián điệp mạng quy mô toàn cầu, Pete Renals, Giám đốc Chương trình An ninh quốc gia của Unit 42, đã dùng một so sánh rất nặng. Ông nói với Recorded Future News rằng đây có thể là vụ xâm phạm hạ tầng chính phủ toàn cầu nghiêm trọng nhất do một nhóm được nhà nước hậu thuẫn thực hiện kể từ SolarWinds. So sánh ấy không ồn ào. Nhưng ai từng theo dõi SolarWinds năm 2020 đều hiểu nó nặng đến mức nào.

EU sẽ gia nhập “mặt trận” chip AI

EU sẽ gia nhập “mặt trận” chip AI

EU dự kiến tham gia sáng kiến chip AI do Mỹ khởi xướng, đánh dấu bước dịch chuyển đáng chú ý trong nỗ lực của phương Tây nhằm kiểm soát chuỗi cung ứng công nghệ chiến lược và kiềm chế tham vọng công nghệ của Trung Quốc.

Gián rít Madagascar - trinh sát toàn năng trong tương lai?

Gián rít Madagascar - trinh sát toàn năng trong tương lai?

Công nghệ điện tử - tự động hóa và trí tuệ nhân tạo phát triển, nhiều sản phẩm viễn tưởng bước ra khỏi phim ảnh để vào đời thực. Tiên phong có gián rít Madagascar “côn trùng người máy” đầu tiên của các nhà khoa học Đức.

Số phận của chiếc MQ1-Predator

Số phận của chiếc MQ1-Predator

Nhiệm vụ chính của máy bay không người lái MQ-1 Predator là ngăn chặn và tiến hành trinh sát vũ trang chống lại mục tiêu quan trọng, dễ bị phá hủy. Khi không thực hiện nhiệm vụ chính, MQ-1 sẽ cung cấp hoạt động trinh sát, giám sát và xác định mục tiêu để hỗ trợ chỉ huy Lực lượng Liên hợp.

Thế giới không thể lơ là trước cuộc chiến chống Ebola

Thế giới không thể lơ là trước cuộc chiến chống Ebola

Một “con bệnh” từ những cánh rừng châu Phi lại trỗi dậy, gióng lên hồi chuông cảnh báo về sự mong manh của an ninh y tế toàn cầu. Virus Ebola, với tỷ lệ tử vong cao và khả năng gieo rắc nỗi kinh hoàng đang bùng phát trở lại. Một cuộc chiến mới với ngành y tế thế giới lại bắt đầu.

Nhân tố con người trong kỷ nguyên AI quân sự

Nhân tố con người trong kỷ nguyên AI quân sự

Xu hướng đưa trí tuệ nhân tạo (AI) vào lĩnh vực quân sự ngày càng tăng, nhưng cơ chế quản lý vẫn chưa rõ ràng. Dù mang lại nhiều lợi ích cho ngành tình báo và hậu cần, việc quá phóng đại năng lực AI dễ đẩy cao căng thẳng toàn cầu và gây ra những sai sót hệ thống. Trước thực trạng đó, bà Jacquelyn Schneider, Giám đốc Sáng kiến Mô phỏng Chiến tranh và Khủng hoảng tại Viện Hoover (Đại học Stanford), nhận định rằng kiểm soát an toàn từ khâu phát triển và nâng cao tư duy phản biện cho quân nhân là giải pháp cốt lõi.

Khi AI bước vào chiến trường

Khi AI bước vào chiến trường

Quân đội Mỹ đang phát triển các mô hình AI được huấn luyện dựa trên dữ liệu từ nhiệm vụ thực tế, với mục tiêu triển khai một chatbot AI (trí tuệ nhân tạo) dành riêng cho binh sĩ, cho thấy tham vọng đẩy nhanh ứng dụng AI trong quân sự.

Những bí mật không thể xóa trong dữ liệu ADN

Những bí mật không thể xóa trong dữ liệu ADN

Ngày 23/3/2025, công ty xét nghiệm gen 23andMe nộp đơn xin bảo hộ phá sản theo Chương 11 tại Tòa Phá sản Mỹ khu vực Đông Missouri. Trong vòng 24 giờ, lượng truy cập vào trang web của công ty tăng 526%. Không phải vì khách hàng muốn đọc thông báo phá sản, mà vì hàng triệu người đổ xô vào trang hỗ trợ với một mục đích duy nhất: xóa dữ liệu ADN của mình trước khi chúng bị chuyển giao trong một thương vụ phá sản. Nhưng câu hỏi mà không ai trong số họ có thể trả lời được là: liệu xóa có còn kịp không?

Bộ xương giả và 41 năm tự đánh lừa của khoa học Anh

Bộ xương giả và 41 năm tự đánh lừa của khoa học Anh

Suốt 41 năm, giới khoa học và công chúng đã đặt niềm tin vào một “sự thật” mang tên “Người Piltdown”. Vụ lừa đảo kinh điển này không chỉ phơi bày sự xảo quyệt của một cá nhân, mà còn là lời cảnh báo sâu sắc về những điểm mù của tri thức khi bị dẫn dắt bởi thiên kiến xác nhận và lòng tự tôn dân tộc thái quá.

Bom không nổ hủy diệt hệ thống điện

Bom không nổ hủy diệt hệ thống điện

Lực lượng Nga tại các khu vực tạm chiếm thuộc vùng Donetsk tuyên bố rằng, lực lượng Ukraine đã sử dụng máy bay không người lái (UAV) trang bị bom graphite (than chì) trong các cuộc tấn công ban đêm. Điều này làm dấy lên nhiều câu hỏi về loại vũ khí này, lý do tại sao chúng có thể hiệu quả, và loại máy bay không người lái nào của Ukraine có khả năng mang loại vũ khí này?

Vũ khí “Made in Japan” mở đường tiến ra thị trường toàn cầu

Vũ khí “Made in Japan” mở đường tiến ra thị trường toàn cầu

Sau nhiều thập kỷ tự ràng buộc bởi các chính sách hạn chế nghiêm ngặt, Nhật Bản đã chính thức dỡ bỏ rào cản xuất khẩu vũ khí sát thương. Bước ngoặt này mở ra vận hội mới cho ngành công nghiệp quốc phòng Nhật Bản và đưa các sản phẩm "Made in Japan" vào thị trường vũ khí toàn cầu - một thị trường mà Tokyo chưa từng thực sự đặt chân vào kể từ sau Thế chiến II.

Koral - Tên lửa đất đối không của Ukraine

Koral - Tên lửa đất đối không của Ukraine

Tên lửa đất đối không Koral (đôi khi cũng được viết là Coral) dường như đã ra mắt công chúng như một phần trong loạt hệ thống vũ khí nội địa mới của Ukraine được giới thiệu gần đây.

Những thử nghiệm độc đáo của NASA trong không gian

Những thử nghiệm độc đáo của NASA trong không gian

Các thí nghiệm trên tàu con thoi vũ trụ đã chỉ ra rằng vi khuẩn Salmonella, một nguồn gây ngộ độc thực phẩm phổ biến và đôi khi gây tử vong, trở nên độc hại hơn trong không gian. Đó là nghiên cứu được thực hiện trên chuyến bay STS-115 của tàu Atlantis năm 2006 và STS-123 của tàu Endeavour hai năm sau đó...

Báo động tình trạng ma túy xâm nhập học đường

Báo động tình trạng ma túy xâm nhập học đường

Những lọ tinh dầu nhỏ gọn, mang vẻ ngoài vô hại như dung dịch thuốc nhỏ mắt hay tinh dầu thuốc lá điện tử đang trở thành lớp vỏ ngụy trang tinh vi cho các chất ma túy thế hệ mới. Không chỉ dừng lại ở việc sử dụng, mà đau lòng hơn, nhiều em học sinh còn mua bán, tàng trữ ngay trong môi trường học đường, gióng lên hồi chuông cảnh báo về tình trạng mua bán ma túy ngày càng trẻ hóa.

Hiệu quả chuyển đổi số trong công tác tuyển sinh đầu cấp

Hiệu quả chuyển đổi số trong công tác tuyển sinh đầu cấp

Những ngày gần đây, các địa phương trên cả nước đang tất bật triển khai công tác tuyển sinh đầu cấp. Với thành phố đông dân, tập trung nhiều trường học như Thủ đô Hà Nội, công tác tuyển sinh càng được chú trọng thay đổi; từ khâu đăng ký dự thi, tra cứu thông tin đến công bố kết quả triển khai đồng bộ các nền tảng trực tuyến, mang lại sự thuận tiện và minh bạch hơn cho phụ huynh, học sinh.