Tại sao “dữ liệu” thay đổi thế giới này?

“Năm 2009, một virus cúm mới được phát hiện. Kết hợp yếu tố của các virus gây cúm gà, chủng mới này được gọi là H1N1 đã lây lan nhanh chóng… Tồi tệ hơn là không hề có vắc -xin nào để chống lại virus này. Hy vọng duy nhất của cơ quan y tế là giảm mức lây lan. Nhưng để làm điều đó, họ cần biết bệnh đã lan tới đâu?”.

Đấy là những dòng đầu tiên trong cuốn sách nổi tiếng “Big Data” (Dữ liệu lớn) của hai tác giả Viktor Mayer và Kenneth Cukier. Tại sao người viết lại nhớ đến những dòng này? Chắc chắn rồi, tại vì ở thời điểm này virus Corona cũng đang hoành hành.

Nhưng vấn đề ở đây không liên quan đến bản thân những con virus mà là cái cách thế giới đã thay đổi thông qua câu chuyện về những con virus.

Hãy bắt đầu với câu hỏi mà hai tác giả Viktor Mayer và Kenneth Cukier: họ cần biết dịch đã lan tới đâu. Khác hẳn với virus Corona - con virus mà đến nay chúng ta đã biết chắc là nó xuất phát từ đâu và ổ dịch ở đâu, ở thời điểm 2009, việc xác minh ổ dịch virus H1N1 là một thách thức đối với Trung tâm Kiểm soát và Phòng chống bệnh dịch (CDC). 

Để biết được dịch đang di chuyển tới đâu thì CDC phải đợi các địa phương tổng hợp, báo cáo số lượng người nhiễm bệnh và thường thì sau khi CDC biết chính xác ổ dịch cũng là khi ổ dịch lại lan sang một địa phương mới.

Có nghĩa, cách tổng hợp - thống kê - kết luận kiểu cổ điển đạt hiệu quả rất thấp. Có cách nào khác không? Thời điểm ấy những kỹ sư của Google bỗng nhiên đăng đàn cho hay họ có thể biết khá chính xác đường đi của dịch, và thậm dịch đi đến đâu họ biết luôn đến đấy.

Có thể lúc này trong bạn sẽ xuất hiện hàng loạt câu hỏi: Phải chăng Google có một đội ngũ y bác sĩ siêu việt nào đó? Nó siêu việt hơn cả CDC? Không! Chẳng có đội ngũ y bác sĩ nào từ trên trời chui xuống Google cả. Bí quyết nằm ở chỗ: Mỗi ngày Google nhận được hàng tỉ các câu hỏi của người dùng và thông qua việc phân tích các câu hỏi, họ sẽ biết được ở khu vực nào người ta đang hỏi nhiều nhất về H1N1.

Và sau khi xác định được “những khu vực hỏi nhiều nhất” các mô hình toán học tiếp theo của Google sẽ tiếp tục làm việc để có thể trả lời một cách tương đối chính xác rằng ổ dịch đang nằm ở đâu. Và như thế, chính Google, chứ không phải những nhà chuyên môn về bệnh dịch trong CDC, nắm được những vấn đề nóng hổi mà ai cũng nghĩ sẽ là “độc quyền” của CDC.

Câu chuyện của các kỹ sư Google với đường đi của H1N1 chỉ ra một đặc điểm rất quan trọng trong nhận thức của loài người thời dữ liệu lớn: nhận thức tương quan. Trong mối nhận thức tương quan, chúng ta thấy A thay đổi thì B thay đổi.

Dữ liệu của A càng thay đổi thì dữ liệu của B càng thay đổi. Do vậy người ta có thể nhìn A thông qua B, nếu đấy là một mối tương quan mạnh, chứ không cần trực tiếp phân tích những yếu tố tạo nên A. Trong câu chuyện về dịch cúm ở nước Mỹ thì đường đi của H1N1 chính là A và số liệu của Google chính là B.

Trong trường hợp này, rõ ràng nhìn B để “thấy” A đã nhanh hơn rất nhiều so với việc phải phân tích, thống kê các yếu tố nội tại tạo nên A. Thậm chí, trong một số trường hợp nào đó, việc phân tích A là bất khả thì người ta hoàn toàn vẫn có thể hy vọng hiểu được A thông qua những mối tương quan đủ mạnh của A với B, C, D nào đó.

Khi chúng ta phân tích các yếu tố nội tại của A, có nghĩa là chúng ta đang thực hiện phương pháp phân tích nhân quả. Sở dĩ A có đặc điểm này vì A chịu những tác động này. Và, về cơ bản thì phép phân tích nhân - quả có một ý nghĩa quan trọng trong hệ hình nhận thức của loài người.

Nhưng cũng có rất nhiều trường hợp quan hệ nhân - quả đánh lừa chúng ta. Viktor Mayer và Kenneth Cukier phân tích một câu chuyện cụ thể diễn ra ở nước Pháp vào năm 1885. Khi ấy một cậu bé bị chó dại cắn được giới thiệu đến gặp Luis Pasteur và được Luis Pasteur tiêm vắc-xin phòng dại. Kết quả, chú bé sống sót.

Lập tức trong đầu chúng ta sẽ nảy lên một phân tích nhân quả: Chú bé đó sống sót (quả) vì đã được tiêm vắc-xin của Luis Pasteur. Rồi cứ thế, chúng ta sẽ có xu thế khái quát hóa nhận thức nhân quả của mình: muốn không mắc bệnh dại sau khi bị chó dại cắn thì nhất định phải được tiêm vắc-xin phòng dại.

Tuy nhiên, khi bắt đầu mở rộng số liệu nghiên cứu, không phải là một cậu bé bị chó dại cắn nữa mà là 10 trường hợp bị chó dại cắn, rồi cả trăm, cả ngàn trường hợp bị chó dại cắn, giới y học kết luận rằng: Trung bình chỉ có một trong 7 người bị chó dại cắn là mắc bệnh mà thôi. Và như thế cũng có nghĩa cái nhận thức nhân - quả của chúng ta trong trường hợp này không đúng tuyệt đối như chúng ta vẫn tưởng.

Khi các dữ liệu phân tích được mở rộng và khi mà thời đại “dữ liệu lớn” chính thức hình thành, con người có xu thế đặt cạnh các mối quan hệ nhân quả một mối quan hệ mới: mối quan hệ tương quan và qua đó đặt cạnh những phương pháp phân tích tuyến tính một phương pháp phân tích mới: phi tuyến tính.

Hẳn nhiên để có thể sử dụng tối ưu nhận thức tương quan và phương pháp phi tuyến tính, người ta phải xác lập được những tương quan đủ mạnh. Còn với những tương quan yếu, ngay cả khi có ti tỉ các dữ liệu, cũng khó có thể đưa ra những kết luận đáng kể nào.

Nhưng như thế nào mới là một tương quan mạnh? Mối tương quan giữa đường đi của H1N1 với xu thế tra cứu Google rõ ràng là một mối tương quan mạnh. Nhưng mối tương quan giữa tần suất nói của một người và chỉ số hạnh phúc của người đó có phải là mạnh không? Mối tương quan giữa số lượng lông chân của một cô gái với khả năng lấy chồng của cô gái ấy có phải là mạnh không?

Mối tương quan giữa thói quen chơi thể thao, lướt web của một người với tình trạng bệnh tật cơ bản (vốn chỉ được biết qua các xét nghiệm máu và nước tiểu) có phải là mạnh không? Trong một số trường hợp chúng ta có thể dễ thấy và trả lời ngay nhưng trong một số trường hợp khác thì thật sự chỉ có những chuyên gia dữ liệu mới biết câu trả lời chính xác.

Có thể phân thích mối tương quan khiến chúng ta bất tin nhất trong những ví dụ nêu trên: Mối tương quan giữa thói quen chơi thể thao, lướt web của một người với tình trạng bệnh tật cơ bản của người đó. Aviva, một công ty bảo hiểm lớn tại Mỹ đã nghiên cứu ý tưởng về mối quan hệ tương quan này.

Theo đó họ sẽ sử dụng một tập các dữ liệu về lối sống bao gồm hàng trăm biến khác nhau của một khác hàng: từ thói quen chơi thể thao, lướt web, đến ước tính thu nhập... để đưa ra những dự báo xem khách hàng có mắc các bệnh như tiểu đường, cao huyết áp hay trầm cảm không.

“Những công ty bảo hiểm khác Prudential và AIG đã xem xét các sáng kiến tương tự. Lợi ích là nó giúp người nộp đơn xin bảo hiểm tránh được việc phải cung cấp mẫu máu và nước tiểu mà chẳng ai thích và các công ty bảo hiểm lại phải trả tiền cho việc đó. Chi phí xét nghiệm khoảng 125 USD/người trong khi các phương pháp tiếp cận hoàn toàn dựa trên dữ liệu chỉ tốn khoảng 5 USD” -  Viktor Mayer và Kenneth Cukier cho biết.

Rõ ràng là thời đại của dữ liệu lớn với sự lên ngôi của các thuật toán đã và đang làm thay đổi thế giới này!

Phan Mỹ Chí

Các tin khác

Trinh thám trên không trong thời đại mới

Trinh thám trên không trong thời đại mới

Trinh thám trên không đã và đang là một trong các nhân tố chủ đạo trong chiến tranh hiện đại. Sự xuất hiện dày đặc của nhiều mẫu máy bay không người lái (UAV) phục vụ công tác tình báo, theo dõi và do thám (ISR) trên chiến trường lại càng khẳng định vai trò của trinh thám trên không.

Mặt Trăng đang trở thành chiến trường quyền lực mới

Mặt Trăng đang trở thành chiến trường quyền lực mới

Sau hơn nửa thế kỷ, con người sắp in dấu chân trở lại Mặt Trăng. Tuy nhiên, “lục địa thứ 8” giờ đây đang chật chội hơn trước rất nhiều. Đấy không chỉ là cuộc đối đầu song phương giữa Mỹ và Liên Xô như thời Chiến tranh lạnh, mà đã trở thành một sân chơi đa cực với sự tham gia quyết liệt của nhiều quốc gia và cả những liên minh.

Khi AI vừa là mũi giáo vừa là tấm khiên?

Khi AI vừa là mũi giáo vừa là tấm khiên?

Trí tuệ nhân tạo (AI) đang dần thoát ly khỏi vai trò công cụ hỗ trợ để trở thành tác nhân cốt lõi làm thay đổi diện mạo an ninh mạng toàn cầu. Từ khả năng tìm kiếm lỗ hổng bảo mật với tốc độ ánh sáng của các mô hình ngôn ngữ lớn đến những "tác nhân AI" tự vận hành cuộc tấn công, trí tuệ nhân tạo đang mang đến những thách thức chưa từng có trong lĩnh vực này.

Kinh tế thế giới trước ngã rẽ khủng hoảng đa chiều?

Kinh tế thế giới trước ngã rẽ khủng hoảng đa chiều?

Diễn ra từ ngày 13 tới ngày 18/4, Hội nghị Mùa xuân do Quỹ Tiền tệ Quốc tế (IMF) và Ngân hàng Thế giới (WB) đồng tổ chức thu hút sự tham gia của hơn 190 bộ trưởng tài chính, thống đốc ngân hàng trung ương, cùng hàng nghìn đại diện các tổ chức quốc tế, học giả và doanh nghiệp. Những cuộc thảo luận của giới tài chính toàn cầu ở Washington lần này đã khép lại với những cảm giác ảm đạm, song hành với sự đồng thuận thay đổi rõ rệt trong nhận thức chung: Cộng đồng tài chính quốc tế đã và đang buộc phải chuyển sang chế độ quản lý khủng hoảng, trong khi guồng máy kinh tế thế giới đối mặt với sự rạn nứt cấu trúc sâu sắc, thay vì chỉ là một đợt suy thoái mang tính chu kỳ.

Quân đội Đức và tham vọng làm chủ “chiến trường thủy tinh”

Quân đội Đức và tham vọng làm chủ “chiến trường thủy tinh”

Quân đội Đức đang đẩy nhanh lộ trình tích hợp trí tuệ nhân tạo (AI) và hạ tầng vệ tinh quy mô lớn nhằm biến chiến trường trở nên "trong suốt như thủy tinh". Với tư duy lấy dữ liệu làm trung tâm, họ kỳ vọng sẽ rút ngắn chu kỳ ra quyết định từ nhiều ngày xuống còn vài phút, tạo ra lợi thế áp đảo trước các đối thủ tiềm tàng thông qua khả năng quan sát vượt trội và phản ứng tốc độ cao.

Chuyện “trong nguy có cơ” tại eo biển Hormuz

Chuyện “trong nguy có cơ” tại eo biển Hormuz

Eo biển Hormuz, "yết hầu năng lượng" của thế giới, là nơi chứng kiến khoảng 20 triệu thùng dầu, tương đương 15 - 20% nguồn cung toàn cầu, được trung chuyển mỗi ngày. Kể từ cuối tháng 2/2026, khi xung đột giữa Mỹ, Israel và Iran bùng phát, trật tự quen thuộc nhanh chóng bị phá vỡ. Số lượng tàu qua lại eo biển giảm mạnh, từ khoảng 135 chuyến/ngày xuống chỉ còn trung bình khoảng 6 chuyến/ngày trong tháng 3/2026, thậm chí có thể còn thấp hơn. Thị trường năng lượng chịu một cú sốc nguồn cung rõ rệt, giá dầu Brent tăng mạnh, có thời điểm vượt mốc 100 USD/thùng và kéo theo áp lực lạm phát lan rộng.

Giải mã những vũ khí lần đầu thực chiến trong xung đột tại Iran

Giải mã những vũ khí lần đầu thực chiến trong xung đột tại Iran

Từ hệ thống đánh chặn bằng tia laser Iron Beam, tên lửa PrSM, phi đội drone tự hành Lucas cho tới tên lửa siêu vượt âm Fattah-2, cuộc xung đột tại Iran đã trở thành nơi trình làng hàng loạt vũ khí thế hệ mới. Các khí tài này tham gia rất hiệu quả vào các kịch bản tác chiến cường độ cao, tạo ra những khác biệt rõ rệt trên chiến trường.

Trái đất “cựa mình”, AI sẽ lên tiếng

Trái đất “cựa mình”, AI sẽ lên tiếng

Những vết nứt nhỏ trên bậc thềm, những thân cây nghiêng bất thường hay lớp tuyết lặng lẽ tích tụ trên sườn núi - tất cả từng là dấu hiệu khó nhận biết của thảm họa. Nhưng giờ đây, khi Trái Đất chuyển động, trí tuệ nhân tạo đang giúp con người nhìn thấy những điều tưởng như vô hình, mở ra cơ hội cứu sống hàng nghìn sinh mạng mỗi năm.

Tiền lệ pháp lý định hình lại kỷ nguyên mạng xã hội

Tiền lệ pháp lý định hình lại kỷ nguyên mạng xã hội

Một phán quyết mang tính bước ngoặt tại Mỹ đã lần đầu tiên buộc hai ông lớn ngành công nghệ là Meta và Google phải chịu trách nhiệm không phải vì những gì người dùng đăng tải, mà vì chính cách các nền tảng này được thiết kế để cuốn người trẻ vào những vòng lặp vô tận của màn hình điện thoại. Được ví như "khoảnh khắc thuốc lá" của thế kỷ 21, phán quyết này mở ra làn sóng kiện tụng và siết chặt pháp lý để kiểm soát cách thức các nền tảng số được thiết kế và vận hành.

Khi cỗ máy tự quyết định, ai sẽ là người chịu trách nhiệm?

Khi cỗ máy tự quyết định, ai sẽ là người chịu trách nhiệm?

Vào năm 1942, khi thế giới còn đang chìm trong khói lửa của Chiến tranh thế giới thứ hai, nhà văn khoa học viễn tưởng Isaac Asimov đã thai nghén một ý tưởng đầy tính nhân văn: "Ba định luật Robot". Đó là bộ quy tắc được "cài đặt" trong bộ não của robot để đảm bảo chúng không làm hại con người. Hơn 80 năm sau, thế giới đã bước vào một kỷ nguyên mà những cỗ máy biết tự "suy nghĩ" và "hành động" không còn là nhân vật trong tiểu thuyết. Câu hỏi được đặt ra lúc này là liệu chúng ta có cần một bộ luật tương tự để bảo vệ chính chúng ta khỏi những cỗ máy?

Chiếc kính thiên lý

Chiếc kính thiên lý

Kính thiên lý (kính viễn vọng) được đưa vào Việt Nam sớm nhất qua các giáo sĩ phương Tây và thương nhân trong thời các chúa Nguyễn (thế kỷ XVII - XVIII). Sử sách cho biết, các chúa Nguyễn đã mua loại kính này để phục vụ quân đội và làm phần thưởng cho các tướng lĩnh.

Cuốn lịch và quyền lực của triều đình

Cuốn lịch và quyền lực của triều đình

Thời phong kiến, phạm vi quyền lực triều đình không chỉ được thể hiện qua việc sử dụng niên hiệu, tước phong, tên và cấp địa phương được ban cho, mà còn thể hiện trong việc áp dụng bộ lịch của triều đại ấy.

Đằng sau nghề thương thuyết ransomware

Đằng sau nghề thương thuyết ransomware

Mối họa từ phần mềm độc hại chuyên dùng để tống tiền (ransomware) ngày càng trở nên cấp bách. Công ty Nghiên cứu an ninh mạng Cybersecurity Ventures (Mỹ) thống kê được giá trị thiệt hại mà các doanh nghiệp, tổ chức trên toàn cầu phải chịu vì ransomware đã lên tới 57 tỷ USD trong năm 2025. Ransomware nở rộ cũng kéo ngành an ninh mạng phát triển theo, trong đó nổi bật là lĩnh vực thương thuyết. "Nghề" thương thuyết với tin tặc đang trở nên phổ biến hơn bao giờ hết, đồng thời đóng vai trò quan trọng trong mạng lưới an ninh mạng toàn cầu.

Làn sóng tội phạm mạng thứ năm: Khi AI trở thành “mạch máu” của thế giới ngầm

Làn sóng tội phạm mạng thứ năm: Khi AI trở thành “mạch máu” của thế giới ngầm

Trong vài năm gần đây, công nghệ trí tuệ nhân tạo (AI) đã thúc đẩy một bước chuyển biến chưa từng có trong lịch sử tội phạm mạng: từ công cụ hỗ trợ đến cơ sở hạ tầng cốt lõi của các chiến dịch tấn công quy mô toàn cầu. Quá trình này không chỉ khiến các hệ thống an ninh đối mặt với mức độ tinh vi mới, mà còn đặt ra những thách thức chính sách, pháp luật và thực thi mà chưa một thời đại số nào từng chứng kiến.

Bùng nổ xung đột Pakistan - Afghanistan: Ngọn lửa mâu thuẫn chưa tắt hai bên đường Durand

Bùng nổ xung đột Pakistan - Afghanistan: Ngọn lửa mâu thuẫn chưa tắt hai bên đường Durand

Những cuộc bắn phá ác liệt dọc biên giới Pakistan - Afghanistan những ngày gần đây không phải là một biến cố bất ngờ, mà là sự bùng phát mới của một mâu thuẫn kéo dài hơn một thế kỷ. Từ đường Durand lịch sử, vấn đề sắc tộc Pashtun bị chia cắt, cho tới sự trỗi dậy của các nhóm vũ trang xuyên biên giới sau khi Taliban trở lại nắm quyền năm 2021, nhiều lớp xung đột chồng chéo lên nhau, biến khu vực thành một trong những điểm nóng nguy hiểm nhất của Nam Á.

Tuyển bổ quan lại thực thi pháp luật thời xưa

Tuyển bổ quan lại thực thi pháp luật thời xưa

Ngay từ đầu triều Hậu Lê, Vua Lê Thái Tông đã nói với quần thần rằng: "Phép trị nước lấy hình pháp gọn nhẹ làm gốc. Các quan xét xử phải giữ phép công bằng, không được nhận đút lót mà làm sai, để có người bị oan uổng. Các vụ kiện lớn thì mới cho tâu thẳng lên".

Cơn sốt AI và cuộc thanh lọc cần thiết

Cơn sốt AI và cuộc thanh lọc cần thiết

Sau hơn 3 năm hưng phấn tột độ kể từ cơn địa chấn ChatGPT thu hút sự chú ý của các nhà đầu tư khắp thế giới, cơn sốt trí tuệ nhân tạo (AI) đã bắt đầu lắng xuống. Với một cái nhìn thực tế hơn, giới chuyên môn đã đặt ra một câu hỏi mới: Liệu cơn sốt AI có phải là một bong bóng sắp nổ, hay đây thực sự là nền tảng cho một kỷ nguyên tăng trưởng mới?

Phục dựng di tích điện Kính Thiên?

Phục dựng di tích điện Kính Thiên?

Cuối tháng 12/2025, Trung tâm Bảo tồn Di sản Thăng Long - Hà Nội phối hợp với Viện Khảo cổ học công bố kết quả sơ bộ khai quật khảo cổ khu vực nền điện Kính Thiên năm 2025. Kết quả này cho thấy nhiều thông tin giá trị, bổ khuyết cho nhiều kiến giải trước đây. Nhưng câu hỏi đặt ra là chúng ta đã thực sự đủ cơ sở tư liệu khoa học để góp phần nghiên cứu phục dựng di tích điện Kính Thiên? Câu chuyện này sẽ cần thời gian dài mới có thể trả lời một cách thỏa đáng.

Ngựa trong pháp luật thời xưa

Ngựa trong pháp luật thời xưa

Ngựa là loài vật gần gũi trong cuộc sống người Việt từ lâu, không chỉ dùng để kéo xe mà còn là phương tiện nghi lễ, giao thông và đánh trận, do đó, nó cũng được xuất hiện khá nhiều trong hình luật thời xưa.

Tản mạn Thần Bạch Mã

Tản mạn Thần Bạch Mã

Thần Bạch Mã là vị thần hiện được thờ cúng tại đền Bạch Mã ở phố Hàng Buồm, Hà Nội. Từ thời Lý, đó là ngôi đền trấn phía Đông, tương ứng với đền Quán Thánh trấn phía Bắc, đền Kim Liên trấn phía Nam và đền Voi Phục trấn phía Tây thành Thăng Long.