Tại sao “dữ liệu” thay đổi thế giới này?

“Năm 2009, một virus cúm mới được phát hiện. Kết hợp yếu tố của các virus gây cúm gà, chủng mới này được gọi là H1N1 đã lây lan nhanh chóng… Tồi tệ hơn là không hề có vắc -xin nào để chống lại virus này. Hy vọng duy nhất của cơ quan y tế là giảm mức lây lan. Nhưng để làm điều đó, họ cần biết bệnh đã lan tới đâu?”.

Đấy là những dòng đầu tiên trong cuốn sách nổi tiếng “Big Data” (Dữ liệu lớn) của hai tác giả Viktor Mayer và Kenneth Cukier. Tại sao người viết lại nhớ đến những dòng này? Chắc chắn rồi, tại vì ở thời điểm này virus Corona cũng đang hoành hành.

Nhưng vấn đề ở đây không liên quan đến bản thân những con virus mà là cái cách thế giới đã thay đổi thông qua câu chuyện về những con virus.

Hãy bắt đầu với câu hỏi mà hai tác giả Viktor Mayer và Kenneth Cukier: họ cần biết dịch đã lan tới đâu. Khác hẳn với virus Corona - con virus mà đến nay chúng ta đã biết chắc là nó xuất phát từ đâu và ổ dịch ở đâu, ở thời điểm 2009, việc xác minh ổ dịch virus H1N1 là một thách thức đối với Trung tâm Kiểm soát và Phòng chống bệnh dịch (CDC). 

Để biết được dịch đang di chuyển tới đâu thì CDC phải đợi các địa phương tổng hợp, báo cáo số lượng người nhiễm bệnh và thường thì sau khi CDC biết chính xác ổ dịch cũng là khi ổ dịch lại lan sang một địa phương mới.

Có nghĩa, cách tổng hợp - thống kê - kết luận kiểu cổ điển đạt hiệu quả rất thấp. Có cách nào khác không? Thời điểm ấy những kỹ sư của Google bỗng nhiên đăng đàn cho hay họ có thể biết khá chính xác đường đi của dịch, và thậm dịch đi đến đâu họ biết luôn đến đấy.

Có thể lúc này trong bạn sẽ xuất hiện hàng loạt câu hỏi: Phải chăng Google có một đội ngũ y bác sĩ siêu việt nào đó? Nó siêu việt hơn cả CDC? Không! Chẳng có đội ngũ y bác sĩ nào từ trên trời chui xuống Google cả. Bí quyết nằm ở chỗ: Mỗi ngày Google nhận được hàng tỉ các câu hỏi của người dùng và thông qua việc phân tích các câu hỏi, họ sẽ biết được ở khu vực nào người ta đang hỏi nhiều nhất về H1N1.

Và sau khi xác định được “những khu vực hỏi nhiều nhất” các mô hình toán học tiếp theo của Google sẽ tiếp tục làm việc để có thể trả lời một cách tương đối chính xác rằng ổ dịch đang nằm ở đâu. Và như thế, chính Google, chứ không phải những nhà chuyên môn về bệnh dịch trong CDC, nắm được những vấn đề nóng hổi mà ai cũng nghĩ sẽ là “độc quyền” của CDC.

Câu chuyện của các kỹ sư Google với đường đi của H1N1 chỉ ra một đặc điểm rất quan trọng trong nhận thức của loài người thời dữ liệu lớn: nhận thức tương quan. Trong mối nhận thức tương quan, chúng ta thấy A thay đổi thì B thay đổi.

Dữ liệu của A càng thay đổi thì dữ liệu của B càng thay đổi. Do vậy người ta có thể nhìn A thông qua B, nếu đấy là một mối tương quan mạnh, chứ không cần trực tiếp phân tích những yếu tố tạo nên A. Trong câu chuyện về dịch cúm ở nước Mỹ thì đường đi của H1N1 chính là A và số liệu của Google chính là B.

Trong trường hợp này, rõ ràng nhìn B để “thấy” A đã nhanh hơn rất nhiều so với việc phải phân tích, thống kê các yếu tố nội tại tạo nên A. Thậm chí, trong một số trường hợp nào đó, việc phân tích A là bất khả thì người ta hoàn toàn vẫn có thể hy vọng hiểu được A thông qua những mối tương quan đủ mạnh của A với B, C, D nào đó.

Khi chúng ta phân tích các yếu tố nội tại của A, có nghĩa là chúng ta đang thực hiện phương pháp phân tích nhân quả. Sở dĩ A có đặc điểm này vì A chịu những tác động này. Và, về cơ bản thì phép phân tích nhân - quả có một ý nghĩa quan trọng trong hệ hình nhận thức của loài người.

Nhưng cũng có rất nhiều trường hợp quan hệ nhân - quả đánh lừa chúng ta. Viktor Mayer và Kenneth Cukier phân tích một câu chuyện cụ thể diễn ra ở nước Pháp vào năm 1885. Khi ấy một cậu bé bị chó dại cắn được giới thiệu đến gặp Luis Pasteur và được Luis Pasteur tiêm vắc-xin phòng dại. Kết quả, chú bé sống sót.

Lập tức trong đầu chúng ta sẽ nảy lên một phân tích nhân quả: Chú bé đó sống sót (quả) vì đã được tiêm vắc-xin của Luis Pasteur. Rồi cứ thế, chúng ta sẽ có xu thế khái quát hóa nhận thức nhân quả của mình: muốn không mắc bệnh dại sau khi bị chó dại cắn thì nhất định phải được tiêm vắc-xin phòng dại.

Tuy nhiên, khi bắt đầu mở rộng số liệu nghiên cứu, không phải là một cậu bé bị chó dại cắn nữa mà là 10 trường hợp bị chó dại cắn, rồi cả trăm, cả ngàn trường hợp bị chó dại cắn, giới y học kết luận rằng: Trung bình chỉ có một trong 7 người bị chó dại cắn là mắc bệnh mà thôi. Và như thế cũng có nghĩa cái nhận thức nhân - quả của chúng ta trong trường hợp này không đúng tuyệt đối như chúng ta vẫn tưởng.

Khi các dữ liệu phân tích được mở rộng và khi mà thời đại “dữ liệu lớn” chính thức hình thành, con người có xu thế đặt cạnh các mối quan hệ nhân quả một mối quan hệ mới: mối quan hệ tương quan và qua đó đặt cạnh những phương pháp phân tích tuyến tính một phương pháp phân tích mới: phi tuyến tính.

Hẳn nhiên để có thể sử dụng tối ưu nhận thức tương quan và phương pháp phi tuyến tính, người ta phải xác lập được những tương quan đủ mạnh. Còn với những tương quan yếu, ngay cả khi có ti tỉ các dữ liệu, cũng khó có thể đưa ra những kết luận đáng kể nào.

Nhưng như thế nào mới là một tương quan mạnh? Mối tương quan giữa đường đi của H1N1 với xu thế tra cứu Google rõ ràng là một mối tương quan mạnh. Nhưng mối tương quan giữa tần suất nói của một người và chỉ số hạnh phúc của người đó có phải là mạnh không? Mối tương quan giữa số lượng lông chân của một cô gái với khả năng lấy chồng của cô gái ấy có phải là mạnh không?

Mối tương quan giữa thói quen chơi thể thao, lướt web của một người với tình trạng bệnh tật cơ bản (vốn chỉ được biết qua các xét nghiệm máu và nước tiểu) có phải là mạnh không? Trong một số trường hợp chúng ta có thể dễ thấy và trả lời ngay nhưng trong một số trường hợp khác thì thật sự chỉ có những chuyên gia dữ liệu mới biết câu trả lời chính xác.

Có thể phân thích mối tương quan khiến chúng ta bất tin nhất trong những ví dụ nêu trên: Mối tương quan giữa thói quen chơi thể thao, lướt web của một người với tình trạng bệnh tật cơ bản của người đó. Aviva, một công ty bảo hiểm lớn tại Mỹ đã nghiên cứu ý tưởng về mối quan hệ tương quan này.

Theo đó họ sẽ sử dụng một tập các dữ liệu về lối sống bao gồm hàng trăm biến khác nhau của một khác hàng: từ thói quen chơi thể thao, lướt web, đến ước tính thu nhập... để đưa ra những dự báo xem khách hàng có mắc các bệnh như tiểu đường, cao huyết áp hay trầm cảm không.

“Những công ty bảo hiểm khác Prudential và AIG đã xem xét các sáng kiến tương tự. Lợi ích là nó giúp người nộp đơn xin bảo hiểm tránh được việc phải cung cấp mẫu máu và nước tiểu mà chẳng ai thích và các công ty bảo hiểm lại phải trả tiền cho việc đó. Chi phí xét nghiệm khoảng 125 USD/người trong khi các phương pháp tiếp cận hoàn toàn dựa trên dữ liệu chỉ tốn khoảng 5 USD” -  Viktor Mayer và Kenneth Cukier cho biết.

Rõ ràng là thời đại của dữ liệu lớn với sự lên ngôi của các thuật toán đã và đang làm thay đổi thế giới này!

Phan Mỹ Chí

Các tin khác

Cận cảnh bên trong máy tính lượng tử Hanyuan-2. Ảnh: Quantum Computing Report

Dấu mốc mới trong cuộc đua lượng tử toàn cầu

Khi công ty CAS Cold Atom Technology của Trung Quốc công bố Hanyuan-2, hệ thống máy tính lượng tử lõi kép đầu tiên, cuộc đua toàn cầu dường như đã bước sang một giai đoạn mới. Từ Washington tới Bắc Kinh, từ Paris tới London, các chính phủ và tập đoàn công nghệ đang đổ hàng tỷ USD vào lĩnh vực sẽ định hình thế hệ điện toán tiếp theo của thế giới.

Mục tiêu “netzero” và lực cản từ khủng hoảng năng lượng

Mục tiêu “netzero” và lực cản từ khủng hoảng năng lượng

Các cam kết phát thải ròng bằng 0 (Net Zero), chính sách “xanh” với những mục tiêu quyết đoán cùng các tuyên bố mạnh mẽ của chính giới, làn sóng đầu tư vào năng lượng tái tạo cùng áp lực cắt giảm khí thải carbon khiến than đá, loại nhiên liệu từng là động lực cho các cuộc cách mạng công nghiệp dường như đang dần bị đẩy ra bên lề.

Nhưng trước các cú sốc địa chính trị, khủng hoảng năng lượng khi nguồn cung gián đoạn, và đặc biệt là nhu cầu điện tăng vọt do tăng trưởng kinh tế cũng như sự bùng nổ của trí tuệ nhân tạo (AI), than đá một lần nữa được nhắc đến như giải pháp an ninh năng lượng. Liệu thế giới có thể thực sự rời bỏ than đá? Quá trình chuyển đổi xanh trên thực tế dường như mong manh hơn nhiều so với những tuyên bố chính trị?

Máy bay diệt drone triển vọng đến đâu?

Máy bay diệt drone triển vọng đến đâu?

Một trong những bước thay đổi lớn của chiến tranh trong vòng mười năm trở lại đây là sự lên ngôi của máy bay không người lái (UAV). Những chiếc máy bay cho vào vali được mà có thể đảm nhận nhiệm vụ trinh thám, tiêu diệt mục tiêu, v.v… không kém gì các loại khí tài đắt tiền. Nhờ UAV mà các lực lượng phiến quân có thể tham gia cuộc chiến trên không chứ không còn phải chịu cảnh hoàn toàn lép vế trước quân đội chính quy. Tất nhiên là việc sử dụng drone hàng loạt cũng kéo theo hoạt động phát triển vũ khí diệt drone. Nhưng sử dụng máy bay - cả loại có và không có người lái - để tiêu diệt UAV có là giải pháp hữu hiệu?

Mỹ ngầm đổi “luật chơi” trong cuộc chiến chống ma tuý?

Mỹ ngầm đổi “luật chơi” trong cuộc chiến chống ma tuý?

Một cuộc chiến bí mật được cho là đang leo thang mạnh mẽ dọc theo biên giới Nam Mỹ. Theo CNN và hãng thông tấn Anadolu, ngày càng nhiều thông tin và nghi vấn cho rằng CIA đang tham gia sâu hơn vào các hoạt động nhằm vào mạng lưới băng đảng ma túy tại Mexico. Những thay đổi chiến lược trở nên rõ nét hơn khi chính quyền Mỹ nhìn nhận các tổ chức tội phạm xuyên quốc gia này như những mối đe dọa an ninh có tính khủng bố, qua đó mở đường cho các hoạt động tình báo và bán quân sự tinh vi hơn trên lãnh thổ nước láng giềng.

Lầu Năm Góc giải mật UFO: Bên trong kho hồ sơ mật bị phong kín 80 năm

Lầu Năm Góc giải mật UFO: Bên trong kho hồ sơ mật bị phong kín 80 năm

Sau gần 80 năm trong các kho lưu trữ mật của quân đội Mỹ, hàng trăm hồ sơ về UFO (vật thể bay không xác định) vừa lần đầu được Lầu Năm Góc công khai trước thế giới. Không có “xác người ngoài hành tinh” hay bằng chứng về những cuộc đổ bộ từ vũ trụ, nhưng các đoạn phim hồng ngoại, ghi âm và lời kể của phi công đang mở ra cuộc tranh luận lớn nhất nhiều thập niên qua về những vật thể bí ẩn mà ngay cả Washington cũng chưa thể giải thích.

“Đốm lửa” chiến tranh đã rơi gần những lò phản ứng

“Đốm lửa” chiến tranh đã rơi gần những lò phản ứng

Cuộc tấn công bằng drone vào nhà máy điện hạt nhân Barakah của UAE hôm 17/5 chỉ gây ra thiệt hại nhỏ. Nhưng dư chấn thì rất lớn, khi nó cho thấy ranh giới giữa một vụ tấn công “suýt trúng” với một thảm họa phóng xạ đang ngày càng mong manh, trong bối cảnh bất ổn địa chính trị bủa vây Trung Đông như hiện nay.

Thế giới đã sẵn sàng cho đại dịch tiếp theo?

Thế giới đã sẵn sàng cho đại dịch tiếp theo?

Khi con tàu du lịch MV Hondius rời cảng Ushuaia, Argentina vào ngày 1/4/2026, không ai trên tàu có thể ngờ rằng họ sắp trở thành tâm điểm của một cuộc khủng hoảng y tế toàn cầu. Sau bốn tuần, ba hành khách đã tử vong, nhiều người khác nguy kịch, cuộc truy vết phức tạp được tiến hành. Ổ dịch virus Hanta trên con tàu này không chỉ là một thảm kịch đơn lẻ, nó đã trở thành phép thử mới đối với khả năng chống chịu của hệ thống y tế toàn cầu trong bối cảnh chúng ta vẫn đang loay hoay tìm kiếm sự đồng thuận để đối phó với những đại dịch mới.

Sau hơn 30 năm lại nói về chuyện quốc phục

Sau hơn 30 năm lại nói về chuyện quốc phục

Nói về quốc phục hay cao hơn là bàn tới câu chuyện quốc phục ở nước ta có lẽ rất khó ấn định được thời điểm chính xác, bởi mỗi giai đoạn lại bùng lên rồi xẹp xuống, hòa tan trong vô vàn sự kiện, hoạt động... Những ngày gần đây, thông qua một hoạt động mang tính lễ nghi cấp Nhà nước, vấn đề cần có một bộ quốc phục, lễ phục mang tính thành quy lại xôn xao dư luận, khiến nhiều nhà nghiên cứu lịch sử, văn hóa trăn trở, đặt câu hỏi: “Tại sao, đến hôm nay, chúng ta vẫn còn băn khoăn đi tìm quốc phục?”.

Cây giáo trên tay vua

Cây giáo trên tay vua

Giáo là món vũ khí “kinh điển” của thời cổ đại, vì nó dễ chế tạo, dễ huấn luyện và được sử dụng rất linh hoạt. Ngoài binh lính, có những vị vua nước Việt cũng từng cầm giáo làm vũ khí, và có vị còn... ra đi vì mũi giáo.

Trí tuệ nhân tạo âm thầm tàn phá môi trường

Trí tuệ nhân tạo âm thầm tàn phá môi trường

Trí tuệ nhân tạo (AI) đang âm thầm thúc đẩy sự mở rộng của nhiên liệu hóa thạch, giúp một số quốc gia gây ô nhiễm lớn nhất thế giới khoan và khai thác nhiều dầu khí hơn. Đã đến lúc cần xem xét lượng khí thải do AI tạo ra, vốn có thể vượt xa đáng kể so với tác động môi trường từ cơ sở hạ tầng của nó.

40 năm định hình ngành hạt nhân sau thảm kịch Chernobyl

40 năm định hình ngành hạt nhân sau thảm kịch Chernobyl

Thảm họa Chernobyl không chỉ khép lại bằng những con số thương vong, mà còn mở ra một bước ngoặt lớn trong tư duy về an toàn và chính sách năng lượng toàn cầu. Từ cú sốc 1986, khái niệm "văn hóa an toàn hạt nhân" được đặt lên hàng đầu, kéo theo những thay đổi sâu rộng trong thiết kế, vận hành và giám sát các nhà máy điện nguyên tử. Ngày nay, khi nhu cầu bảo đảm an ninh năng lượng gia tăng, điện hạt nhân đang trở lại và đáng tin cậy hơn nhiều so với cách đây 4 thập kỷ.

“Đường vòng” cho nỗ lực từ bỏ nhiên liệu hóa thạch

“Đường vòng” cho nỗ lực từ bỏ nhiên liệu hóa thạch

Ngày 28/4/2026, Hội nghị quốc tế lần thứ nhất về Chuyển dịch khỏi nhiên liệu hóa thạch đã diễn ra tại thành phố Santa Marta của Colombia, với sự tham dự của đại diện hơn 50 quốc gia. Bức tranh rối ren của thị trường năng lượng thế giới thời gian qua cho thấy một thực tế phũ phàng là sự lệ thuộc vào nhiên liệu hóa thạch đang trói buộc các quốc gia vào những biến động địa chính trị phức tạp, vốn nằm ngoài tầm kiểm soát. Trong bối cảnh đó, hội nghị tại Santa Marta đã được nhiều ý kiến ca tụng là sự kiện đánh dấu “bước khai tử” nhiên liệu hóa thạch.

Vành đai gỉ sét và vành đai mặt trời: Cuộc chuyển đổi trong lòng nước Mỹ

Vành đai gỉ sét và vành đai mặt trời: Cuộc chuyển đổi trong lòng nước Mỹ

Khi những người ủng hộ ông Trump trong cuộc đua trở lại Nhà Trắng hô vang khẩu hiệu “Đưa việc làm trở lại”, họ không chỉ nói về những bảng lương đã mất, mà còn về cả một bản sắc đang phai mờ. Thực tế, những nhà máy mới vẫn đang mọc lên trên đất Mỹ, chỉ có điều chúng không nằm ở những thị trấn công nghiệp xưa cũ mà chọn những vùng đất mới. Đây vừa là lựa chọn tất yếu, đồng thời là một nghịch lý của nền kinh tế - chính trị Mỹ hiện tại.

UAV giá rẻ khiến chiến tranh khó lường hơn

UAV giá rẻ khiến chiến tranh khó lường hơn

Trong nhiều thế kỷ, ưu thế trên không là đặc quyền của các cường quốc quân sự. Máy bay không người lái (UAV) đang thay đổi điều đó. Khi khả năng tiếp cận từ trên không không còn là đặc quyền của vài cường quốc nữa, nó đang khiến cho những cuộc xung đột trở nên “cân bằng” hơn nhưng cũng khó kiểm soát hơn.

Sắc cờ thời xưa

Sắc cờ thời xưa

Chúng ta thường nghe kể rằng thời Nguyễn ở nước ta, vua treo cờ vàng, nhưng ít người biết rằng vua còn có nhiều sắc cờ khác nữa.

Doanh nghiệp bị phạt tù vì “nộp tô” cho khủng bố

Doanh nghiệp bị phạt tù vì “nộp tô” cho khủng bố

Tòa án Pháp ra phán quyết phạt tù lãnh đạo một tập đoàn đa quốc gia vì hành vi tài trợ khủng bố trong bối cảnh xung đột tại Syria giai đoạn 2013 - 2014. Động thái này không chỉ phơi bày mức độ gắn kết giữa hoạt động kinh doanh và các mạng lưới cực đoan, mà còn phát đi cảnh báo rõ rệt về ranh giới pháp lý mà doanh nghiệp không thể vượt qua khi hiện diện tại các khu vực chiến sự.

Trinh thám trên không trong thời đại mới

Trinh thám trên không trong thời đại mới

Trinh thám trên không đã và đang là một trong các nhân tố chủ đạo trong chiến tranh hiện đại. Sự xuất hiện dày đặc của nhiều mẫu máy bay không người lái (UAV) phục vụ công tác tình báo, theo dõi và do thám (ISR) trên chiến trường lại càng khẳng định vai trò của trinh thám trên không.

Mặt Trăng đang trở thành chiến trường quyền lực mới

Mặt Trăng đang trở thành chiến trường quyền lực mới

Sau hơn nửa thế kỷ, con người sắp in dấu chân trở lại Mặt Trăng. Tuy nhiên, “lục địa thứ 8” giờ đây đang chật chội hơn trước rất nhiều. Đấy không chỉ là cuộc đối đầu song phương giữa Mỹ và Liên Xô như thời Chiến tranh lạnh, mà đã trở thành một sân chơi đa cực với sự tham gia quyết liệt của nhiều quốc gia và cả những liên minh.

Khi AI vừa là mũi giáo vừa là tấm khiên?

Khi AI vừa là mũi giáo vừa là tấm khiên?

Trí tuệ nhân tạo (AI) đang dần thoát ly khỏi vai trò công cụ hỗ trợ để trở thành tác nhân cốt lõi làm thay đổi diện mạo an ninh mạng toàn cầu. Từ khả năng tìm kiếm lỗ hổng bảo mật với tốc độ ánh sáng của các mô hình ngôn ngữ lớn đến những "tác nhân AI" tự vận hành cuộc tấn công, trí tuệ nhân tạo đang mang đến những thách thức chưa từng có trong lĩnh vực này.