Chatbot google: Đạt trình độ gần như con người

Google cho biết chatbot mới nhất của họ đã đạt trình độ giống như con người nhất từ trước tới nay, với khả năng lưu trữ 341GB dữ liệu phương tiện truyền thông xã hội.

Các nhà nghiên cứu trí thông minh nhân tạo (AI) tại Google đã đào tạo một mạng lưới thần kinh khổng lồ bằng cách sử dụng 341GB thảo luận được lấy từ phương tiện truyền thông xã hội công cộng để tạo ra thứ mà họ tin là chatbot giống con người nhất từ trước đến nay.

Phần mềm được đặt tên là Meena, có một mô hình seq2seq của Tensorflow chứa các cuộc hội thoại được mã hóa dưới dạng các luồng vectơ được chuyển trở lại thành văn bản để tạo thành câu trả lời khi một người nói với nó. Bạn cung cấp cho nó một dấu nhắc như đầu vào, nó sẽ trả lời lại bằng một câu liên quan. 

Thực tế là nó được đào tạo về các cuộc thảo luận và trao đổi của con người, có nghĩa nó thậm chí có thể kích hoạt những câu nghe có vẻ mơ hồ một cách tự nhiên. Mạng nơ-ron có rất nhiều thứ để rút ra: nó chứa 2,6 tỷ tham số, nhiều hơn 1,5 tỷ tham số trong mô hình GPT-2 lớn nhất của OpenAI.

Có vẻ mất khoảng một tháng để đào tạo đầy đủ Meena bằng cách sử dụng 2.048 lõi TPU v3 do Google thiết kế. Tuy nhiên, mọi người ở Google Brain cho rằng tất cả sức mạnh tính toán và thời gian đều đáng giá, tuy nhiên, vì có thể tổ chức một cuộc trò chuyện được coi là một thành phần cần thiết của trí tuệ nhân tạo thực tế.

Khả năng giao tiếp tự do trong ngôn ngữ tự nhiên là một trong những đặc điểm nổi bật của trí thông minh con người, và có khả năng là một yêu cầu đối với trí thông minh nhân tạo thực sự, các nhà khoa học đã viết trong một bài báo phát hành trên arXiv mô tả về Meena.

Meena về cơ bản được đào tạo để bắt chước cách con người nói chuyện với nhau, trò chuyện nhàn rỗi về phim ảnh, kế hoạch cuối tuần, du lịch, chơi nhạc cụ, triết học, toán học, thở dưới nước và mọi thứ thực tế trong cuộc sống.

Hàng trăm gigabyte các cuộc hội thoại công khai trên phương tiện truyền thông xã hội đã được thu thập vào các cây thông điệp, trong đó tin nhắn đầu tiên được coi là gốc và tất cả các câu trả lời tương ứng là các nút con hoặc lá. Sắp xếp dữ liệu theo cách này giúp dễ dàng chuyển đổi các cuộc thảo luận thành các chuỗi văn bản mà phần mềm có thể học hỏi. Nó phải tìm ra những gì liên kết trả lời các tin nhắn trước đó để khi nói chuyện với một người thực sự, nó có thể nhận ra bối cảnh và đưa ra các câu trả lời có liên quan, và tạo ấn tượng cho những gì được thảo luận.

Xây dựng một cỗ máy mạch lạc là khó khăn và hầu hết các chatbot tiết lộ giới hạn của chúng khi chúng nhanh chóng rơi vào tình trạng bập bẹ: câu trả lời mở đầu của chúng có thể giống như con người, nhưng những câu tiếp theo sẽ không có ý nghĩa hoặc hoàn toàn không chính xác. Do đó, con người tương tác với các hệ thống này phải làm như vậy một cách cứng nhắc, xây dựng các câu hỏi cẩn thận để tối đa hóa khả năng máy tính sẽ hiểu lời nhắc và trả lời một cách mạch lạc.

Meena không được thiết kế để trả lời các câu hỏi hoặc hoạt động như một trợ lý kỹ thuật số. Thay vào đó, nó được xây dựng để có những chiếc cằm đầy thuyết phục với những người xử lý như con người. Các nhân viên của Google đã kiểm tra chatbot của họ trên một nhóm công nhân, mặc dù bài báo không ghi rõ có bao nhiêu người được thử nghiệm. Mỗi công nhân được hướng dẫn để có những cuộc trò chuyện ngắn với Meena và chấm điểm bằng cách trả lời hợp lý và cụ thể.

Các biện pháp nhạy cảm, bao nhiêu chatbot có ý nghĩa và mức độ cụ thể làm thế nào nó hiểu được bối cảnh chung của cuộc trò chuyện. Ví dụ, đưa ra lời nhắc nhở "Tôi yêu quần vợt", một câu trả lời như rằng, đó là một câu hỏi hay, nhưng câu trả lời rất hay về tính đặc biệt so với một người như "tôi cũng vậy", "tôi có thể nhận được đủ điểm của Roger Federer!"… Điều thứ hai là một minh chứng rằng một chatbot có thể nắm bắt được rằng có một mối liên hệ giữa quần vợt và tay vợt tennis Roger Federer.

Các nhân viên của Google đã nghĩ ra điểm SSA, viết tắt của độ nhạy và độ đặc hiệu trung bình, để đánh giá hiệu suất của Meena. SSA tốt nhất của nó là 79%; con người trung bình được coi là có SSA cỡ 86%, hoặc chúng ta đã nói như vậy. Cảm giác như Google đã phát minh ra một hệ thống tính điểm và sau đó tuyên bố nó là hệ thống tốt nhất trong hệ thống này.

Meena đã chơi tốt hơn, bất ngờ, ngạc nhiên, hơn các chatbot khác: DialoGPT của Microsoft (48% SSA) và Xiaoice (31%), cộng với Cleverbot (56%) và Mitsuku (56%) - người chiến thắng 5 lần giải thưởng Leobner, một cuộc thi tương tự như Thử nghiệm Turing. Cần lưu ý rằng nhóm Google Meena không được so sánh với bất kỳ phiên bản giành giải thưởng nào của Mitsuku.

Một nhóm chatbot giống như con người, về độ nhạy và độ đặc hiệu, có thể ở trong tầm nhìn nếu chúng ta có thể đạt được sự lúng túng tốt hơn, nhóm nghiên cứu cho biết. Sự lúng túng mô tả chính xác làm thế nào nó có thể dự đoán những gì người khác sẽ nói tiếp theo trong một cuộc trò chuyện.

Meena vẫn bị các vấn đề chatbot phổ biến: nó lặp lại bản thân nó giống như một bản ghi bị phá vỡ, hoặc đôi khi nó trở nên vô nghĩa, hoặc chỉ là hết sức đáng sợ. Ở đây, có một cái nhìn cho chính mình. Tại một số thời điểm, một trò đùa kỳ lạ rơi vào sự điên rồ nhẹ.

Các ứng dụng thực tế của chatbot giống như con người vẫn còn nhiều nghi vấn. Dù sao đi nữa, điểm quan trọng của việc có những cuộc trò chuyện tự động vô tận, trống rỗng với một cỗ máy là gì? Bạn chỉ có thể đi chơi ở máy làm mát nước văn phòng hoặc bình cà phê cho điều đó. Tuy nhiên, Google tin rằng nó có thể, trong một số hình thức trong tương lai, giúp mọi người học các ngôn ngữ mới, thông qua hội thoại hoặc giúp các nhà phát triển tạo hộp thoại tạo phần mềm tốt hơn trong các trò chơi video.

Bên cạnh đó là một vấn đề nghiên cứu hấp dẫn, một tác nhân đàm thoại như vậy có thể dẫn đến nhiều ứng dụng thú vị, như nhân bản hóa hơn nữa các tương tác máy tính, cải thiện thực hành ngoại ngữ, tạo ra các nhân vật phim và trò chơi điện tử tương tác, có thể nói.

Google hiện đang giữ việc phát hành mã công khai trong khi nó đánh giá sự an toàn và sai số trong mô hình.

Bảo Ngọc

Các tin khác

Khi người thân phạm tội

Khi người thân phạm tội

Trong nhiều trường hợp, vì tình cảm gia đình mà bố mẹ không tố giác con dù biết rõ con phạm tội. Theo quy định của pháp luật, bố mẹ có phải chịu trách nhiệm hình sự trong trường hợp này hay không?
Những “con sâu” khoác áo cán bộ

Những “con sâu” khoác áo cán bộ

Phòng Cảnh sát kinh tế Công an tỉnh Phú Yên vừa kết thúc điều tra 3 vụ án tham nhũng với hơn 20 đối tượng. Trong số này có những người dù mới chỉ là cán bộ xã nhưng đã nghĩ ra đủ cách bòn rút tài sản công, cố ý làm trái để trục lợi…
Vỉa hè mà biết nói năng…

Vỉa hè mà biết nói năng…

Sáng 22-12, tại buổi làm việc của Thường trực Thành ủy với Sở Xây dựng Hà Nội, Bí thư Thành ủy Vương Đình Huệ nêu thực tế đá vỉa hè vỡ sau thời gian ngắn sử dụng. Ông Huệ đặt vấn đề vì sao cũng cùng làm đúng quy trình, thiết kế mẫu của Sở Xây dựng Hà Nội, nhưng có quận làm tốt, có quận chưa. Bí thư Thành ủy Hà Nội yêu cầu cẩn trọng từ khâu chọn đá, thi công đồng bộ, không làm manh mún. Sở Xây dựng Hà Nội tăng cường hướng dẫn, kiểm tra về nghiệp vụ, quy trình lát đá hè.
Dấu ấn tiên phong của một đơn vị anh hùng

Dấu ấn tiên phong của một đơn vị anh hùng

Trong các đơn vị Công an được Chủ tịch nước phong tặng danh hiệu "Anh hùng Lực lượng vũ trang nhân dân thời kỳ đổi mới" năm 2020, có một đơn vị khá đặc biệt, đó là Công an tỉnh Phú Thọ. 
Triệt phá băng nhóm tội phạm do "Cường gấu" cầm đầu

Triệt phá băng nhóm tội phạm do "Cường gấu" cầm đầu

Ở Thanh Hoá, Cường "gấu" nổi lên là 1 trong những trùm tội phạm "có máu mặt" được nhiều người biết đến bởi sự liều lĩnh, manh động và nhiều trò côn đồ. Sau nhiều lần "vào tù ra khám", mọi hoạt động của Cường đi vào chiều sâu, hắn tổ chức đàn em cho vay lãi nặng, bảo kê, đòi nợ thuê… nhưng không bao giờ trực tiếp ra mặt.
TP Hồ Chí Minh tập trung đánh mạnh “tín dụng đen”

TP Hồ Chí Minh tập trung đánh mạnh “tín dụng đen”

Để nâng cao hơn nữa hiệu quả trong phòng chống, xử lý tội phạm “tín dụng đen” nói riêng và tội phạm trên không gian mạng nói chung, Công an TP Hồ Chí Minh sẽ thành lập Phòng An ninh mạng và phòng chống tội phạm công nghệ cao…
Cuộc cạnh tranh giữa báo chí với Google và Facebook

Cuộc cạnh tranh giữa báo chí với Google và Facebook

Kể từ cuộc khủng hoảng tài chính 2007-2008, khoảng 1.000 tờ báo ở Mỹ đã phải đóng cửa. Trong cả thập kỷ đã qua, Facebook và Google độc quyền thâu tóm doanh thu quảng cáo, đăng lại tin bài của báo chí mà không trả tiền, đẩy báo chí thế giới vào khủng hoảng tồn vong.
Lính hình sự và những cuộc truy lùng đối tượng truy nã

Lính hình sự và những cuộc truy lùng đối tượng truy nã

Đó là hành trình đi cả nghìn cây số truy bắt đối tượng truy nã của cán bộ chiến sĩ Đội truy nã và truy tìm (Đội 6), Phòng Cảnh sát hình sự Công an tỉnh Hà Nam. Với họ, khi đối tượng truy nã còn ngoài vòng pháp luật thì họ còn ăn chưa ngon, ngủ chưa yên…
Nhẫn giúp thành sự

Nhẫn giúp thành sự

Năm ngoái, tôi bái một cao thủ Vịnh Xuân quyền làm sư phụ. Cả đời, chưa bao giờ tôi nghĩ mình sẽ học võ, chuyện đánh đấm cơ bản không hợp với tôi. Cho đến một buổi tối, tôi theo bạn tới uống trà tại một võ đường.
Một sự nhịn chín sự lành!...

Một sự nhịn chín sự lành!...

Tôi nhớ khi còn làm việc tại Viện Văn học, trong cuộc trò chuyện với các chuyên gia văn học dân gian tại đây, một học giả đã nói với tôi rằng, văn học - văn hóa dân gian giống như 11 tháng trong năm, còn văn học viết là tháng 12. Đây không phải là sự so sánh hơn kém, mà là một ẩn dụ về sự dài rộng, to lớn của kho tàng trí tuệ, văn hóa dân gian.
Bình yên cho bản làng Buôn Đôn

Bình yên cho bản làng Buôn Đôn

Huyện Buôn Đôn (Đắk Lắk) những ngày này, không khí mùa vụ rộn rã khắp các buôn làng. Để giữ bình yên cho mảnh đất gắn với những huyền thoại về voi này, các cán bộ chiến sĩ Công an huyện Buôn Đôn đang ngày đêm gắn bó với từng buôn làng…
Click thuê - "tù khổ sai" thời công nghệ

Click thuê - "tù khổ sai" thời công nghệ

Các "trại cày" click đã trở thành vấn đề được công chúng và báo chí chú ý đến nhiều hơn trong vài năm trở lại đây. Những cơ sở hằng ngày "sản xuất" ra cả triệu lượt nhấp chuột, câu bình luận, v.v…trong bí mật nay được lôi ra ánh sáng trên các mặt báo.
Khi Công an "dân vận khéo"

Khi Công an "dân vận khéo"

Bằng những cách làm thiết thực, Công an huyện Tân Lạc, tỉnh Hòa Bình đã tạo sự gần gũi thân thiện giữa đồng bào với cán bộ chiến sĩ Công an.
Mạnh tay với tội phạm gieo rắc "cái chết trắng"

Mạnh tay với tội phạm gieo rắc "cái chết trắng"

Mới đây lực lượng Cảnh sát điều tra (CSĐT) tội phạm về ma túy Công an TP Hà Nội đã liên tiếp điều tra khám phá nhiều đường dây vận chuyển, tàng trữ, buôn bán ma túy xuyên quốc gia. Đặc biệt, xuất hiện những nữ quái nhiều tiền án, tiền sự cùng những thủ đoạn rất tinh vi…
Chuyện nữ anh hùng biệt động

Chuyện nữ anh hùng biệt động

Mãi sau này tôi mới biết Đại tá Đoàn Thị Ánh Tuyết đã được phong Anh hùng lực lượng vũ trang (1978); mới biết những chiến công vang dội mà cô gái mảnh mai xinh đẹp Đoàn Thị Ánh Tuyết đã cống hiến cho cách mạng.
“Áo trắng” và mối tình của một tử tù

“Áo trắng” và mối tình của một tử tù

Ngày 2-9-1961, trong nhà lao Gia Định, chị em trại nữ tìm mọi cách che mắt địch, tổ chức một đêm văn nghệ rất "xôm". Được sự chuẩn y của Trại ủy, ngay sau các tiết mục văn nghệ, chi bộ cắt cử người canh gác cẩn thận để tuyên bố kết nạp Nguyễn Thị Châu vào Đảng...
Mũi nhọn chống tội phạm kinh tế ở đơn vị 9 năm được Chính phủ tặng Cờ Thi đua

Mũi nhọn chống tội phạm kinh tế ở đơn vị 9 năm được Chính phủ tặng Cờ Thi đua

Tháng 4/2020, khi cuộc chiến chống bệnh dịch COVID -19 của nước ta đang ở giai đoạn cao điểm nhất, cam go nhất, mọi nguồn lực đều đổ dồn cho công tác này thì 1 thông tin chấn động được CBCS Cục Cảnh sát điều tra tội phạm về tham nhũng, kinh tế, buôn lậu (Cục CSKT) đưa ra, đó là đã điều tra làm rõ sai phạm trong quá trình chỉ định thầu mua sắm vật tư, trang thiết bị y tế phục vụ công tác phòng chống dịch COVID-19 tại Trung tâm Kiểm soát bệnh tật (CDC) TP Hà Nội.