Mô phỏng đa giác quan đào tạo và thử nghiệm robot gia đình

Robot được hỗ trợ bởi AI ngày càng trở nên tinh vi và đang dần được ứng dụng trong nhiều môi trường trong thế giới thực, bao gồm trung tâm thương mại, sân bay, bệnh viện và nhiều không gian công cộng khác. Trong tương lai, những robot này cũng hỗ trợ con người làm việc nhà, việc vặt ở văn phòng và những công việc tẻ nhạt hoặc tốn thời gian khác.

04/07/2023 13:08

Robot được hỗ trợ bởi trí tuệ nhân tạo (AI)

Tuy nhiên, trước khi robot được triển khai trong môi trường thế giới thực, các thuật toán AI kiểm soát chuyển động của chúng và cho phép chúng giải quyết một số nhiệm vụ cụ thể cần được đào tạo và thử nghiệm trong môi trường mô phỏng. Mặc dù hiện nay có nhiều nền tảng để đào tạo các thuật toán này, nhưng rất ít trong số đó xem xét âm thanh mà robot có thể phát hiện và tương tác khi hoàn thành nhiệm vụ.

Một nhóm nhà nghiên cứu tại Đại học Stanford gần đây đã tạo ra Sonicverse - một môi trường mô phỏng đào tạo các tác nhân AI hiện thân (tức là robot) bao gồm cả yếu tố thị giác và thính giác.Nền tảng này cho phép đơn giản hóa rất nhiều việc đào tạo thuật toán nhằm triển khai trong robot dựa vào cả máy ảnh và micro điều hướng môi trường xung quanh.

Mô phỏng đa giác quan đào tạo và thử nghiệm robot gia đình -0 — Ruohan Gao, nhà nghiên cứu thuộc Đại học Stanford.

Ruohan Gao, một trong những nhà nghiên cứu, giải thích: “Mặc dù con người chúng ta nhận thức thế giới bằng cả nhìn và nghe, nhưng rất ít công trình trước đây đề cập đến việc học thông qua âm thanh.Các trình giả lập AI được thể hiện hiện tại hoặc giả định rằng môi trường im lặng và tác nhân không thể phát hiện âm thanh hoặc chỉ triển khai tác nhân nghe nhìn trong mô phỏng. Mục tiêu của chúng tôi là giới thiệu một nền tảng mô phỏng đa giác quan mới với mô phỏng nghe nhìn tích hợp thực tế để đào tạo nhân viên hộ gia đình vừa có thể nhìn vừa có thể nghe”.

Sonicverse, nền tảng mô phỏng do Gao và đồng nghiệp tạo ra, mô hình hóa cả yếu tố hình ảnh một môi trường nhất định và âm thanh mà một tác nhân sẽ phát hiện khi khám phá môi trường này. Nhóm nhà nghiên cứu hy vọng điều này sẽ giúp huấn luyện robot hiệu quả hơn và trong không gian ảo “thực tế” hơn, cải thiện hiệu suất tiếp theo của chúng trong thế giới thực.

Gao nói thêm: “Không giống như công việc trước đây, chúng tôi hy vọng chứng minh rằng các tác nhân được đào tạo về mô phỏng có thể thực hiện thành công điều hướng nghe nhìn trong môi trường thế giới thực đầy thách thức. Sonicverse là một nền tảng mô phỏng đa giác quan mới mô hình hóa kết xuất âm thanh liên tục trong môi trường 3D theo thời gian thực. Nền tảng có thể đóng vai trò là nơi thử nghiệm cho nhiều tác vụ tương tác AI và người-robot hiện thân cần nhận thức nghe nhìn, chẳng hạn như điều hướng nghe nhìn”.

Để đánh giá Sonicverse, nhóm nhà nghiên cứu sử dụng nền tảng huấn luyện một phiên bản mô phỏng của TurtleBot, một robot do Willow Garage tạo ra, để di chuyển hiệu quả trong môi trường trong nhà và đến vị trí mục tiêu mà không va chạm với chướng ngại vật. Sau đó, họ áp dụng AI được đào tạo trong các mô phỏng của mình cho một TurtleBot thực và thử nghiệm khả năng điều hướng nghe nhìn của nó trong môi trường văn phòng.

Gao cho biết: “Chúng tôi đã chứng minh tính hiện thực của Sonicverse thông qua chuyển đổi mô phỏng thành thực, điều mà các trình mô phỏng nghe nhìn khác không đạt được. Nói cách khác, một tác nhân được đào tạo trong trình giả lập của chúng tôi có thể thực hiện thành công điều hướng nghe nhìn trong môi trường thế giới thực, chẳng hạn như trong nhà bếp hoặc văn phòng”.

Kết quả của loạt thử nghiệm do nhóm nhà nghiên cứu thực hiện rất hứa hẹn, cho thấy nền tảng mô phỏng của họ có thể huấn luyện robot giải quyết một số nhiệm vụ trong thế giới thực hiệu quả hơn, sử dụng cả kích thích thị giác và thính giác.Nền tảng Sonicverse hiện có sẵn trực tuyến và có thể sớm được sử dụng bởi các nhóm người máy khác để đào tạo và thử nghiệm các tác nhân AI hiện thân.

Gao bình luận thêm: “Học tập tích hợp với nhiều phương thức có tiềm năng lớn để mở ra nhiều ứng dụng mới cho robot gia đình trong tương lai.Trong loạt nghiên cứu tiếp theo, chúng tôi dự định tích hợp các nội dung đối tượng đa giác quan, chẳng hạn như nội dung trong Object Folder mà chúng tôi đã làm gần đâyvào trình mô phỏng, để lập mô hình tín hiệu đa giác quan ở cả cấp độ không gian và cấp độ đối tượng, đồng thời kết hợp những phương thức cảm giác khác chẳng hạn như cảm nhận xúc giác”.

Một robot có thể tự khám phá môi trường trong thế giới thực

Đội ngũ nhà chế tạo robot đã phát triển nhiều hệ thống tiên tiến trong khoảng một thập kỷ qua, tuy nhiên hầu hết những hệ thống này vẫn cần có sự giám sát của con người ở một mức độ nào đó. Lý tưởng nhất là robot trong tương lai nên khám phá những môi trường chưa biết một cách tự động và độc lập, liên tục thu thập dữ liệu và học hỏi từ dữ liệu này. Một nhóm nhà nghiên cứu tại Đại học Carnegie Mellon tạo ra ALAN - tác nhân người máy có thể tự khám phá những môi trường xa lạ. Robot được chứng minh là hoàn thành xuất sắc nhiều nhiệm vụ trong thế giới thực sau một số thử nghiệm thăm dò ngắn.

Russell Mendonca, một trong những nhà nghiên cứu, báo cáo: “Chúng tôi quan tâm đến việc xây dựng một AI học hỏi bằng cách đặt ra các mục tiêu của riêng mình.Bằng cách không phụ thuộc vào sự giám sát hoặc hướng dẫn của con người, những tác nhân như vậy có thể tiếp tục học hỏi trong các tình huống mới, được thúc đẩy bởi sự tò mò của chính chúng. Điều này sẽ cho phép khái quát hóa liên tục chonhiều lĩnh vực khác nhauvà khám phá hành vi ngày càng phức tạp”.

Nhóm nhà nghiên cứu tại Đại học Carnegie Mellon giới thiệu một số tác nhân tự trị có thể thực hiện tốt một số nhiệm vụ mới mà không cần đào tạo thêm hoặc chỉ cần ít hoặc không cần đào tạo thêm, bao gồm một mô hình được đào tạo để chơi trò chơi điện tử Mario và một hệ thống có thể hoàn thành một số nhiệm vụ thao tác đối tượng nhiều giai đoạn. Tuy nhiên, những hệ thống này chỉ được đào tạo và thử nghiệm trong môi trường mô phỏng.

Mục tiêu chính trong nghiên cứu gần đây của nhóm là tạo ra một khuôn khổ có thể áp dụng cho robot vật lý trên thế giới, cải thiện khả năng khám phá môi trường xung quanh và hoàn thành mọi nhiệm vụ mới của chúng. ALAN học cách khám phá môi trường một cách tự động mà không cần nhận phần thưởng hoặc hướng dẫn từ tác nhân con người. Sau đó, nó có thể sử dụng lại những gì đã học được trong quá khứ để giải quyết các nhiệm vụ hoặc vấn đề mới.

Mendonca giải thích: “ALAN học một mô hình thế giới lập kế hoạch cho các hành động của mình và tự định hướng bằng cách sử dụng các mục tiêu lấy môi trường và tác nhân làm trung tâm. Nó cũng giảm không gian làm việc xuống khu vực quan tâm bằng cách sử dụng máy dò đã được đào tạo sẵn. Sau khi khám phá, robot kết hợp mọi kỹ năng đã khám phá để thực hiện các nhiệm vụ đơn lẻ và nhiều giai đoạn được chỉ định thông qua hình ảnh mục tiêu”. Robot của nhóm nhà nghiên cứu có một mô-đun trực quan ước tính chuyển động của vật thể trong môi trường xung quanh. Sau đó, mô-đun này sử dụng số ước tính này về cách đối tượng đã di chuyển để tối đa hóa sự thay đổi trong đối tượng và khuyến khích robot tương tác với đối tượng này.

Mendonca bình luận: “Đây là tín hiệu tập trung vào môi trường, vì nó không phụ thuộc vào niềm tin của tác nhân. Để cải thiện ước tính của nó về sự thay đổi trong các đối tượng, ALAN cần đến khả năng tìm hiểu. Đối với điều này, ALAN sử dụng mô hình thế giới đã học của mình để xác định hành động mà nó không chắc chắn về sự thay đổi của đối tượng được dự đoán và sau đó thực hiện chúng trong thực tế thế giới. Tín hiệu lấy tác nhân làm trung tâm này phát triển khi robot nhìn thấy nhiều dữ liệu hơn”.

Mô phỏng đa giác quan đào tạo và thử nghiệm robot gia đình -1 — ALAN hoạt động trong môi trường nhà bếp trong thế giới thực.

Các phương pháp được đề xuất trước đây để khám phá robot tự động yêu cầu một lượng lớn dữ liệu đào tạo. Điều này ngăn cản hoặc hạn chế đáng kể việc triển khai chúng trên robot thực. Ngược lại, phương pháp học tập do Mendonca và đồng nghiệp đề xuất cho phép robot ALAN học hỏi liên tục và tự động để hoàn thành loạt nhiệm vụ khi đang khám phá môi trường xung quanh.

Mendonca cho biết: “Chúng tôi cho thấy rằng ALAN có thể học cách điều khiển các vật thể chỉ với khoảng 100 quỹ đạo trong 1 đến 2 giờ trong hai bếp riêng biệt mà không cần bất kỳ phần thưởng nào.Do đó, việc sử dụng các ưu tiên trực quan có thể tăng đáng kể hiệu quả học tập của robot. Các phiên bản mở rộng của hệ thống này được vận hành 24/7 sẽ có thể liên tục thu được các kỹ năng hữu ích mới với sự can thiệp tối thiểu của con người trên nhiều lĩnh vực, đưa chúng ta đến gần hơn với khái niệm chung - người máy thông minh có mục đích”.

Trong một số đánh giá ban đầu, robot của nhóm đã thể hiện rất tốt vì nó có thể nhanh chóng học cách hoàn thành nhiệm vụ thao tác mới mà không cần bất kỳ sự huấn luyện hay trợ giúp nào từ con người.Trong tương lai, ALAN và khuôn khổ làm nền tảng cho nó có thể mở đường cho việc tạo ra các hệ thống robot tự động hoạt động tốt hơn để khám phá môi trường.

Mendonca nói thêm: “Tiếp theo, chúng tôi muốn nghiên cứu cách sử dụng các ưu tiên khác để giúp cấu trúc hành vi của robot, chẳng hạn như video về con người thực hiện nhiệm vụ và mô tả ngôn ngữ. Các hệ thống có thể xây dựng hiệu quả dựa trên dữ liệu này sẽ có thể khám phá tự động tốt hơn bằng cách hoạt động trong không gian có cấu trúc. Hơn nữa, chúng tôi quan tâm đến hệ thống nhiềurobotcó thể tập hợp kinh nghiệm của chúng để liên tục học hỏi”.