"Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt"

Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT) của Công ty TNHH Trí thông minh Nhân tạo Việt Nam (VAIS) đã giành được giải Nhất Nhân tài Đất Việt 2019. Đỗ Quốc Trình, đồng sáng lập kiêm Giám đốc Phát triển kinh doanh của VAIS, đã tâm sự về hành trình đầy cảm xúc ấy.

Xông ra chiến đấu và có thể "chết" sau 6 tháng

- Xin chúc mừng sản phẩm Origin-STT của các anh đã “lên ngôi” Nhân tài Đất Việt năm nay! Vì sao anh và nhóm tác giả của VAIS lại lựa chọn đầu bài khó đến thế bởi tiếng Việt là một trong những ngôn ngữ khó học, khó phát âm nhất trên thế giới?

Công nghệ nhận dạng giọng nói dù đã có từ lâu nhưng những “ông lớn” như Google chưa phát triển những nền tảng dành riêng cho người Việt một cách triệt để. Vì thế việc chuyển đổi giọng nói thành chữ viết tiếng Việt với độ chính xác cao là điều chúng tôi rất trăn trở. Chúng tôi đặt ra câu hỏi “Ai sẽ giải bài toán của Việt Nam nếu không phải chính người Việt?” và lên ý tưởng sử dụng trí tuệ nhân tạo (AI) để xử lý câu chuyện này.

- Trước đó, Origin-STT được nhắc tới khi gỡ băng cho các phiên chất vấn của Quốc hội với độ chính xác cao. Theo anh, dự án có thể ứng dụng ra sao trong cuộc sống?

Origin-STT là công nghệ lõi và gỡ băng trong các phiên họp chỉ là một trong những ứng dụng thiết thực. Ngoài ra, Origin-STT có thể sử dụng cho các nhà báo tác nghiệp hoặc tại các bệnh viện, nơi bác sĩ vừa khám bệnh vừa đọc chẩn đoán, các cảnh báo, lưu ý và phần mềm sẽ tự động xuất ra bệnh án điện tử.

Công nghệ này cũng có thể ứng dụng để hỗ trợ ghi biên bản điều tra hiện trường, trong các phiên tòa, với tổng đài dịch vụ hay phát triển hỗ trợ cho người khuyết tật...

- Phần lớn startup phải rời bỏ thị trường chỉ trong thời gian ngắn ban đầu vì hết tiền và không thể gọi vốn. Với VAIS, các anh đang vượt qua quãng thời gian này ra sao?

VAIS được thành lập tháng 8/2018 với 5 thành viên, phần lớn đều là thế hệ 9X. Trước đó, mọi người đều đang có những công việc với thu nhập tốt, có thể nói là đáng mơ ước. Bản thân tôi trước đó cũng đang làm ở KPMG Việt Nam (một trong những Tập đoàn kiểm toán nằm trong nhóm Big Four). Tuy nhiên, mấy anh em đã xác định tinh thần, cùng xông ra ngoài chiến đấu.

Thời gian đầu, toàn bộ kinh phí hoạt động là tiền tích góp trong vài năm đi làm của 5 thành viên. Chúng tôi tính toán, nếu không có thu nhập, công ty chỉ hoạt động được 6 tháng. Tuy nhiên, tôi và 4 người bạn cùng nghĩ sẽ "chơi hết mình".

May mắn là ngay trong những tháng đầu tiên, chúng tôi đã nhận được một dự án lớn hợp tác với trang thương mại điện tử Adayroi. Trong đó điều làm chúng tôi rất cảm kích là nhận được sự tin tưởng và hỗ trợ tài chính rất quan trọng từ Quỹ Đổi mới sáng tạo Vingroup (VINIF).

VINIF đã tạo cảm hứng, giúp chúng tôi đi nhanh

- Cảm giác có dự án đầu tay như thế nào, nhất là với những ông lớn như Adayroi?

Cả nhóm rất mừng vì dù xác định từ đầu là xông ra chiến đấu nhưng nếu không có tiền, mọi sự phát triển chỉ là trên giấy. Phải có tài chính thì anh em mới lên được kế hoạch cho công việc một cách chính xác.

Với dự án đầu tay, nhóm đã giúp cải thiện khả năng tìm kiếm trên website này. Ví dụ người dùng có thể viết không dấu hoặc có dấu, hay chưa chính xác tên gọi các sản phẩm, công cụ tìm kiếm đều nhận biết với độ chính xác cao.

Ngoài ra, chúng tôi cũng phát triển chatbot (chương trình tương tác tự động với người dùng qua tin nhắn hoặc âm thanh). Một trong những tính năng đó là khi người dùng muốn hủy đơn hàng đã đặt, chatbot sẽ tự động hỏi xin số điện thoại, mã đơn hàng của người dùng và liên kết với hệ thống dữ liệu để xác định khách hàng đã đặt mua gì. Đối chiếu với các điều kiện, chatbot sẽ tự động xác nhận việc hủy đơn với khách hàng.

Điểm khác biệt là hệ thống chatbot này là có thể tự học hỏi thêm để nhận biết các tình huống khác nhau thay vì chỉ "bắt cứng" từ khóa như những chương trình khác.

- Anh đã nhắc tới sự hỗ trợ của Quỹ Đổi mới sáng tạo Vingroup (VINIF). Điều này có ý nghĩa ra sao trong hành trình của VAIS?

Mặc dù rất tự tin vào sự cố gắng của mình nhưng thực sự VAIS là tập hợp của những người trẻ. Tuy nhiên, VINIF đã đặt niềm tin vào chúng tôi. Đó là điều rất ý nghĩa. Chúng tôi đã may mắn có cơ hội tiếp xúc với Giám đốc khoa học của Quỹ là giáo sư Vũ Hà Văn - một nhà khoa học lừng danh thế giới. Được những vị giáo sư như anh Văn đánh giá đây là một nền tảng tốt chính là sự ghi nhận với chúng tôi.

Chính sự tin tưởng và hỗ trợ của VINIF đã tạo ra động lực, cảm hứng, giúp anh em duy trì và đưa startup của mình đi nhanh hơn. Việc đi nhanh là rất quan trọng với các startup vì nếu các ý tưởng không được hiện thực hóa ngay, rất nhiều doanh nghiệp khác có thể sẽ giành trước.

- Bước đi đầu tiên với VINIF đã giúp cả nhóm ra sao trên con đường vươn tới giải Nhất Nhân tài Đất Việt sau đó?

Dự án đã tạo tiền đề cho chúng tôi không chỉ về tài chính mà về kỹ thuật, việc nghiên cứu cũng giúp nhóm nâng cao được chất lượng nhận dạng ngôn ngữ tự nhiên.

Đơn cử, chúng tôi đã nghiên cứu để chương trình của mình hiểu được các ngữ cảnh khác nhau, từ đó "đoán" chữ chính xác hơn trong từng câu văn. Đây là một phần quan trọng của sản phẩm Origin-STT sau đó.

Tới bây giờ, chúng tôi càng thấy rõ, nếu không có người đồng hành như VINIF, những bước đi ban đầu của chúng tôi chắc chắn sẽ nặng nề hơn rất nhiều. Có tới 90% dự án khởi nghiệp phải dừng cuộc chơi trong 2 năm đầu vì rỗng túi và không kêu gọi được sự hỗ trợ. Quỹ đã đến với chúng tôi đúng thời điểm và giúp chúng tôi tự tin hơn khi thấy những nỗ lực của mình được ghi nhận xứng đáng.

- Hướng đi trong tương lai của VAIS là gì sau giải Nhân tài Đất Việt và xa hơn nữa?

Với phần mềm tự động chuyển đổi giọng nói tiếng Việt sang văn bản, điều chúng tôi muốn là cải thiện công nghệ lõi để nhận dạng và chuẩn hóa văn bản tốt hơn. Trong tháng 12, chúng tôi sẽ chính thức ra mắt Origin-STT với độ chính xác cao và có cả ứng dụng trên các thiết bị di động.

Tuy nhiên, nhìn rộng hơn, điều chúng tôi hướng tới là nền tảng mở để các nhà sáng lập tự phát triển thêm các ý tưởng./.

- Xin cảm ơn anh!

Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT) có độ chính xác trung bình lên tới 93,6%. Origin-STT có thể nhận dạng giọng nói ở cả 3 miền Bắc, Trung, Nam với khoảng 7.000 từ tiếng Việt.

Origin sẽ giúp người dùng tiết kiệm phần lớn thời gian, công sức nghe lại âm thanh và gõ lại văn bản (gỡ băng). Trung bình, với một đoạn băng dài 60 phút, phần mềm chỉ cần 6 phút để hoàn thành việc chuyển đổi. Qua đó, Origin-STT có thể hỗ trợ tốt cho các nhà báo tác nghiệp, giúp các bác sỹ làm bệnh án điện tử hay ứng dụng cho ghi biên bả các phiên tòa, tổng đài dịch vụ,...

Thanh Tuyền

Các tin khác

Cảnh báo chiêu lừa “phạt nguội 50.000 VND” qua website giả mạo dịch vụ công

Cảnh báo chiêu lừa “phạt nguội 50.000 VND” qua website giả mạo dịch vụ công

Lợi dụng tâm lý chủ quan của nạn nhân trước khoản phạt nhỏ, đối tượng lừa đảo phát tán tin nhắn giả mạo “phạt nguội 50.000 VND”, dẫn dụ người dân truy cập website giả Cổng dịch vụ công để đánh cắp thông tin ngân hàng. Chỉ sau vài thao tác nhập dữ liệu thẻ và mã OTP, nạn nhân có thể mất tiền trong tài khoản bởi thủ đoạn lừa đảo tinh vi, khó nhận biết.

VinaPhone hướng dẫn xác thực thông tin thuê bao cho người Việt Nam ở nước ngoài

VinaPhone hướng dẫn xác thực thông tin thuê bao cho người Việt Nam ở nước ngoài

Trong bối cảnh yêu cầu chuẩn hóa thông tin thuê bao ngày càng được siết chặt, nhiều người Việt Nam đang sinh sống, làm việc ở nước ngoài băn khoăn về cách xác thực thông tin thuê bao cho số điện thoại VinaPhone của mình đang sử dụng mà không cần về nước. Với hướng dẫn cụ thể từ VinaPhone, người dùng hoàn toàn có thể chủ động tự hoàn tất thủ tục ngay trên điện thoại, đảm bảo liên lạc thông suốt và tránh nguy cơ bị gián đoạn dịch vụ.

Bảo đảm an ninh dữ liệu, tăng cường hợp tác quốc tế về an ninh mạng

Bảo đảm an ninh dữ liệu, tăng cường hợp tác quốc tế về an ninh mạng

Lần đầu tiên, khái niệm “an ninh dữ liệu” được quy định một cách đầy đủ, xác lập vị trí độc lập trong hệ thống pháp luật tại Luật An ninh mạng. Bên cạnh đó, Luật An ninh mạng cũng đã bổ sung, tăng cường các quy định về bảo vệ trẻ em trên không gian mạng; khuyến khích nghiên cứu, phát triển và ứng dụng khoa học, công nghệ trong lĩnh vực an ninh mạng. 

“Bẫy mật ngọt” và mồi nhử vô hình không gian số

“Bẫy mật ngọt” và mồi nhử vô hình không gian số

Chiến thuật tuyển mộ nguồn tin đang dịch chuyển hoàn toàn sang không gian số. Các tương tác trực tuyến được xây dựng khéo léo, vừa tạo niềm tin vừa mở ra kênh khai thác thông tin tinh vi từ những đối tượng thiếu cảnh giác.

Toạ đàm AI và báo chí: Khi công nghệ phải đi cùng chuẩn mực

Toạ đàm AI và báo chí: Khi công nghệ phải đi cùng chuẩn mực

Tọa đàm “Trí tuệ nhân tạo (AI) và báo chí” do Chương trình Phát triển Liên hợp quốc (UNDP) phối hợp cùng các Đại sứ quán Canada, Na Uy, New Zealand và Thụy Sĩ tổ chức chiều 25/3 tại Hà Nội, đã đặt ra một vấn đề cốt lõi rằng trong bối cảnh AI bùng nổ, niềm tin của công chúng trở thành nền tảng sống còn với báo chí. Các nhà báo và chuyên gia nhấn mạnh, AI cần được sử dụng như công cụ hỗ trợ, trong khi quyền kiểm soát và trách nhiệm biên tập phải luôn thuộc về con người.

Cảnh giác với “ma trận” lừa đảo nhắm vào người yếu thế

Cảnh giác với “ma trận” lừa đảo nhắm vào người yếu thế

Theo dõi các diễn đàn, hội nhóm từ thiện, các bài đăng kêu gọi hoặc tổng kết hoạt động giúp đỡ người yếu thế trên mạng xã hội (MXH), các đối tượng tạo lập tài khoản giả mạo người kêu gọi từ thiện hoặc “đóng vai” là người thành đạt ở nước ngoài, hứa hẹn giúp đỡ một khoản tiền lớn để nạn nhân mất đi sự đề phòng, từ đó từng bước đưa họ vào... “ma trận” lừa đảo, chiếm đoạt tài sản. Đây là thủ đoạn lừa đảo mới xuất hiện trên địa bàn tỉnh Quảng Ngãi.

Bác bỏ thông tin bịa đặt “2 chiến sĩ Cảnh sát giao thông hi sinh khi truy đuổi phương tiện vi phạm”

Bác bỏ thông tin bịa đặt “2 chiến sĩ Cảnh sát giao thông hi sinh khi truy đuổi phương tiện vi phạm”

Chiều 16/3, Công an tỉnh Thanh Hoá khẳng định, thông tin lan truyền trên mạng xã hội cho rằng “2 chiến sĩ Cảnh sát giao thông hi sinh khi truy đuổi phương tiện vi phạm giao thông” là hoàn toàn bịa đặt, sai sự thật. Hiện lực lượng chức năng đang xác minh, làm rõ chủ tài khoản và nguồn phát tán thông tin để xử lý nghiêm theo quy định của pháp luật.

CSGT bác thông tin "xe đầu kéo tông xe ô tô do mâu thuẫn cá nhân"

CSGT bác thông tin "xe đầu kéo tông xe ô tô do mâu thuẫn cá nhân"

Do thiếu quan sát nên khi vào vòng xoay, xe ô tô 5 chỗ bị xe đầu kéo tông trúng và bị đẩy đi một đoạn gần 20m. Nhiều người chứng kiên đã quay clip đăng tải lên mạng xã hội với nội dung do mâu thuẫn cá nhân, chủ 2 phương tiện tông nhau để giải quyết mâu thuẫn mà coi thường tính mạng người đi đường…