Nói tiếng Anh “giọng… Quảng”? Đừng lo!

Ứng dụng Sanas (ảnh: Sanas)

Ba cựu sinh viên Đại học Stanford đã phát triển được một ứng dụng (app) thay đổi phương ngôn để giọng nói của bạn dễ nghe hơn khi nói vào micro. Đây là ứng dụng rất quan trọng đối với những người kiếm sống bằng nghề… ngồi trước màn hình máy tính hoặc giao dịch qua điện thoại nhưng lại thường xuyên chịu đựng những giọng nói “hiểu chết liền”, giống như người Nam bộ nghe giọng Quảng nguyên gốc!

Từ một “nỗi buồn”

Ý tưởng nảy sinh khi ba sinh viên Đại học Stanford biết được “nỗi buồn giấu kín” của người bạn thân khi anh ta chia sẻ rằng mình phải nghỉ việc vì giọng nói không được đón chào của mình. Người bạn giải thích rằng giọng Mỹ-Tây Ban Nha của anh làm nhiều khách hàng bối rối; một số thậm chí còn phản ứng khiếm nhã khi nghe anh nói! Ba sinh viên hiểu ngay vấn đề và họ quyết định thành lập một công ty khởi nghiệp để giải quyết vấn đề. Kết quả khả quan, công ty Sanas của họ đang thử nghiệm phần mềm hỗ trợ trí tuệ nhân tạo (AI) có khả năng loại bỏ những phương ngôn khó nghe để thay đổi giọng nói trong thời gian thực. Ví dụ, một nhân viên trực tại trung tâm nhận điện ở Philippines có thể nói chuyện bình thường vào micro bằng tiếng Anh giọng Phi và người ở Kansas đầu dây bên kia tưởng anh lớn lên tại Mỹ!

Trang web của công ty giới thiệu kế hoạch lớn hơn có tên “Bài phát biểu, được tưởng tượng lại” (Speech, Reimagined). Họ hy vọng ứng dụng đang phát triển sẽ được nhiều ngành nghề và cá nhân sử dụng. Nó cũng có thể giúp các bác sĩ giao tiếp tốt hơn với bệnh nhân hoặc giúp các cháu hiểu rõ hơn ông bà vừa nói gì. Giám đốc điều hành Maxim Serebryakov tự tin nói: “Chúng tôi có một tầm nhìn rất lớn với ứng dụng Sanas. Nhưng đối tượng phục vụ chính của dự án vẫn là các cá nhân vì giọng nói của chúng ta không quan trọng bằng phương ngôn của họ. Một người nói tiếng Anh giọng Mỹ sẽ gặp khó khăn khi đàm thoại với một đối tác nói tiếng Mỹ giọng Ấn Độ!”.

Shawn Zhang, trái, Maxim Serebriakov và Andres Perez Soderi (ảnh: Sanas)

Những trải nghiệm cá nhân

Bộ ba sáng lập Sanas quen nhau tại Đại học Stanford, nhưng họ đến từ các quốc gia khác nhau. Maxim Serebryakov, Giám đốc điều hành, đến từ Nga; Andrés Pérez Soderi, Giám đốc tài chính, đến từ Venezuela; và Shawn Zhang, Giám đốc công nghệ, đến từ Trung Quốc. Serebryakov và Pérez đã tốt nghiệp; Zhang bỏ học để tập trung đưa Sanas vào cuộc sống. Năm 2021 họ thành lập công ty và đặt cho nó một cái tên có thể dễ dàng phát âm bằng nhiều ngôn ngữ khác nhau.

Serebryakov tâm sự: “Cả ba chúng tôi đều xuất thân từ các quốc gia khác nhau và từng tận mắt chứng kiến ​​cách nhiều người bị đối xử tệ và không công bằng chỉ vì phương ngôn hay giọng nói của họ. Bạn khác biệt hay thua kém người khác chẳng phải do tài năng mà chỉ vì cách bạn nói. Thật không vui, và đôi khi rất đau lòng!”. Zhang cho biết mẹ của anh đến Mỹ hơn 20 năm trước, thường nhờ anh nói chuyện với nhân viên thu ngân khi hai mẹ con đi mua hàng tạp hóa vì bà thấy xấu hổ với tiếng Mỹ giọng Hoa của mình. Serebryakov nhớ lại cách cha mẹ anh bị đối xử tại các khách sạn khi họ đến thăm anh ở Mỹ cũng chỉ vì giọng nói. Còn Pérez cho biết sau khi tốt nghiệp trung học ở Vương quốc Anh, anh vẫn phải vật lộn để hiểu giọng Mỹ trong những tháng đầu đến Mỹ. Anh càng quan tâm đến phương ngôn hơn nữa khi thấy người bố cố sử dụng trợ lý ảo Amazon Alexa mà gia đình mua tặng ông vào dịp Giáng sinh.

Sẽ còn nhiều cải tiến

Tiếng Anh là ngôn ngữ được sử dụng nhiều nhất trên thế giới. Ước tính có khoảng 1.5 tỷ người sử dụng và hầu hết không phải người bản ngữ. Chỉ riêng tại Mỹ, hàng triệu người nói tiếng Anh như ngôn ngữ thứ hai. Điều đó tạo ra một thị trường ngày càng lớn cho các ứng dụng giúp người dùng luyện phát âm tiếng Anh sao cho chuẩn. Nhưng Sanas sử dụng AI để thực hiện một cách tiếp cận khác. Trước hết, bạn không cần khổ sở học cách phát âm các từ khác nhau mà công nghệ có thể làm điều đó cho bạn. Sẽ không còn cần theo học các khóa phát âm chuẩn tốn kém và mất thời gian mà sự điều chỉnh sẽ đến ngay lập tức khi bạn đang nói nhờ công nghệ trung gian.

Thuật toán của Sanas đã chuyển đổi được tiếng Anh chuẩn sang (và từ) tiếng Anh giọng Mỹ, giọng Úc, Anh, Philippines, Ấn Độ và Tây Ban Nha (sẽ sớm bổ sung thêm). Nhóm Sanas đã có hai cuộc trình diễn cho truyền thông xem. Lần thứ nhất, một người đàn ông nói tiếng Anh giọng Ấn Độ được nghe đọc một loạt trích đoạn văn học. Sau đó, những cụm từ này được chuyển thành tiếng Anh giọng Mỹ. Lần hai là nghe các cụm từ tiếng Anh phổ biến tại trung tâm cuộc gọi, chẳng hạn câu “Nếu bạn cung cấp tên đầy đủ và số thứ tự của bạn, chúng tôi sẽ giúp bạn” được chuyển thành phương ngôn người nghe.

Hiện kế hoạch của công ty khởi nghiệp là huy động nhiều hơn khoản tiền $5.5 triệu góp vốn từ đầu năm nay để Sanas có thể phát triển đội ngũ nhân viên tại trụ sở ở Palo Alto, California. Một ngày nào đó, Sanas có thể giúp việc học ngôn ngữ, cải thiện việc lồng tiếng trong phim; giúp các thiết bị khác như loa thông minh hoặc trợ lý giọng nói trên xe hơi. Và không chỉ tiếng Anh mà sẽ có thêm các ngôn ngữ khác.

Share:

Ý kiến độc giả
Quảng Cáo

Có thể bạn chưa đọc

Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Share trang này:
Facebook
Twitter
Telegram
WhatsApp
LinkedIn
Email
Kênh Saigon Nhỏ: