Meta vừa giới thiệu SeamlessM4T - Mô hình dịch giọng nói đa phương thức - Nghĩa AI

Meta vừa giới thiệu SeamlessM4T - Mô hình dịch giọng nói đa phương thức - Nghĩa AI

Đưa thế giới đến gần nhau hơn bằng mô hình dịch giọng nói đa phương thức - Nghĩa AI

Meta vừa giới thiệu một mô hình đa ngôn ngữ và đa nhiệm nền tảng giúp dịch và phiên âm liền mạch giữa lời nói và văn bản SeamlessM4T

  • Tự động nhận dạng giọng nói cho gần 100 ngôn ngữ
  • Dịch giọng nói thành văn bản cho gần 100 ngôn ngữ đầu vào và đầu ra
  • Dịch giọng nói thành giọng nói, hỗ trợ gần 100 ngôn ngữ đầu vào và 35 (+ tiếng Anh) ngôn ngữ đầu ra
  • Dịch văn bản sang văn bản cho gần 100 ngôn ngữ
  • Dịch văn bản thành giọng nói, hỗ trợ gần 100 ngôn ngữ đầu vào và 35 (+ tiếng Anh) ngôn ngữ đầu ra

 

Thế giới chúng ta đang sống chưa bao giờ được kết nối với nhau nhiều hơn—sự phổ biến toàn cầu của Internet, thiết bị di động, phương tiện truyền thông xã hội và nền tảng truyền thông giúp mọi người truy cập vào nhiều nội dung đa ngôn ngữ hơn bao giờ hết. Trong bối cảnh như vậy, việc có khả năng giao tiếp và hiểu thông tin theo yêu cầu bằng bất kỳ ngôn ngữ nào ngày càng trở nên quan trọng. Trong khi khả năng như vậy đã được mơ ước từ lâu trong khoa học viễn tưởng thì AI đang trên đà biến tầm nhìn này thành hiện thực về mặt kỹ thuật.

Meta và Nghĩa AI tin rằng SeamlessM4T là một bước đột phá quan trọng trong nỗ lực tạo ra các hệ thống đa nhiệm phổ quát của cộng đồng AI. Để phù hợp với cách tiếp cận của chúng tôi đối với khoa học mở, chúng tôi rất vui mừng được chia sẻ công khai mô hình của mình để cho phép các nhà nghiên cứu và nhà phát triển xây dựng trên công nghệ này.

Đây chỉ là bước mới nhất trong nỗ lực không ngừng của chúng tôi nhằm xây dựng công nghệ hỗ trợ AI giúp kết nối mọi người bằng các ngôn ngữ. Trong tương lai, chúng tôi muốn khám phá cách mô hình nền tảng này có thể kích hoạt các khả năng giao tiếp mới—cuối cùng là đưa chúng ta đến gần hơn với một thế giới mà mọi người đều có thể hiểu được.

Link thử nghiệm: https://seamless.metademolab.com/demo

Cả nhà vào Test thử nha, record một đoạn tiếng nói của mình, xong chọn ngôn ngữ muốn dịch sang,tận hưởng thành quả.

Computer Engineer-Võ Trọng Nghĩa - ĐT: 0903637039 - Tư vấn các ứng dụng AI Miễn phí 24/24


(*) Xem thêm

Bình luận
  • Đánh giá của bạn
Đã thêm vào giỏ hàng