Root NationTin tứcTin tức CNTTMeta trình bày mô hình AI để dịch các cuộc hội thoại và văn bản sang 100 ngôn ngữ

Meta trình bày mô hình AI để dịch các cuộc hội thoại và văn bản sang 100 ngôn ngữ

-

Siêu dữ liệu trình bày một mô hình AI khác dành cho các nhà nghiên cứu và công ty quan tâm đến dịch ngôn ngữ và các ứng dụng liên quan. Gã khổng lồ công nghệ đã phát triển mô hình tất cả trong một đầu tiên có thể thực hiện nhiều tác vụ bằng 100 ngôn ngữ.

Mô hình AI mới của Meta có tiềm năng trở thành nền tảng cho các dịch vụ “dịch thuật phổ quát” đáng tin cậy và hiệu quả. Nó được gọi là DànM4T và là mô hình dịch thuật và phiên âm đa ngôn ngữ, “đa phương thức” phổ biến đầu tiên với AI. Đại diện công ty Meta tuyên bố rằng mô hình này cung cấp hỗ trợ tới 100 ngôn ngữ khác nhau, tùy thuộc vào nhiệm vụ cụ thể.

Siêu dữ liệu

DànM4T là mô hình đa ngôn ngữ và đa tác vụ cơ bản có khả năng dịch và phiên âm cả lời nói và văn bản, tạo ra các bản dịch ở nhiều định dạng khác nhau, bao gồm giọng nói thành giọng nói, giọng nói thành văn bản, văn bản thành giọng nói và văn bản- thành văn bản. . Điều thú vị là mô hình AI mới có thể thực hiện nhận dạng giọng nói tự động mà không cần sử dụng mẫu cơ sở.

Hỗ trợ ngôn ngữ tùy thuộc vào nhiệm vụ: bản dịch giọng nói sang giọng nói và văn bản sang giọng nói được hỗ trợ bằng 35 ngôn ngữ (cộng với tiếng Anh) và khoảng 100 ngôn ngữ có sẵn cho tất cả các chế độ khác. Công ty Siêu dữ liệu đã phát hành mã DànM4T theo giấy phép Creative Commons (CC BY-NC 4.0), cho thấy ý định trao quyền cho các nhà nghiên cứu và nhà phát triển sử dụng công việc của mình để tạo ra các ứng dụng và giải pháp mới.

Meta DànM4T

AI DànM4T, dường như được lấy cảm hứng từ chú cá dịch giả hư cấu trong cuốn Hướng dẫn du lịch vũ trụ đến thiên hà của Douglas Adams, nhằm mục đích biến khái niệm "người phiên dịch phổ quát" từ hư cấu thành hiện thực. Cách tiếp cận đa phương thức được mô hình sử dụng có khả năng giảm thiểu sai sót và độ trễ, từ đó nâng cao hiệu quả và chất lượng dịch thuật cho những người nói các ngôn ngữ khác nhau. Công nghệ này có thể tạo điều kiện thuận lợi hơn cho khả năng tiếp cận và hiểu biết giữa những người có nền tảng ngôn ngữ khác nhau.

Meta DànM4T

Trong DànM4T, Meta đề cập đến mô hình dịch máy chuyển văn bản thành văn bản của riêng mình là NLLB (No Language Left Behind), hỗ trợ 200 ngôn ngữ và đã được tích hợp vào Wikipedia. Ngoài ra, công ty còn ghi nhận việc trình diễn Universal Speech Translator gần đây, đánh dấu sự ra đời của hệ thống dịch trực tiếp giọng nói thành giọng nói đầu tiên cho Phúc Kiến (một loại tiếng Trung Quốc).

Ngoài ra, mô hình Lời nói đa ngôn ngữ đại chúng mới được giới thiệu của Meta bao gồm khả năng nhận dạng giọng nói, nhận dạng giọng nói và tổng hợp giọng nói ở hơn 1100 ngôn ngữ. TRONG Blog Meta AI có thể tìm hiểu thêm về mô hình DànM4T, khả năng dịch thuật và cách tiếp cận có trách nhiệm của nó đối với các chủ đề nhạy cảm như độc tính và sai lệch giới tính, đồng thời mã DànM4T có sẵn tại GitHub.

Đọc thêm:

Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận