Root NationTin tứcTin tức CNTTApple giới thiệu mô hình AI mới RealM

Apple giới thiệu mô hình AI mới RealM

-

Các nhà nghiên cứu Apple đã phát triển một hệ thống trí tuệ nhân tạo có tên ReALM (Độ phân giải tham chiếu dưới dạng mô hình hóa ngôn ngữ), nhằm mục đích cải thiện triệt để cách trợ lý giọng nói hiểu và phản hồi các lệnh.

Trong một bài nghiên cứu Apple mô tả một khuôn khổ mới về cách các mô hình ngôn ngữ lớn giải quyết vấn đề về độ phân giải tham chiếu, bao gồm giải mã các tham chiếu mơ hồ đến các đối tượng trên màn hình, cũng như hiểu ngữ cảnh hội thoại và bối cảnh. Do đó, ReALM có thể mang lại sự tương tác trực quan và tự nhiên hơn với các thiết bị.

Apple

Nhận dạng tham chiếu là một phần quan trọng trong việc hiểu ngôn ngữ tự nhiên, cho phép người dùng sử dụng đại từ và các tham chiếu gián tiếp khác trong cuộc trò chuyện mà không nhầm lẫn. Đối với trợ lý kỹ thuật số, khả năng này trước đây là một thách thức đáng kể, bị hạn chế bởi nhu cầu diễn giải nhiều loại tín hiệu bằng lời nói và thông tin hình ảnh. Hệ thống ReALM từ Apple nhằm mục đích giải quyết vấn đề này bằng cách biến quá trình nhận dạng tham chiếu phức tạp thành một nhiệm vụ mô hình hóa ngôn ngữ thuần túy. Bằng cách này, cô ấy có thể hiểu các tham chiếu đến các yếu tố hình ảnh hiển thị trên màn hình và tích hợp sự hiểu biết này vào luồng đàm thoại.

ReALM tái tạo lại cấu trúc hình ảnh của màn hình bằng cách sử dụng các biểu diễn văn bản. Điều này bao gồm phân tích cú pháp các đối tượng trên màn hình và sắp xếp chúng để tạo định dạng văn bản phản ánh nội dung và cấu trúc của màn hình. Các nhà nghiên cứu Apple nhận thấy rằng chiến lược này, kết hợp với việc điều chỉnh đặc biệt các mô hình ngôn ngữ cho các vấn đề về độ phân giải điểm chuẩn, vượt trội hơn đáng kể so với các phương pháp truyền thống, bao gồm cả khả năng GPT-4 của OpenAI.

Apple

ReALM có thể cho phép người dùng tương tác hiệu quả hơn nhiều với trợ lý kỹ thuật số dựa trên những gì hiện đang hiển thị trên màn hình mà không cần hướng dẫn chính xác, chi tiết. Điều này có thể làm cho trợ lý giọng nói trở nên hữu ích hơn nhiều trong nhiều tình huống khác nhau, chẳng hạn như giúp người lái xe điều hướng hệ thống thông tin giải trí trong khi lái xe hoặc hỗ trợ người dùng khuyết tật bằng cách cung cấp các phương tiện tương tác gián tiếp dễ dàng và chính xác hơn.

Apple đã xuất bản một số tài liệu nghiên cứu trong lĩnh vực AI. Tháng trước, công ty đã tiết lộ một phương pháp mới để học các mô hình ngôn ngữ lớn tích hợp liền mạch cả thông tin văn bản và hình ảnh. Điều cần trông đợi là Apple sẽ giới thiệu một số tính năng AI tại hội nghị WWDC vào tháng 6.

Đọc thêm:

DzhereloMacrumors
Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận