Root NationTin tứcTin tức CNTTTại Tokyo, những thành công của robot hình người Alter3 dựa trên GPT-4 đã được trình chiếu

Tại Tokyo, những thành công của robot hình người Alter3 dựa trên GPT-4 đã được trình chiếu

-

Một nhóm tại Đại học Tokyo đã tiết lộ Alter3, một robot hình người có thể thực hiện các chuyển động bằng Mô hình ngôn ngữ lớn GPT-4 (LLM). Alter3 sử dụng công cụ mới nhất Mở AI để tự động thực hiện các tư thế khác nhau, từ tư thế selfie đến tư thế bóng ma, tất cả đều không cần mục nhập cơ sở dữ liệu được lập trình sẵn.

Các nhà nghiên cứu cho biết: “Phản hồi của Alter3 đối với nội dung hội thoại bằng cách sử dụng nét mặt và cử chỉ là một bước tiến đáng kể trong chế tạo robot hình người, có thể dễ dàng thích ứng với các android khác với những thay đổi tối thiểu”.

thay đổi3

Trong lĩnh vực tích hợp LLM với robot, trọng tâm là cải thiện khả năng giao tiếp cơ bản và mô hình hóa các phản hồi thực tế. Các nhà nghiên cứu cũng đang nghiên cứu khả năng của LLM để cho phép robot hiểu và thực hiện các hướng dẫn phức tạp, từ đó tăng cường chức năng của chúng.

Theo truyền thống, quản lý cấp thấp người máy bị ràng buộc với phần cứng và nằm ngoài tầm nhìn của các tập đoàn LLM. Điều này tạo ra khó khăn cho việc quản lý trực tiếp các công việc dựa trên LLM. Để giải quyết vấn đề này, nhóm Nhật Bản đã phát triển một phương pháp chuyển đổi các biểu hiện chuyển động của con người thành mã dễ hiểu cho Android. Điều này có nghĩa là robot có thể tạo ra các chuỗi hành động một cách độc lập theo thời gian mà không cần nhà phát triển phải lập trình riêng từng bộ phận cơ thể.

Trong quá trình tương tác, một người có thể đưa ra các lệnh Alter3 như “Chụp ảnh tự sướng bằng iPhone của bạn”. Sau đó, robot bắt đầu một loạt yêu cầu tới GPT-4 để nhận được hướng dẫn về các bước cần thiết. GPT-4 sẽ dịch mã này sang mã Python cho phép tác phẩm "hiểu" và thực hiện các chuyển động cần thiết. Sự đổi mới này cho phép Alter3 di chuyển phần thân trên của mình trong khi phần thân dưới vẫn đứng yên, gắn vào giá đỡ.

Alter3 là phiên bản thứ ba trong loạt robot hình người của Alter kể từ năm 2016, tự hào với 43 bộ truyền động chịu trách nhiệm về nét mặt và cử động chân tay được cung cấp bởi khí nén. Cấu hình này cung cấp một loạt các cử chỉ biểu cảm. Robot không thể bước đi nhưng có thể bắt chước các chuyển động đi và chạy thông thường.

Alter3 cũng thể hiện khả năng sao chép tư thế của con người bằng máy ảnh và khung OpenPose. Robot điều chỉnh các khớp của nó theo các tư thế được quan sát và lưu lại các mô phỏng thành công để sử dụng sau này. Tương tác với con người dẫn đến các tư thế đa dạng hơn, ủng hộ ý tưởng rằng các chuyển động khác nhau đến từ việc bắt chước con người, tương tự như cách trẻ sơ sinh học thông qua bắt chước.

Trước LLM, các nhà nghiên cứu phải điều khiển cẩn thận tất cả 43 bộ truyền động để tái tạo tư thế của một người hoặc mô phỏng hành vi, chẳng hạn như phục vụ trà hoặc chơi cờ. Điều này đòi hỏi phải điều chỉnh thủ công nhiều lần, nhưng AI đã giúp giải phóng nhóm khỏi thói quen này. “Chúng tôi kỳ vọng Alter3 sẽ tham gia vào cuộc đối thoại một cách hiệu quả bằng cách hiển thị nét mặt và cử chỉ phù hợp với ngữ cảnh. Nó chứng tỏ khả năng phản ánh cảm xúc, chẳng hạn như thể hiện nỗi buồn hay hạnh phúc để đáp lại, từ đó chia sẻ cảm xúc với chúng ta”, các nhà nghiên cứu cho biết.

Đọc thêm:

Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận