Google biến tính năng phóng to và nâng cao hình ảnh trở thành hiện thực

Bạn có thể đã từng xem các bộ phim giả tưởng hoặc chương trình truyền hình mà nhân vật chính yêu cầu phóng to hình ảnh và cải thiện kết quả - để hiển thị khuôn mặt, biển số xe hoặc bất kỳ chi tiết quan trọng nào khác. Hệ thống trí tuệ nhân tạo (AI) mới nhất của Google, dựa trên cái gọi là mô hình khuếch tán, có thể thực hiện thủ thuật này.

Đó là một quá trình phức tạp để thành thạo vì về cơ bản nó thêm chi tiết vào hình ảnh mà máy ảnh không chụp ban đầu, sử dụng các dự đoán siêu thông minh dựa trên các hình ảnh tương tự khác.

Google

Tại Google, kỹ thuật này được gọi là tổng hợp hình ảnh tự nhiên và trong trường hợp cụ thể này là độ phân giải hình ảnh siêu cao. Bạn bắt đầu với một bức ảnh nhỏ, có pixel và kết thúc với một bức ảnh sắc nét, rõ ràng và tự nhiên. Nó có thể không chính xác là bản gốc, nhưng nó đủ gần để nhìn thật đối với mắt người.

Google đã giới thiệu hai công cụ AI mới cho công việc này. Đầu tiên được gọi là SR3, hoặc Siêu phân giải thông qua Tinh chỉnh lặp lại, và nó hoạt động bằng cách thêm nhiễu vào hình ảnh và sau đó loại bỏ nó. Thông qua một loạt các tính toán xác suất dựa trên cơ sở dữ liệu lớn về hình ảnh và một số phép thuật máy học, SR3 có thể hình dung phiên bản độ phân giải siêu cao của hình ảnh pixel có độ phân giải thấp trông như thế nào.

Công cụ thứ hai là CDM, hoặc Mô hình khuếch tán theo tầng. Google mô tả những điều này là "đường ống" mà theo đó các mô hình khuếch tán - bao gồm SR3 - có thể được định hướng để nâng cấp hình ảnh chất lượng cao. Cần cải tiến các mô hình và biến chúng thành hình ảnh lớn hơn.

Google

Theo Google, bằng cách sử dụng các mô hình nâng cao khác nhau ở các độ phân giải khác nhau, phương pháp CDM có thể hoạt động tốt hơn các phương pháp nâng cấp hình ảnh thay thế. Công cụ AI mới đã được thử nghiệm trên ImageNet, một cơ sở dữ liệu khổng lồ về hình ảnh đào tạo thường được sử dụng để nghiên cứu nhận dạng đối tượng trực quan.

Kết quả cuối cùng của SR3 và CDM rất ấn tượng. Trong một thử nghiệm tiêu chuẩn với 50 tình nguyện viên là con người, hình ảnh khuôn mặt người do SR3 tạo ra đã bị nhầm với ảnh thực khoảng 50% - và xem xét rằng một thuật toán lý tưởng sẽ đạt được 50%, điều đó thật ấn tượng. Cần nhắc lại rằng những hình ảnh nâng cao này không phải là những hình ảnh trùng khớp chính xác với bản gốc, chúng là những mô phỏng được tính toán cẩn thận dựa trên toán học xác suất.

Google

Google hứa hẹn nhiều hơn nữa từ các công cụ AI mới và các công nghệ liên quan - không chỉ về mặt tăng cường hình ảnh của khuôn mặt và các vật thể tự nhiên khác, mà còn trong các lĩnh vực khác của mô hình xác suất.

Đọc thêm:

Dzherelokhoa học

Đăng ký

0 Nhận xét

Bài đánh giá được nhúng

Xem tất cả các bình luận

Các bài báo khác

Giống như trong phim: AI xử lý ảnh mới của Google biến việc mở rộng quy mô và nâng cao chúng thành hiện thực

Những ý kiến gần đây

Giống như trong phim: AI xử lý ảnh mới của Google biến việc mở rộng quy mô và nâng cao chúng thành hiện thực

Những ý kiến ​​gần đây

Những ý kiến gần đây