Root NationTin tứcTin tức CNTTMicrosoft tuyên bố đã phát triển "hệ thống sửa lỗi chính tả toàn diện nhất"

Microsoft tuyên bố đã phát triển "hệ thống sửa lỗi chính tả toàn diện nhất"

-

Tập đoàn Microsoft trình bày một hệ thống trí tuệ nhân tạo được gọi là chính tả100, sửa lỗi chính tả trong hơn 100 ngôn ngữ được sử dụng trong tìm kiếm Bing.

"Chúng tôi tin rằng Speller100 là hệ thống sửa lỗi chính tả toàn diện nhất từng được tạo ra xét về mức độ bao phủ và độ chính xác của ngôn ngữ", công ty cho biết trong một bài đăng trên blog.

Microsoft Chỉnh sửa cải tiến Speller100

Trước đây, Bing đã cung cấp tính năng sửa lỗi chính tả chất lượng cao cho khoảng hai chục ngôn ngữ. Tuy nhiên, hệ thống không có đủ dữ liệu đào tạo để hoạt động tốt bằng các ngôn ngữ có ít sự hiện diện trên web và phản hồi hạn chế của người dùng.

Microsoft Speller100 Điểm tương đồng

Hệ thống Speller100 khắc phục những hạn chế này bằng cách tìm kiếm những điểm tương đồng giữa các họ ngôn ngữ lớn. Nó cũng áp dụng "đào tạo bắn không" (ZSL - học không bắn) để sửa lỗi mà không yêu cầu dữ liệu huấn luyện bổ sung.

Microsoft giải thích

Microsoft cho biết họ đã tạo ra khoảng chục mô hình họ ngôn ngữ để tối đa hóa lợi ích của việc "học không cần học":

Hãy tưởng tượng ai đó dạy bạn viết bằng tiếng Anh và bạn tự động học viết bằng tiếng Đức, tiếng Hà Lan, tiếng Afrikaans, tiếng Scotland và tiếng Luxembourg. Đây là những khả năng mà "zero-shot learning" mang lại cho chúng tôi và đó là một thành phần quan trọng trong Speller100 cho phép chúng tôi mở rộng sang các ngôn ngữ có rất ít hoặc không có dữ liệu.

Hệ thống cũng giảm nhu cầu về các chú thích do con người tạo ra bằng cách trích xuất văn bản từ các trang web để tạo ra các lỗi phổ biến.

Microsoft Chú thích của con người Speller100

“Những văn bản như vậy có thể được trích xuất dễ dàng bằng cách quét Internet và nó đủ để dạy hàng trăm ngôn ngữ”, ông nói. Microsoft.

Sau khi tiến hành thử nghiệm trực tuyến, công ty báo cáo kết quả như sau:

  • Số trang không có kết quả đã giảm xuống 30%.
  • Số trường hợp người dùng phải định dạng lại truy vấn của họ theo cách thủ công đã giảm 5%.
  • Số lần người dùng nhấp vào gợi ý chính tả đã tăng từ một chữ số lên 67%.
  • Số lần nhấp của người dùng vào bất kỳ thành phần nào trên trang đã tăng từ một chữ số lên 70%.

Microsoft cho biết việc tích hợp hệ thống Speller100 vào Bing chỉ là bước đầu tiên. Công ty có kế hoạch bổ sung công nghệ này vào “nhiều” sản phẩm của mình trong tương lai gần.

Đọc thêm:

Dzherelothennextweb
Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận