Facebook Rosetta
Công Nghệ Số Thế Giới Số

AI “Rosetta” của Facebook trích xuất văn bản từ hình ảnh

3 phút, 42 giây để đọc.

Công nghệ ngày càng phát triển đặc biệt là mạng xã hội, cũng như những công nghệ số mới. Từ lâu chúng ta đều đã biết đến Facebook. Trang mạng xã hội có lượng người dùng lớn gần nhất thế giới hiện nay.

 Facebook, Inc là một công ty phương tiện truyền thông xã hội và dịch vụ mạng xã hội trực tuyến. Với các tính năng và nhu cầu sử dụng của rất nhiều người trên thế giới. Việc phát triển những công cụ tính năng mới này, luôn luôn được đặt lên hàng đầu đối với Facebook. Như công cụ hỗ trợ chống dịch COVID-19. Giúp cơ quan chức năng có số liệu về bệnh nhân. Góp phần chăm sóc và giúp bệnh nhân ghi chép cập nhật tình hình sức khỏe. 

Tính năng ghép đôi hẹn hò trên Facebook cũng là một tính năng tiêu biểu. Cập nhật tình hình trong thiên tai ở nhiều khu vực, cảnh báo an toàn cho người dùng. Vì thói quen dùng Facebook, check Facebook của nhiều người. Tính năng mua hàng trên Facebook, cũng đang được mở rộng ở nhiều quốc gia.

Và đặc biệt là tính năng biên dịch tự động. Mạng xã hội lớn nhất hành tinh này hiện còn có thể hoạt động với 24 ngôn ngữ mới.

Tính năng Biên dịch ngôn ngữ Rosetta

Mọi người khi online không chỉ giao tiếp với nhau thông qua ngôn từ mà còn qua hình ảnh. Đối với một nền tảng như Facebook với hơn 2 tỷ người hoạt động mỗi tháng. Điều đó có nghĩa là có vô số các hình ảnh được đăng tải mỗi ngày, bao gồm cả các meme. Nhằm đưa các hình ảnh đi kèm với văn bản vào các kết quả tìm kiếm hình ảnh tương ứng. Để các chương trình đọc màn hình có thể hiểu được nội dung được viết trên các hình ảnh và đảm bảo chúng không chứa các nội dung xấu. Các từ ngữ vi phạm chính sách nội dung của website, Facebook đã tạo và triển khai một hệ thống machine learning quy mô rộng gọi là “Rosetta”.

Facebook cần một hệ thống nhận diện ký tự quang học có thể thường xuyên xử lý một lượng lớn nội dung. Do đó họ phải “cầu cứu” đến công nghệ của riêng mình. Theo mạng xã hội này, Rosetta có thể trích xuất văn bản từ hơn 1 tỷ hình ảnh. Và khung hình video có bao gồm rất nhiều loại ngôn ngữ khác nhau mỗi ngày trong thời gian thực!

Facebook Rosetta Biên dịch

Trong một bài đăng blog mới, công ty đã giải thích cách thức hoạt động của Rosetta như sau: nó bắt đầu bằng cách phát hiện. Các vùng hình chữ nhật trong các hình ảnh có khả năng chứa văn bản. Sau đó, nó sử dụng một mạng thần kinh xoắn ốc để nhận diện và biên dịch nội dung được viết trong vùng đó. Kể cả các từ không phải Tiếng Anh hay các ký tự không phải Tiếng Latin, như Ả-rập và Hindi. Để huấn luyện hệ thống này, Facebook đã sử dụng một tập hợp các hình ảnh công khai được ghi chú bởi cả con người lẫn máy tính.

AI của Facebook tìm kiếm các vùng hình chữ nhật có khả năng chứa văn bản trong một hình ảnh

Cho phép lọc ngôn ngữ từ hình ảnh

Các nhóm khác nhau trong nội bộ Facebook và Instagram đã và đang sử dụng Rosetta để kiểm duyệt các nội dung. Và giữ cho các nền tảng mạng xã hội của họ luôn trong tình trạng “sạch sẽ”. Công ty có dự định tiếp tục “dạy” cho AI của mình biết thêm nhiều ngôn ngữ nửa. Đồng thời cải thiện kỹ năng trích xuất văn bản từ các khung hình video của nó.

Facebook Rosetta

Hiện Facebook đã thêm vào dịch vụ biên dịch tự động của mình 24 ngôn ngữ mới. Bao gồm tiếng Serbia, Belarus, Marathi, Sinhal, Telugu, Nepal, Kannada, Urdu, Punjabi, Cambodia, Pashto, Mongolia, Zulu, Xhosa và Somali. Facebook thừa nhận rằng khả năng biên dịch các ngôn ngữ mới thêm vào này vẫn còn ở giai đoạn sơ khai, do đó sẽ có khá nhiều lỗi biên dịch. Hãng dự định tiếp tục cải tiến chúng và giới thiệu thêm nhiều ngôn ngữ nữa trong tương lai.

Nguồn: khoahocphattrien.vn

 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *