Dịch máy sẽ là tương lai của dịch thuật?

Trí tuệ nhân tạo (AI) đã hiện diện trong nhiều công cụ hỗ trợ như nhận diện khuôn mặt, giọng nói; tham gia vào nghiên cứu và chương trình dịch tự động. Thêm vào đó, hiệu quả của các công cụ hỗ trợ này đã được cải thiện rất nhiều trong những năm gần đây.

Dưới đây là những trao đổi về vấn đề này với GS. Yoshua Bengio, người tiên phong trong lĩnh vực Deep learning (tạm dịch là: Học sâu, một phương pháp "dạy" máy tính) và là giám đốc khoa học của Mila - Viện nghiên cứu về trí tuệ nhân tạo Québec, Canada; cùng với PGS. Aaron Courville - cũng là thành viên của Mila.

Yoshua cho biết rằng trong lĩnh vực dịch tự động, sự tiến bộ là vô cùng rõ rệt: "Chất lượng bản dịch đã tốt hơn rất nhiều so với 4 năm trước đây".

Cùng với nhà nghiên cứu Ian Goodfellow, họ đã cho ra mắt cuốn sách Deep Learning vào năm 2016 bằng tiếng Anh và không lâu sau là phiên bản bằng tiếng Pháp nhờ vào ý tưởng của một nhóm người Pháp. Nhóm người này đề xuất rằng: Dùng chính công cụ sử dụng nền tảng học sâu để... dịch cuốn sách về học sâu.

Ở đâu khó, ở đó có con người

 

Công cụ dịch này có tên là DeepL đã dịch xong hơn 700 trang, nhưng bản dịch đầu tiên vẫn không thể xuất bản được vì có quá nhiều lỗi. Nếu sử dụng công cụ để dịch một câu hay một đoạn văn thì khá đơn giản nhưng dịch nhiều trang một lúc thì lại là một câu chuyện khác. Giám đốc của Mila cho biết rằng: "Công cụ này phạm khá nhiều lỗi tuy rằng người đọc vẫn có thể hiểu phần nào nội dung. Nhưng khi xét đến khía cạnh sử dụng chính xác từ vựng và ngữ pháp thì đây vẫn là điều không thể của trí tuệ nhân tạo".

Ông cho biết thêm: "Phiên dịch viên vẫn cần phải xem và sửa lại những lỗi trong bản dịch tự động ‎mà không con người nào phạm phải". Để giúp chiếc máy này, các nhà nghiên cứu và các lập trình viên đã thêm vào trường từ vựng, các thuật ngữ Pháp - Anh. Nhưng kể cả vậy thì trí tuệ nhân tạo vẫn gặp phải khó khăn vì nó không thể tìm ra mối liên hệ giữa các từ đó với việc hiểu ngữ cảnh. Ông Yoshua Bengio nhấn mạnh rằng: "Trí tuệ nhân tạo không hiểu được thế giới quan xung quanh nó. Phải có được sự quy chiếu của những từ ngữ đó với thực tế thì mới có thể dịch tốt được. Cũng giống như bảo đứa trẻ hai tuổi hiểu biết về cuộc đời vậy".

Ví dụ con bò ở bãi biển

 

Để minh họa rõ hơn việc máy tính gặp khó khăn trong việc dịch, Aaron Courville dùng hai bức ảnh: bức thứ nhất có một con bò sữa ở trên đồng cỏ và bức thứ hai có một con bò sữa... ở trên bãi biển. Trường hợp đầu tiên thì máy tính nhận ra ngay đó là con bò sữa, nhưng trong bức ảnh thứ hai, máy tính không thể nhận ra đó là con bò sữa. Ông giải thích rằng: "Con bò sữa dường như đã vô hình đối với máy tính vì chúng ta hiếm khi thấy bò sữa ở ngoài biển". Con người chúng ta không có khó khăn gì khi nhận diện loài động vật có vú đó, nhưng những gì trí tuệ nhân tạo thấy chỉ toàn là bãi biển và cát. Những điều nho nhỏ này không giúp máy móc hiểu về thế giới - điều sẽ giúp quá trình dịch cải tiến rất nhiều, và (một ngày nào đó) trở thành công cụ dịch của tương lai.

Minh Đức (Theo quebecscience.qc.ca)