Kỹ sư Nguyễn Thị Hoàng Yến làm việc cho công ty Google. Đây là ý kiến của cô về Google Translate. Chúng tôi đăng lên để rộng đường dư luận trong khi tiếp tục suy nghĩ về những nhận định và đề xuất của cô.
Có điều kiện làm việc với các ký giả của Công Giáo Hoa Kỳ, chúng tôi ghi nhận ngày càng nhiều ký giả Công Giáo sử dụng Google Translate để dịch các bản văn của Tòa Thánh từ tiếng Latinh, hay tiếng Ý sang tiếng Anh. Họ đánh giá rất cao dịch vụ thông dịch đa ngôn ngữ này.
Tuy nhiên, trong những cuộc thảo luận gần đây với các ký giả Công Giáo Việt Nam, chúng tôi “kinh hoàng” nhận ra khuynh hướng hoàn toàn ngược lại. Thậm chí, một ký giả có trách nhiệm điều hành một Web site lớn của Công Giáo Việt Nam nói: “Chúng tôi không chấp nhận cho ký giả nào dùng Google Translate, nếu phát hiện chúng tôi delete ngay lập tức.”
Tôi cho rằng đánh giá thấp và đầy thành kiến với các nhu liệu thông dịch, đặc biệt trong trường hợp Google Translate, là một điều “dại dột” và sẽ có những hậu quả tiêu cực đối với sự phát triển của đạo Công Giáo trong nước cũng như trong các cộng đoàn Công Giáo Việt Nam hải ngoại. Tại sao?
Lịch sử và giải thuật của Google Translate
Google Translate là một dịch vụ thông dịch đa ngôn ngữ miễn phí được hình thành và liên tục phát triển bởi Google. Google Translate hỗ trợ hơn 100 ngôn ngữ ở nhiều cấp độ khác nhau và tính đến tháng 5 năm 2017, phục vụ hơn 500 triệu người mỗi ngày. May mắn cho chúng ta, Việt Ngữ là một trong các ngôn ngữ được hỗ trợ.
Thế mạnh của Google là một search engine được xây dựng trên một cơ sở dữ liệu hùng hậu không có công ty nào có thể sánh bằng, và một giải thuật tìm kiếm siêu tốc. Search engine của Google nổi tiếng đến mức động từ “to google” đã được đưa vào từ điển; và có lẽ ngày nay khó tìm ra được một người nào biết dùng computer hay các điện thoại thông minh mà chưa từng dùng qua search engine của Google.
Dựa trên thế mạnh của search engine này, ngay từ đầu Google Translate đã được xây dựng trên một giải thuật hoàn toàn khác hẳn với các chương trình thông dịch đa ngôn ngữ khác. Nó không tìm cách áp dụng các quy luật văn phạm và các phương pháp phân tích câu cổ điển. Thay vì dịch trực tiếp như thế, nó tìm kiếm các mẫu tương tự (pattern) trong hàng triệu tài liệu có trong database khổng lồ của mình để quyết định bản dịch tốt nhất.
Ra mắt vào tháng 4 năm 2006, ban đầu Google Translate thu thập các bản dịch những tài liệu đa ngôn ngữ của các định chế quốc tế trong đó các thành viên sử dụng các ngôn ngữ khác nhau. Các bản dịch đa ngôn ngữ của Liên Hợp Quốc và Quốc Hội Âu Châu là những tài liệu được đưa vào sớm nhất. Sau những thỏa thuận với Vatican vào tháng Hai, 2007, các tài liệu của Tòa Thánh đã được đưa vào Google Translate, cùng với hàng loạt các transcripts từ tiếng Latinh sang tiếng Anh, tiếng Ý, tiếng Pháp của hàng loạt các dòng tu và các trường Đại Học trên thế giới.
Từ tháng 11 năm 2016, Google Translate chuyển sang dùng một giải thuật dịch thuật mới gọi là Google Neural Machine Translation, gọi tắt là GNMT. Phương pháp mới này dịch toàn bộ từng câu một, thay vì chỉ từng mảng trong một câu như trước đây. Nó sử dụng bối cảnh rộng hơn này để giúp tìm ra bản dịch phù hợp nhất, sau đó nó sắp xếp lại và điều chỉnh để giống như một con người thật đang nói với ngữ pháp phù hợp. Ban đầu, cách làm này chỉ được dùng cho một vài ngôn ngữ vào năm 2016, GNMT giờ đây bao gồm cả tiếng Việt trong tiến trình dịch từ các thứ tiếng Anh, Pháp, Ý, và Đức.
Tính đến năm 2018, Google Translate dịch hơn 100 tỷ từ mỗi ngày.
Các tính năng của Google Translate
Đối với một số ngôn ngữ, Google Translate có thể phát âm văn bản gốc và văn bản đã dịch, cũng như đánh dấu các từ và cụm từ tương ứng trong hai văn bản.
Khi người dùng đánh vào một từ đơn giản hay một cụm từ, Google Translate có thể được dùng như một từ điển.
Nếu ta thậm chí không biết văn bản gốc là tiếng gì, ta có thể nhấn “Detect language”, Google Translate sẽ phát hiện cho ta.
Thông thường, để dịch một văn bản ta sẽ copy và dán (paste) văn bản gốc vào text box ở phía bên trái Google Translate. Tuy nhiên, ta cũng có thể dán cái URL văn bản nguồn, Google Translate sẽ tạo một đường link dẫn đến bản dịch của trang web đó. Nhấn vào đó, có thể xem bản dịch.
Đối với một số ngôn ngữ, văn bản có thể được nhập bằng cách vẽ chữ trên Google Translate thông qua một chương trình nhận dạng chữ viết. Thậm chí, Google Translate còn có thể nhận dạng qua giọng nói.
Những vấn đề cần suy tư
Đầu năm 2007, một linh mục phàn nàn với chúng tôi rằng khi đánh chữ “priests” vào văn bản nguồn, ngài “bàng hoàng” và “đau đớn” nhận ra rằng Google Translate dịch sang tiếng Việt là “bọn cha cố”.
Thậm chí ngày nay, từ “Church” (viết hoa) trong tiếng Anh đôi khi được dịch ra tiếng Việt là “nhà thờ” thay vì Giáo Hội.
Tại sao như thế? Thưa: Như đã nói ở trên Google Translate tìm kiếm các patterns trong database khổng lồ của mình. Nếu các tài liệu đó chỉ gồm toàn những tài liệu của nhà cầm quyền trong nước dưới sự thống trị của văn hóa cộng sản thì còn biết làm sao hơn?
Tình hình cũng xảy ra với Wiki. Nếu chúng ta co cụm, nhường hẳn sân cho đối phương mặc sức tung hoàng ngang dọc, chúng ta còn phải chứng kiến nhiều tình cảnh đáng buồn khi nhìn thấy những xuyên tạc lịch sử, tôn giáo, và những cách dịch đểu cáng.
Google Translate ngày nay khá hơn rất nhiều vì khi văn hóa Công Giáo Việt càng ngày càng phong phú Google Neural Machine Translation càng ngày càng chính xác.
Khi dịch nguyên một bài (khác với phỏng dịch), bất kể ta có dùng Google Translate hay không, ta đóng góp đáng kể vào sự chính xác của dịch vụ thông dịch đa ngôn ngữ miễn phí này, nếu như ta chỉ định trong bản dịch của mình văn bản nguyên ngữ nằm ở đâu trên Internet thông qua những htm tags như description, source và article.
Ta cũng có thể “dạy” Google Translate cách dịch chính xác hơn như trong hình đính kèm.
Kết luận
Nếu không có gì đột biến, trong vòng ít nhất là vài thập niên sắp đến Google Translate vẫn tiếp tục là dịch vụ thông dịch đa ngôn ngữ quan trọng trong đời sống văn hóa, chính trị và tôn giáo của các dân tộc.
Nên chăng chúng ta xóa bỏ các thành kiến không có cơ sở và nhìn phương tiện này như một hồng ân Chúa đặt vào tay chúng ta.
Cố nhiên, chúng tôi không có ý khích lệ việc dùng Google Translate một cách vô trách nhiệm: dán văn bản gốc vào, translate bằng máy, rồi mù quáng đưa lên Internet (trò này nhiều người làm). Làm như thế là thiếu tôn trọng độc giả và thiếu tôn trọng chính bản thân mình. Tuy nhiên, một cách dùng sáng tạo và có trách nhiệm chắc chắn sẽ đem lại những ích lợi lớn lao cho Giáo Hội và cho sứ vụ rao giảng Tin Mừng.
Có điều kiện làm việc với các ký giả của Công Giáo Hoa Kỳ, chúng tôi ghi nhận ngày càng nhiều ký giả Công Giáo sử dụng Google Translate để dịch các bản văn của Tòa Thánh từ tiếng Latinh, hay tiếng Ý sang tiếng Anh. Họ đánh giá rất cao dịch vụ thông dịch đa ngôn ngữ này.
Tuy nhiên, trong những cuộc thảo luận gần đây với các ký giả Công Giáo Việt Nam, chúng tôi “kinh hoàng” nhận ra khuynh hướng hoàn toàn ngược lại. Thậm chí, một ký giả có trách nhiệm điều hành một Web site lớn của Công Giáo Việt Nam nói: “Chúng tôi không chấp nhận cho ký giả nào dùng Google Translate, nếu phát hiện chúng tôi delete ngay lập tức.”
Tôi cho rằng đánh giá thấp và đầy thành kiến với các nhu liệu thông dịch, đặc biệt trong trường hợp Google Translate, là một điều “dại dột” và sẽ có những hậu quả tiêu cực đối với sự phát triển của đạo Công Giáo trong nước cũng như trong các cộng đoàn Công Giáo Việt Nam hải ngoại. Tại sao?
Lịch sử và giải thuật của Google Translate
Google Translate là một dịch vụ thông dịch đa ngôn ngữ miễn phí được hình thành và liên tục phát triển bởi Google. Google Translate hỗ trợ hơn 100 ngôn ngữ ở nhiều cấp độ khác nhau và tính đến tháng 5 năm 2017, phục vụ hơn 500 triệu người mỗi ngày. May mắn cho chúng ta, Việt Ngữ là một trong các ngôn ngữ được hỗ trợ.
Thế mạnh của Google là một search engine được xây dựng trên một cơ sở dữ liệu hùng hậu không có công ty nào có thể sánh bằng, và một giải thuật tìm kiếm siêu tốc. Search engine của Google nổi tiếng đến mức động từ “to google” đã được đưa vào từ điển; và có lẽ ngày nay khó tìm ra được một người nào biết dùng computer hay các điện thoại thông minh mà chưa từng dùng qua search engine của Google.
Dựa trên thế mạnh của search engine này, ngay từ đầu Google Translate đã được xây dựng trên một giải thuật hoàn toàn khác hẳn với các chương trình thông dịch đa ngôn ngữ khác. Nó không tìm cách áp dụng các quy luật văn phạm và các phương pháp phân tích câu cổ điển. Thay vì dịch trực tiếp như thế, nó tìm kiếm các mẫu tương tự (pattern) trong hàng triệu tài liệu có trong database khổng lồ của mình để quyết định bản dịch tốt nhất.
Ra mắt vào tháng 4 năm 2006, ban đầu Google Translate thu thập các bản dịch những tài liệu đa ngôn ngữ của các định chế quốc tế trong đó các thành viên sử dụng các ngôn ngữ khác nhau. Các bản dịch đa ngôn ngữ của Liên Hợp Quốc và Quốc Hội Âu Châu là những tài liệu được đưa vào sớm nhất. Sau những thỏa thuận với Vatican vào tháng Hai, 2007, các tài liệu của Tòa Thánh đã được đưa vào Google Translate, cùng với hàng loạt các transcripts từ tiếng Latinh sang tiếng Anh, tiếng Ý, tiếng Pháp của hàng loạt các dòng tu và các trường Đại Học trên thế giới.
Từ tháng 11 năm 2016, Google Translate chuyển sang dùng một giải thuật dịch thuật mới gọi là Google Neural Machine Translation, gọi tắt là GNMT. Phương pháp mới này dịch toàn bộ từng câu một, thay vì chỉ từng mảng trong một câu như trước đây. Nó sử dụng bối cảnh rộng hơn này để giúp tìm ra bản dịch phù hợp nhất, sau đó nó sắp xếp lại và điều chỉnh để giống như một con người thật đang nói với ngữ pháp phù hợp. Ban đầu, cách làm này chỉ được dùng cho một vài ngôn ngữ vào năm 2016, GNMT giờ đây bao gồm cả tiếng Việt trong tiến trình dịch từ các thứ tiếng Anh, Pháp, Ý, và Đức.
Tính đến năm 2018, Google Translate dịch hơn 100 tỷ từ mỗi ngày.
Các tính năng của Google Translate
Đối với một số ngôn ngữ, Google Translate có thể phát âm văn bản gốc và văn bản đã dịch, cũng như đánh dấu các từ và cụm từ tương ứng trong hai văn bản.
Khi người dùng đánh vào một từ đơn giản hay một cụm từ, Google Translate có thể được dùng như một từ điển.
Nếu ta thậm chí không biết văn bản gốc là tiếng gì, ta có thể nhấn “Detect language”, Google Translate sẽ phát hiện cho ta.
Thông thường, để dịch một văn bản ta sẽ copy và dán (paste) văn bản gốc vào text box ở phía bên trái Google Translate. Tuy nhiên, ta cũng có thể dán cái URL văn bản nguồn, Google Translate sẽ tạo một đường link dẫn đến bản dịch của trang web đó. Nhấn vào đó, có thể xem bản dịch.
Đối với một số ngôn ngữ, văn bản có thể được nhập bằng cách vẽ chữ trên Google Translate thông qua một chương trình nhận dạng chữ viết. Thậm chí, Google Translate còn có thể nhận dạng qua giọng nói.
Những vấn đề cần suy tư
Đầu năm 2007, một linh mục phàn nàn với chúng tôi rằng khi đánh chữ “priests” vào văn bản nguồn, ngài “bàng hoàng” và “đau đớn” nhận ra rằng Google Translate dịch sang tiếng Việt là “bọn cha cố”.
Thậm chí ngày nay, từ “Church” (viết hoa) trong tiếng Anh đôi khi được dịch ra tiếng Việt là “nhà thờ” thay vì Giáo Hội.
Tại sao như thế? Thưa: Như đã nói ở trên Google Translate tìm kiếm các patterns trong database khổng lồ của mình. Nếu các tài liệu đó chỉ gồm toàn những tài liệu của nhà cầm quyền trong nước dưới sự thống trị của văn hóa cộng sản thì còn biết làm sao hơn?
Tình hình cũng xảy ra với Wiki. Nếu chúng ta co cụm, nhường hẳn sân cho đối phương mặc sức tung hoàng ngang dọc, chúng ta còn phải chứng kiến nhiều tình cảnh đáng buồn khi nhìn thấy những xuyên tạc lịch sử, tôn giáo, và những cách dịch đểu cáng.
Google Translate ngày nay khá hơn rất nhiều vì khi văn hóa Công Giáo Việt càng ngày càng phong phú Google Neural Machine Translation càng ngày càng chính xác.
Khi dịch nguyên một bài (khác với phỏng dịch), bất kể ta có dùng Google Translate hay không, ta đóng góp đáng kể vào sự chính xác của dịch vụ thông dịch đa ngôn ngữ miễn phí này, nếu như ta chỉ định trong bản dịch của mình văn bản nguyên ngữ nằm ở đâu trên Internet thông qua những htm tags như description, source và article.
Ta cũng có thể “dạy” Google Translate cách dịch chính xác hơn như trong hình đính kèm.
Kết luận
Nếu không có gì đột biến, trong vòng ít nhất là vài thập niên sắp đến Google Translate vẫn tiếp tục là dịch vụ thông dịch đa ngôn ngữ quan trọng trong đời sống văn hóa, chính trị và tôn giáo của các dân tộc.
Nên chăng chúng ta xóa bỏ các thành kiến không có cơ sở và nhìn phương tiện này như một hồng ân Chúa đặt vào tay chúng ta.
Cố nhiên, chúng tôi không có ý khích lệ việc dùng Google Translate một cách vô trách nhiệm: dán văn bản gốc vào, translate bằng máy, rồi mù quáng đưa lên Internet (trò này nhiều người làm). Làm như thế là thiếu tôn trọng độc giả và thiếu tôn trọng chính bản thân mình. Tuy nhiên, một cách dùng sáng tạo và có trách nhiệm chắc chắn sẽ đem lại những ích lợi lớn lao cho Giáo Hội và cho sứ vụ rao giảng Tin Mừng.