Khai thác nguồn ngữ liệu internet trong dịch tài liệu Việt - Trung
Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong
toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng
lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá
trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ
yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy
chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng
và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên
quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn
ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp
khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận
nhằm nâng cao chất lượng bản dịch.
hác nhau, thậm chí có các thông tin xuyên tạc có tính chất chính trị...; có những bài viết, bài nghiên cứu nhưng lại lồng ghép ý đồ cá nhân, thậm chí trong việc giải thích một số khái niệm, đặc biệt là các khái niệm có liên 79KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v quan đến lĩnh vực có tranh chấp, cách giải thích đôi khi không khách quan mà hướng tới việc có lợi cho bên giải thích. Vì thế, khi tham khảo các kiến thức có liên quan, việc thu thập thông tin cần chú ý đến những đặc điểm này để loại bỏ những yếu tố cảm tính, tìm ra những yếu tố có ý nghĩa thông tin khách quan, bảo đảm tính chính xác và có độ tin cậy cao. Đối với nguồn ngữ liệu phục vụ đối chiếu và chuyển đổi ngôn ngữ, khi khai thác nguồn ngữ liệu này người dịch cũng phải đối diện với tình trang hỗn độn của ngôn ngữ mạng. Giống như nhiều quốc gia khác, hiện nay Trung Quốc cũng đang phải đối mặt với tình hình ngôn ngữ mạng không chuẩn xác đến từ những trang mạng dịch tự động, những cách biểu đạt không phù hợp với văn phạm tiếng Hán tại các diễn đàn, các trang blog cá nhân Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018, tr.43) khi bàn về mặt tiêu cực của ngôn ngữ mạng tiếng Trung cũng chỉ ra việc sử dụng cách biểu đạt lủng củng, biểu đạt thừa làm cho quy tắc, quy phạm ngữ pháp của tiếng Trung Quốc trở nên lộn xộn, sử dụng các từ ngữ vô nghĩa, thô thiển, ảnh hưởng đến tính thuần khiết của ngôn ngữ. Ngô Tiểu Long cũng nhận định, những hành vi ngôn ngữ này “không những không làm phong phú ngôn ngữ mà ngược lại còn làm ô nhiễm tiếng Trung Quốc”. Xuất phát từ tình trạng này, ở một số nơi của Trung Quốc đã phải ban bố các quy định nhằm quy phạm hành vi ngôn ngữ mạng (吴小龙, 2008, tr.58). Do đó, khi khai thác ngữ liệu Internet, người dịch cần phải xác định được tính chân thực, chuẩn xác của ngữ liệu như tính chính xác khoa học, tính quy phạm của ngôn ngữ, tốt nhất nên khai thác nguồn ngữ liệu đã được thẩm định. 4.2. Các kỹ năng cơ bản trong tra cứu và khai thác ngữ liệu Internet vào quá trình dịch 4.2.1. Kỹ năng tìm kiếm Đầu tiên, nên sử dụng các trang mạng tìm kiếm lớn như google, yahoo, baidu Tuy nhiên, người dịch cần xác định chính xác từ khóa để việc tìm kiếm có hiệu quả hơn. Từ khóa ở đây có thể là phương án dịch đầu tiên, có thể là dịch theo mặt chữ khi mà người dịch chưa có phương án khác. Sau khi đưa vào tìm kiếm, nếu từ khóa đó không đưa ra kết quả chính xác thì cũng có thể có các gợi ý khác thông qua việc đọc nhanh các kết quả liên quan đã hiện ra để tìm kiếm các từ khóa khác. Ngoài ra cũng có thể tìm kiếm theo chủ đề, thậm chí có thể tận dụng từ ngữ viết tắt, cách dịch ra tiếng Anh, tra cứu theo sự kiện, mở rộng hoặc thu hẹp phạm vi tìm kiếm của từ khóa, tra cứu các bài viết liên quan, đọc để tìm ra cái tương đương Tuy nhiên, đối với những từ ngữ mới, việc tra cứu chủ yếu để tìm hiểu nội hàm ý nghĩa của từ ngữ đó, để tìm được cái tương đương tuyệt đối đôi khi rất khó vì nó có thể có ở ngôn ngữ này mà không có ở ngôn ngữ kia. Việc tìm kiếm tài liệu còn để phục vụ cho việc kiểm tra tính chính xác của bản dịch. Kiểm tra tính chính xác của bản dịch được bắt đầu bằng từ khóa là những từ ngữ hoặc cách biểu đạt mà bản thân người dịch khi đọc lại vẫn cảm thấy chưa bằng lòng. Với các từ ngữ, khái niệm, đôi khi phải kiểm tra bằng công cụ tìm kiếm hình ảnh, hoặc tìm kiếm sự vật, hiện tượng đó trong thực tế, từ đó mới tìm ra được tên gọi, cách biểu đạt tương đương. 4.2.2. Kỹ năng đánh giá ngữ liệu Người dịch nên truy cập, xem các tài liệu tại các trang web uy tín, chất lượng, các trang web của các cơ quan nhà nước, Chính phủ, Quốc hội, các trang web có địa chỉ cụ thể, tránh sử dụng tài liệu của các trang web nhỏ, không uy tín, không có địa chỉ cụ thể, để thu thập thông tin và tìm hiểu kiến thức có liên quan. Nguồn ngữ liệu được đăng trên các trang thông tin chính thức, trang điện tử của các tờ báo lớn, các tạp chí nghiên cứu đa số đều được kiểm duyệt một cách chặt chẽ về mặt nội dung cũng như ngôn ngữ, cách biểu đạt cơ bản là chuẩn mực, phù hợp với quy phạm văn phong ngôn ngữ. 4.2.3. Kỹ năng lựa chọn và phân tích Với mỗi lần tìm kiếm, thông thường kết quả cho ra là khổng lồ, nếu không có phương pháp, người dịch rất dễ chìm vào một đống thông tin hỗn 80 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) v Dịch thuật độn. Việc đọc lướt phần chữ xuất hiện kèm từ khóa trong các kết quả, xem nhanh nguồn gốc trang web sẽ cho người dịch một ấn tượng nên đọc kết quả nào. Người dịch nên chọn đọc những trang chính thống hoặc của các cơ quan thông tấn, báo chí hạn chế đọc các kết quả trong các diễn đàn hay blog cá nhân Ngoài ra, với một từ hay một cụm từ có thể tìm được nhiều kết quả dịch khác nhau. Khi đó, tiêu chí để lựa chọn đó là tính phổ biến (kết quả hiện lên có nhiều không), tính chính thống (xuất hiện trên các trang web chính thống, có uy tín), tính bản địa (trang web đó là của nước nào) 4.2.4. Kỹ năng gia công ngữ liệu Dịch là một quá trình chuyển một hình thức biểu đạt trong ngôn ngữ nguồn sang một hình thức biểu đạt tương ứng trong ngôn ngữ đích trong sự đảm bảo về nội dung và chức năng. Trong dịch, cái mà người dịch hay mắc không phải là lỗi về ngữ pháp mà là sự tương thích về biểu đạt giữa hai ngôn ngữ. Để tạo được sự tương thích này, nguồn ngữ liệu Internet có thể giúp người dịch xây dựng được ngữ liệu khả sánh. Đọc ngữ liệu đã tìm được có liên quan về nội dung, về ý, về phong cách văn bản trong sự so sánh với văn bản gốc, người dịch có thể tìm ra được những cụm từ, những cách biểu đạt tương đương hoặc những câu, đoạn có thể cải biến lại cho phù hợp với ý nghĩa và mục đích của văn bản gốc. Đây cũng chính là quá trình tìm kiếm và gia công ngữ liệu. Việc gia công ngữ liệu có thể là mô phỏng cách biểu đạt gắn với ý nghĩa của văn bản nguồn để đưa ra được một văn bản dịch vừa đủ ý, vừa có cách biểu đạt lưu loát, lời dịch không bị lai căng hoặc biểu đạt theo hướng “tiếng Trung Quốc kiểu Việt Nam”. 4. KẾT LUẬN Đánh giá vai trò quan trọng của Internet với dịch thuật, Timothy R. Hunt nhấn mạnh: “Máy tính sẽ không bao giờ thay thế người dịch nhưng người dịch sử dụng Internet sẽ thay thế người dịch không dùng chúng”2. Phương pháp tra cứu ngữ liệu truyền thống trong quá trình dịch đã tỏ ra kém hiệu quả trong thời đại bùng nổ Internet, nguồn ngữ liệu Internet hiện nay có thể mang lại những lợi ích vô cùng to lớn cho người dịch. Xuất phát từ những yêu cầu cao của công việc dịch, người dịch càng phải biết tận dụng những lợi ích mà nguồn ngữ liệu Internet mang lại, biết khai thác ngữ liệu Internet, biết thông qua ngữ liệu Internet để sử dụng thành quả lao động của những người dịch trước. Việc khai thác nguồn ngữ liệu Internet vào quá trình dịch không chỉ giúp nâng cao hiệu quả công việc dịch cũng như chất lượng bản dịch mà còn mở ra những hướng nghiên cứu mới cả về lý luận và thực tiễn./. Chú thích: 1. Tham khảo định nghĩa “Tài liệu trực tuyến” của Nguyễn Lê Phương Hoài (2015) trong Nguồn tài liệu trực tuyến: quá trình và xu hướng phát triển trong các thư viện trên thế giới, Tạp chí Thư viện Việt Nam, số 2. 2. Dẫn theo Nguyễn Phước Vĩnh Cố (2017), Nguồn tư liệu Internet và người dịch chuyên ngành, truy cập ngày 06/10/2018, < https://nguyenphuocvinhco. com/2017 /05/09/the-internet-resources-and- specialised-translators-nguon-tu-lieu-tren-internet- va-nguoi-dich-chuyen-nganh/>. Tài liệu tham khảo: Nguyễn Hồng Cổn (2004), “Cơ sở ngôn ngữ học của nghiên cứu dịch thuật và bộ môn Dịch thuật học”, Tạp chí Ngôn ngữ, số 11, tr.32-38. Nguyễn Lê Phương Hoài (2015), “Nguồn tài liệu trực tuyến: quá trình và xu hướng phát triển trong các thư viện trên thế giới”, Tạp chí Thư viện Việt Nam, số 2, tr.11-15. Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018), “Bàn về một số đặc điểm của ngôn ngữ mạng trong tiếng Hán”, Tạp chí Khoa học Ngoại ngữ Quân sự, số 15, tr.39-46. Lê Hùng Tiến (2010), “Tương đương dịch thuật và tương đương trong dịch Anh-Việt”, Tạp chí khoa học ĐHQGHN, Ngoại ngữ 26, tr.64-71. Hồ Đắc Túc (2012), Dịch thuật và tự do, NXB Hồng Đức, Hà Nội. 陈李春(2012),浅析网络时代的翻译能力培养,海 外英语,第10期,175-176。 81KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019) dịch thuật v USING INTERNET AS A DATA SOURCE IN VIETNAMESE-CHINESE TRANSLATION TONG VAN TRUONG Asbtract: Parallel with the stormy development of science and technology, Internet is now applied in any aspect of our lives and translation is not an exception. If properly used, Internet can provide enormous linguistic data that not only help translators find equivalents but also make their translation smoother and more appropriate. Making use of Internet in translation mainly includes: finding equivalents between the source and the target languages; looking up structures and codes of the target language; checking the accuracy of translation products; comparing translation products with linguistic data to make sure that the translation is smooth and of better quality; looking up related specialist knowledge However, when using Internet as a source of linguistic data for translation, one has to mind the backwards in terms of cyber language and cyber information. Based on convincing arguments relating to the topic, the article suggests several ways of using Internet as a linguistic data source in Vietnamese-Chinese translation. This can be a new access to using Internet in translation that translators can use to better their translation products. Keywords: Internet linguistic data, linguistic equivalents, processing linguistic data, Vietnamese- Chinese translation. Received: 25/10/2018; Revised: 07/01/2019; Accepted for publication: 25/02/2019 杰里米·芒迪、李德风译 (2007), 翻译学导论, 商 务印书馆, 北京。 连淑能(2006),英译汉教程,北京高等教育出版社 北京。 万兆元(2008),因特网辅助翻译,上海翻译,第3 期,77-80。 吴小龙(2008),利用网络资源为翻译工作服务的 理论和实践探讨,文教资料,第12期, 57-59。
File đính kèm:
- khnnqs_18_3_2019_71_81_tong_van_truong_9504_2136260.pdf