Khai thác nguồn ngữ liệu internet trong dịch tài liệu Việt - Trung

Cùng với sự phát triển mạnh mẽ của khoa học kỹ thuật, Internet được ứng dụng rộng rãi trong

toàn bộ đời sống xã hội, trong đó có lĩnh vực dịch thuật. Internet mang lại nguồn ngữ liệu khổng

lồ giúp người dịch tìm được sự tương đương về ngôn ngữ cũng như cung cấp ngữ liệu cho quá

trình gia công ngôn ngữ của người dịch. Khai thác nguồn ngữ liệu Internet vào quá trình dịch chủ

yếu thể hiện ở việc tìm kiếm các đơn vị tương đương giữa hai ngôn ngữ; tra cứu hình thức, quy

chuẩn văn bản đích phục vụ quá trình chuyển đổi; kiểm tra tính chính xác của bản dịch; sử dụng

và gia công ngữ liệu nhằm nâng cao chất lượng bản dịch; tra cứu kiến thức chuyên ngành có liên

quan Tuy nhiên, việc khai thác ngữ liệu Internet cũng phải tính đến những hạn chế của ngôn

ngữ mạng và thông tin mạng. Bài viết trên cơ sở các lý luận có liên quan, đưa ra các phương pháp

khai thác ngữ liệu Internet trong quá trình dịch Việt-Trung, giúp người dịch có thêm cách tiếp cận

nhằm nâng cao chất lượng bản dịch.

pdf11 trang | Chia sẻ: phuthai499 | Lượt xem: 1044 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Khai thác nguồn ngữ liệu internet trong dịch tài liệu Việt - Trung, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
hác nhau, thậm chí 
có các thông tin xuyên tạc có tính chất chính trị...; 
có những bài viết, bài nghiên cứu nhưng lại lồng 
ghép ý đồ cá nhân, thậm chí trong việc giải thích 
một số khái niệm, đặc biệt là các khái niệm có liên 
79KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
quan đến lĩnh vực có tranh chấp, cách giải thích 
đôi khi không khách quan mà hướng tới việc có lợi 
cho bên giải thích. Vì thế, khi tham khảo các kiến 
thức có liên quan, việc thu thập thông tin cần chú 
ý đến những đặc điểm này để loại bỏ những yếu 
tố cảm tính, tìm ra những yếu tố có ý nghĩa thông 
tin khách quan, bảo đảm tính chính xác và có độ 
tin cậy cao. 
Đối với nguồn ngữ liệu phục vụ đối chiếu và 
chuyển đổi ngôn ngữ, khi khai thác nguồn ngữ 
liệu này người dịch cũng phải đối diện với tình 
trang hỗn độn của ngôn ngữ mạng. Giống như 
nhiều quốc gia khác, hiện nay Trung Quốc cũng 
đang phải đối mặt với tình hình ngôn ngữ mạng 
không chuẩn xác đến từ những trang mạng dịch 
tự động, những cách biểu đạt không phù hợp với 
văn phạm tiếng Hán tại các diễn đàn, các trang 
blog cá nhân Đỗ Tiến Quân, Hà Nguyễn Hằng 
Nga (2018, tr.43) khi bàn về mặt tiêu cực của ngôn 
ngữ mạng tiếng Trung cũng chỉ ra việc sử dụng 
cách biểu đạt lủng củng, biểu đạt thừa làm cho 
quy tắc, quy phạm ngữ pháp của tiếng Trung Quốc 
trở nên lộn xộn, sử dụng các từ ngữ vô nghĩa, thô 
thiển, ảnh hưởng đến tính thuần khiết của ngôn 
ngữ. Ngô Tiểu Long cũng nhận định, những hành 
vi ngôn ngữ này “không những không làm phong 
phú ngôn ngữ mà ngược lại còn làm ô nhiễm tiếng 
Trung Quốc”. Xuất phát từ tình trạng này, ở một số 
nơi của Trung Quốc đã phải ban bố các quy định 
nhằm quy phạm hành vi ngôn ngữ mạng (吴小龙, 
2008, tr.58). Do đó, khi khai thác ngữ liệu Internet, 
người dịch cần phải xác định được tính chân thực, 
chuẩn xác của ngữ liệu như tính chính xác khoa 
học, tính quy phạm của ngôn ngữ, tốt nhất nên 
khai thác nguồn ngữ liệu đã được thẩm định.
4.2. Các kỹ năng cơ bản trong tra cứu và 
khai thác ngữ liệu Internet vào quá trình dịch
4.2.1. Kỹ năng tìm kiếm
Đầu tiên, nên sử dụng các trang mạng tìm kiếm 
lớn như google, yahoo, baidu Tuy nhiên, người 
dịch cần xác định chính xác từ khóa để việc tìm 
kiếm có hiệu quả hơn. Từ khóa ở đây có thể là 
phương án dịch đầu tiên, có thể là dịch theo mặt 
chữ khi mà người dịch chưa có phương án khác. 
Sau khi đưa vào tìm kiếm, nếu từ khóa đó không 
đưa ra kết quả chính xác thì cũng có thể có các 
gợi ý khác thông qua việc đọc nhanh các kết quả 
liên quan đã hiện ra để tìm kiếm các từ khóa khác. 
Ngoài ra cũng có thể tìm kiếm theo chủ đề, thậm 
chí có thể tận dụng từ ngữ viết tắt, cách dịch ra 
tiếng Anh, tra cứu theo sự kiện, mở rộng hoặc thu 
hẹp phạm vi tìm kiếm của từ khóa, tra cứu các bài 
viết liên quan, đọc để tìm ra cái tương đương 
Tuy nhiên, đối với những từ ngữ mới, việc tra cứu 
chủ yếu để tìm hiểu nội hàm ý nghĩa của từ ngữ đó, 
để tìm được cái tương đương tuyệt đối đôi khi rất 
khó vì nó có thể có ở ngôn ngữ này mà không có 
ở ngôn ngữ kia.
Việc tìm kiếm tài liệu còn để phục vụ cho việc 
kiểm tra tính chính xác của bản dịch. Kiểm tra tính 
chính xác của bản dịch được bắt đầu bằng từ khóa 
là những từ ngữ hoặc cách biểu đạt mà bản thân 
người dịch khi đọc lại vẫn cảm thấy chưa bằng 
lòng. Với các từ ngữ, khái niệm, đôi khi phải kiểm 
tra bằng công cụ tìm kiếm hình ảnh, hoặc tìm kiếm 
sự vật, hiện tượng đó trong thực tế, từ đó mới tìm 
ra được tên gọi, cách biểu đạt tương đương.
4.2.2. Kỹ năng đánh giá ngữ liệu
Người dịch nên truy cập, xem các tài liệu tại 
các trang web uy tín, chất lượng, các trang web 
của các cơ quan nhà nước, Chính phủ, Quốc hội, 
các trang web có địa chỉ cụ thể, tránh sử dụng 
tài liệu của các trang web nhỏ, không uy tín, không 
có địa chỉ cụ thể, để thu thập thông tin và tìm hiểu 
kiến thức có liên quan. Nguồn ngữ liệu được đăng 
trên các trang thông tin chính thức, trang điện tử 
của các tờ báo lớn, các tạp chí nghiên cứu đa 
số đều được kiểm duyệt một cách chặt chẽ về mặt 
nội dung cũng như ngôn ngữ, cách biểu đạt cơ bản 
là chuẩn mực, phù hợp với quy phạm văn phong 
ngôn ngữ.
4.2.3. Kỹ năng lựa chọn và phân tích
Với mỗi lần tìm kiếm, thông thường kết quả 
cho ra là khổng lồ, nếu không có phương pháp, 
người dịch rất dễ chìm vào một đống thông tin hỗn 
80 KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
v Dịch thuật
độn. Việc đọc lướt phần chữ xuất hiện kèm từ khóa 
trong các kết quả, xem nhanh nguồn gốc trang web 
sẽ cho người dịch một ấn tượng nên đọc kết quả 
nào. Người dịch nên chọn đọc những trang chính 
thống hoặc của các cơ quan thông tấn, báo chí 
hạn chế đọc các kết quả trong các diễn đàn hay 
blog cá nhân Ngoài ra, với một từ hay một cụm 
từ có thể tìm được nhiều kết quả dịch khác nhau. 
Khi đó, tiêu chí để lựa chọn đó là tính phổ biến 
(kết quả hiện lên có nhiều không), tính chính thống 
(xuất hiện trên các trang web chính thống, có uy 
tín), tính bản địa (trang web đó là của nước nào)
4.2.4. Kỹ năng gia công ngữ liệu
Dịch là một quá trình chuyển một hình thức 
biểu đạt trong ngôn ngữ nguồn sang một hình thức 
biểu đạt tương ứng trong ngôn ngữ đích trong sự 
đảm bảo về nội dung và chức năng. Trong dịch, 
cái mà người dịch hay mắc không phải là lỗi về 
ngữ pháp mà là sự tương thích về biểu đạt giữa hai 
ngôn ngữ. Để tạo được sự tương thích này, nguồn 
ngữ liệu Internet có thể giúp người dịch xây dựng 
được ngữ liệu khả sánh. Đọc ngữ liệu đã tìm được 
có liên quan về nội dung, về ý, về phong cách văn 
bản trong sự so sánh với văn bản gốc, người 
dịch có thể tìm ra được những cụm từ, những cách 
biểu đạt tương đương hoặc những câu, đoạn có thể 
cải biến lại cho phù hợp với ý nghĩa và mục đích 
của văn bản gốc. Đây cũng chính là quá trình tìm 
kiếm và gia công ngữ liệu. Việc gia công ngữ liệu 
có thể là mô phỏng cách biểu đạt gắn với ý nghĩa 
của văn bản nguồn để đưa ra được một văn bản 
dịch vừa đủ ý, vừa có cách biểu đạt lưu loát, lời 
dịch không bị lai căng hoặc biểu đạt theo hướng 
“tiếng Trung Quốc kiểu Việt Nam”.
4. KẾT LUẬN
Đánh giá vai trò quan trọng của Internet với 
dịch thuật, Timothy R. Hunt nhấn mạnh: “Máy 
tính sẽ không bao giờ thay thế người dịch nhưng 
người dịch sử dụng Internet sẽ thay thế người dịch 
không dùng chúng”2. Phương pháp tra cứu ngữ 
liệu truyền thống trong quá trình dịch đã tỏ ra kém 
hiệu quả trong thời đại bùng nổ Internet, nguồn 
ngữ liệu Internet hiện nay có thể mang lại những 
lợi ích vô cùng to lớn cho người dịch. Xuất phát từ 
những yêu cầu cao của công việc dịch, người dịch 
càng phải biết tận dụng những lợi ích mà nguồn 
ngữ liệu Internet mang lại, biết khai thác ngữ liệu 
Internet, biết thông qua ngữ liệu Internet để sử 
dụng thành quả lao động của những người dịch 
trước. Việc khai thác nguồn ngữ liệu Internet vào 
quá trình dịch không chỉ giúp nâng cao hiệu quả 
công việc dịch cũng như chất lượng bản dịch mà 
còn mở ra những hướng nghiên cứu mới cả về lý 
luận và thực tiễn./.
Chú thích:
1. Tham khảo định nghĩa “Tài liệu trực tuyến” của 
Nguyễn Lê Phương Hoài (2015) trong Nguồn tài 
liệu trực tuyến: quá trình và xu hướng phát triển 
trong các thư viện trên thế giới, Tạp chí Thư viện 
Việt Nam, số 2.
2. Dẫn theo Nguyễn Phước Vĩnh Cố (2017), Nguồn tư 
liệu Internet và người dịch chuyên ngành, truy cập 
ngày 06/10/2018, < https://nguyenphuocvinhco.
com/2017 /05/09/the-internet-resources-and-
specialised-translators-nguon-tu-lieu-tren-internet-
va-nguoi-dich-chuyen-nganh/>.
 Tài liệu tham khảo:
Nguyễn Hồng Cổn (2004), “Cơ sở ngôn ngữ học của 
nghiên cứu dịch thuật và bộ môn Dịch thuật học”, 
Tạp chí Ngôn ngữ, số 11, tr.32-38.
Nguyễn Lê Phương Hoài (2015), “Nguồn tài liệu 
trực tuyến: quá trình và xu hướng phát triển trong 
các thư viện trên thế giới”, Tạp chí Thư viện Việt 
Nam, số 2, tr.11-15.
Đỗ Tiến Quân, Hà Nguyễn Hằng Nga (2018), “Bàn về 
một số đặc điểm của ngôn ngữ mạng trong tiếng 
Hán”, Tạp chí Khoa học Ngoại ngữ Quân sự, số 
15, tr.39-46.
Lê Hùng Tiến (2010), “Tương đương dịch thuật và 
tương đương trong dịch Anh-Việt”, Tạp chí khoa 
học ĐHQGHN, Ngoại ngữ 26, tr.64-71.
Hồ Đắc Túc (2012), Dịch thuật và tự do, NXB Hồng 
Đức, Hà Nội.
陈李春(2012),浅析网络时代的翻译能力培养,海
外英语,第10期,175-176。
81KHOA HỌC NGOẠI NGỮ QUÂN SỰSố 18 (3/2019)
dịch thuật v
USING INTERNET AS A DATA SOURCE IN VIETNAMESE-CHINESE TRANSLATION 
TONG VAN TRUONG
Asbtract: Parallel with the stormy development of science and technology, Internet is now 
applied in any aspect of our lives and translation is not an exception. If properly used, Internet 
can provide enormous linguistic data that not only help translators find equivalents but also make 
their translation smoother and more appropriate. Making use of Internet in translation mainly 
includes: finding equivalents between the source and the target languages; looking up structures 
and codes of the target language; checking the accuracy of translation products; comparing 
translation products with linguistic data to make sure that the translation is smooth and of better 
quality; looking up related specialist knowledge However, when using Internet as a source 
of linguistic data for translation, one has to mind the backwards in terms of cyber language 
and cyber information. Based on convincing arguments relating to the topic, the article suggests 
several ways of using Internet as a linguistic data source in Vietnamese-Chinese translation. 
This can be a new access to using Internet in translation that translators can use to better their 
translation products.
Keywords: Internet linguistic data, linguistic equivalents, processing linguistic data, Vietnamese-
Chinese translation.
Received: 25/10/2018; Revised: 07/01/2019; Accepted for publication: 25/02/2019
杰里米·芒迪、李德风译 (2007), 翻译学导论, 商
务印书馆, 北京。
连淑能(2006),英译汉教程,北京高等教育出版社
北京。
万兆元(2008),因特网辅助翻译,上海翻译,第3
期,77-80。
吴小龙(2008),利用网络资源为翻译工作服务的
理论和实践探讨,文教资料,第12期, 57-59。

File đính kèm:

  • pdfkhnnqs_18_3_2019_71_81_tong_van_truong_9504_2136260.pdf