PHÁT TRIỂN CÔNG CỤ TÁCH TỪ VÀ GIẢI NGHĨA TỪ HÁN – VIỆT TRONG VĂN BẢN

Email In PDF.

Võ Ngọc Đạt

Trường Cao đẳng Công nghệ thông tin Hữu nghị Việt – Hàn,Khoa TMĐT&TT

Email: Địa chỉ email này đã được bảo vệ từ spam bots, bạn cần kích hoạt Javascript để xem nó.

 

Tóm tắt

Hiện nay đã có rất nhiều công trình nghiên cứu về xử lý ngôn ngữ như tiếng Anh, tiếng Nhật, tiếng Trung Quốc trên văn bản tương đối tốt. Và cũng có rất nhiều phần mềm giải nghĩa từ Hán-Việt như Song Kiều, HVDic… nhưng chỉ cho phép giải nghĩa từng từ. Thực tế chưa có những công cụ trợ giúp để giải nghĩa từ Hán-Việt trên văn bản tiếng Việt. Trên văn bản, để xác định được từ thuần Việt, từ Hán-Việt, từ khác, điều bắt buộc đối với tiếng Việt đó là việc tách từ. Trong bài báo này, chúng tôi giới thiệu về một số phương pháp tách từ trên văn bản tiếng Việt, áp dụng tách từ vào việc giải nghĩa từ Hán-Việt trên văn bản, đặc biệt giúp cho người dùng tra cứu từ Hán-Việt trên văn bản được nhanh và tiện lợi.

Full text download