Đại Chúng số 97 - Ngày 1 tháng 5 năm 2002

Duramax

BẠN CÓ BIẾT

Người Thứ Chín Ghi Lại

Chúng ta, nếu thường mở Internet mà tìm những trang nhà có chữ Việt như Nhật Báo Người Việt, Việt Báo Kinh Tế và ngay cả tuần báo Đại Chúng thân yêu thì chúng ta cần rõ hệ thống chữ Việt được “encoding” từ những characters cho chúng ta đọc được. Hiện nay hệ thống ASCII đã lỗi thời. Còn hệ thống chữ viết Việt chúng ta thường thấy như: "VPS, VNI, VISCII, TCVN, VIQR" nay cũng lỗi thời luôn.

Ngày 24 tháng 9 năm 2001, Bộ Khoa Học, Công Nghệ và Môi Trường tại Hà Nội ra chỉ thị là đến tháng 7 năm 2002 này sẽ chuyển sang hệ thống UNICODE. Nghĩa là những người muốn xem báo Việt phát tại Việt Nam trên Internet thì phải có hệ thống chuyển sang Unicode, bằng không thì đọc toàn là chữ Á rập hay những con số và một loạt câu hỏi. Và đống thời gởi Điện Thư Email đi đi về về thì phải viết bằng thứ tiếng Unicode.

Hiện nay có một số Web Browser loại mới như Window 2000 hay Me hay Win XP có thể giải mã được và đọc được chữ Việt này.

Unicode (USC- 2 ISO 10646) là một 16-bit character được encoding tất cả đến 65,536 characters khác nhau. Hiện nay những nước có những chữ khó đọc như: Chữ Trung Hoa, chữ Triều Tiên (Korea), và Japan đều được Unicode hết. Việt Nam thì đến tháng 7 này mới xong.

Trước đó rất lâu Công ty VNI tại Westminster, California làm bá chủ một cõi sơn hà. Bạn muốn đọc chữ Việt trên Web hay Internet thì bạn phải có Web Eye (một ký hiệu con mắt của nhóm VNI). Bạn muốn viết thư bằng chữ Việt thì bắt buộc bạn phải có VNI Software thì mới gõ ra dấu (như chúng tôi đang đánh bài này vậy). Nhưng rất đắt tiền cho bộ VNI đến $195 USD và Web Eye bán đến $70 hay hơn. Công ty VNI tung hoành một thời gian rất dài. Nhưng nay với sự chuyển đổi sang hệ thống Unicode thì Côngty VNI hơi coi bộkhó mần ăn vì nhu liệu viết hay đọc Unicode hiện nay có nhiều Công ty Việt Nam tại hải ngoại hay tại Quốc Nội tặng Free cho bạn download dễ dàng. Chúng tôi từng thử dùng VNI đánh chữ Việt mà gởi sang cho người quen tại Thành phố Saigon (hay Tp HCM) thì họ đọc không được và khi họ gởi lại chữ Việt bằng Unicode thì chúng tôi cũng đọc không được luôn. Nay chúng tôi "download" Unicode thì mọi chuyện đã xong một cách êm đẹp nữa. Còn bằng không thì viết bài đừng bỏ dấu thì bên kia nhận được và tự ý họ bỏ dấu vào. Như câu nói vui miệng như sau: "Dao Cao Rau cung la Dao. Dao Cao Dai cung la Dao" mà phải nói là: "Dao Cạo Râu cũng là Dao, Đạo Cao Đài cũng là Đạo".

Vào những năm 1975 khi chúng tôi mới đến xứ Mỹ này, viết thư bằng tay không quen bằng đánh máy chúng tôi tìm được một bàn máy đánh chữ mừng lắm nhưng không có dấu Việt. Đành đánh xong rồi bỏ dấu bằng bút mực có đầu thật nhọn. Thế mà vẫn đánh sai hoài vì thư khá dài. Nhiều bài viết gởi đăng Báo Việt đánh thư bằng máy đánh chữ không dấu rồi ngồi đọc lại và bỏ dấu bài vỡ của mình thì thấy quả là một cực hình. Ngày kia tôi làm biếng gởi nguyên một xấp bài viết cho tuần báo nọ thì Thư ký Tòa Soạn rên Trời như bọng.

Bài này dưới đây quý bạn có thể hiểu rõ nguồn cội về Unicode và có thể download Unicode mà xử dụng vì tất cả thiên hạ đều xử dụng hết rồi chỉ phần mình thì chưa.

Unicode cho chữ Việt

Unicode là một cách dùng chữ Việt theo tiêu chuẩn quốc tế cho tin học. Đặc điểm chính của nó là người ta dùng 2 bytes (16 bits) cho mỗi mẫu tự như ô, ơ, ă. Cho đến nay có nhiều bộ chữ Việt Nam như VISCII, VPS, VNI vv... đang đưọc dùng rất thịnh hành trong nhiều áp dụng phần mềm khác nhau.

VISCII là một chuẩn của nhóm khoa học gia Tricholor. Trong chuẩn nầy mỗi mẫu tự được biểu diễn bằng một byte (8 bits). Nhóm Tricholor dùng các con số trống của bộ chữ ASCII (của Mỹ - A là viết tắt cho American, trong khi VI cho Vietnamese) để biểu diễn các chữ Việt Nam có dấu. Vì con số lớn nhất có thể biểu diển bằng 1 byte là 255, đó chính là tổng số mẫu tự Việt Nam tối đa ta có thể dùng được bất cứ lúc nào. Rất tiếc chữ Việt Nam cần hơn 255 mẫu tự nên người ta phải đặt thêm bộ chữ Hoa (thí dụ như UHoàiH 1.1) hay thay thế các dấu hiệu ít dùng, như dấu ngoặc kép, bằng những mẫu tự Việt Nam cần phải có. Tức là hễ muốn có đầy đủ bộ chữ Việt ta phải hy sinh vài dấu hiệu ít dùng của bộ chữ ASCII.

Bộ chữ VPS của Hội Vietnamese Professionals Society cũng dùng cùng một nguyên tắc như VISCII. Có điều khác là vì VPS được triển khai ở Pháp, nên các khoa học gia muốn bắt đầu bằng một bộ chữ dùng cho tiếng Pháp rồi mở mang thêm để dùng cho chữ Việt. Nói tóm lại, hai bộ chữ VISCII và VPS khác nhau chỉ ở chỗ quy ước dùng con số nào để biểu diễn một mẫu tự Việt Nam.

Ở Việt Nam có kiểu chữ .vnTimes rất thịnh hành trên các trang Web. Các khoa học gia thiết kế kiểu chữ nầy cũng dùng một nguyên tắc giống như trong VISCII và VPS. Nói một cách khác, ta có thể dịch (convert, map) từ kiểu chữ nầy qua kiểu chữ kia rất dễ dàng vì có mối liên hệ từng mẫu tự một (one-to-one correspondence).

Kiểu chữ VNI hơi khác một chút vì có nhiều chỗ người ta dùng 2 bytes để biểu diển một mẫu tự. VNI là một trong những bộ chữ đầu tiên được dùng cho chữ Việt trong tin học. Điều đáng nói là sự thành công về thương mại của VNI. Mặc dầu muốn đánh máy với bộ chữ VNI ta phải trả tiền, công ty VNI tích cực nhất trong việc triển khai các áp dụng phần mềm của VNI để phục vụ khách hàng. Trong khi đó các tổ chức Tricholor và Vietnamese Professionals Society là gồm những khoa học gia thiện nguyện, tất cả đều có việc làm toàn thời gian nên công việc triển khai phần mềm cho các bộ chữ phải bị giới hạn.

Còn VietNet chẳng qua chỉ là một quy ước về cách dùng các mẫu tự có sẵn của ASCII để đánh tiếng Việt. Những dấu dùng cho các nguyên âm được đánh thêm, thí dụ như chữ “Đưa đón” được đánh là “DDu+a ddón”. Do đó, nói cho đúng ra VietNet không phải là một bộ chữ.

Áp dụng Unicode cho chữ Việt trên mạng Web

Vovisoft dùng Unicode cho chữ Việt trên mạng Web. Để đọc được chữ Việt trên mạng Vovisoft bạn không cần phải download một font chữ Việt Nam nào cả. Font chữ Vovisoft dùng trên Web là "Tahoma", một Unicode font có sẵn trong Windows98 hay hệ thống máy tính nào đã cài đặt Internet Explorer 5.0. Nếu cần bạn chỉ cần sửa lại settings của browser như sau:

Internet Explorer 5.x: View | Encoding | chọn Western European và Auto Select

Netscape 4.x: Website Vovisoft không support Netscape. Sorry!

Cách Dùng Unicode Để Đánh Máy Tiếng Việt Trong MS-WORD và MS-Outlook

Thiết Kế MS-WORD Template:

Vào Tools \ Options \ File Location tab để xem directory của Startup files.

Ra khỏi MS-WORD và copy vnunicode.dot vào directory của startup files. Thường thường directory này là C:\Windows\Application Data\Microsoft\Word\Startup\

Mở MS-WORD trở lại và vào Tools \ Templates and Add-Ins và check check box của vnunicode.dot nếu cần.

Hiện giờ nên dùng font Tahoma cho bảo đảm. Bạn có thể vào Format \ Styles để set Tahoma làm default font. Trong tương lai có thể dùng các fonts khác như Arial, Times New Roman, vv... Nếu muốn thì vào Tools \ Auto Correct và uncheck hết tất cả các check boxes để MS-Word khỏi tự động đổi những chữ như i thành I (đây là một feature có thể rất phiền phức hơn là ích lợi).

         


 

Copyright (c) DaiChung News Media 2002