Thứ Hai, 10 tháng 3, 2014

BẢY BƯỚC THIẾT KẾ TRANG WEB ẤN TƯỢNG VÀ HIỆU QUẢ


1
LẬP TRÌNH WEB ASP VỚI TIẾNG VIỆT UNICODE

Lê Đình Duy
Khoa CNTT - ĐHKHTN Tp. HCM
ldduy@fit.hcmuns.edu.vn

08.2002

1. Một số khái niệm căn bản về biểu diễn kí tự bên trong máy tính
1.1. Khái niệm về điểm mã, đơn vị mã, bảng mã
Về mặt bản chất, máy tính chỉ làm việc với các con số, do đó để biểu diễn các kí tự trên máy tính cần phải
có một qui ước nhất quán giữa các kí tự cần biểu diễn và các con số tương ứng mà máy tính xử lí. Qui ước
này được thể hiện qua các bước sau:
- Chọn tập các kí tự cần mã hóa (character set).
- Gán cho mỗi kí tự cần mã hóa một giá trị nguyên không âm, gọi là điểm mã (code point).
- Chuyển các điểm mã thành dãy các đơn vị mã (code units) để cho phục vụ cho việc lưu trữ và mã
hóa. Một đơn vị mã là một đơn vị của bộ nhớ, có thể là 8, 16, hay 32 bit. Các điểm mã không nhất
thiết phải có cùng số đơn vị mã.
Tập hợp những điểm mã của một tập các kí tự được gọi là một trang mã (code page) hay còn gọi là bảng
mã hay bộ mã. Như vậy khi nói về một bảng mã, chúng ta quan tâm đến hai điều chính, số lượng các kí tự
được mã hóa, và cách mã hóa chúng thành các đơn vị mã.
Lấy ví dụ bảng mã ASCII, tập kí tự cần mã hóa có 128 kí tự bao gồm các kí tự tiếng Anh, kí tự số, kí tự tiền
tệ Anh, Mỹ và các kí tự điều khiển hệ thống ngoại vi. Các điểm mã có giá trị nằm trong khoảng từ 0-127. Mỗi
điểm mã được mã hóa bằng đúng một đơn vị mã 8 bit, có nghĩa là đúng một byte.
Việc quyết định chọn cách mã hóa như thế nào sẽ quyết định số lượng kí tự được mã hóa. Ví dụ, nếu chọn
cách mã hóa các điểm mã bằng đúng một đơn vị mã 8-bit thì số lượng điểm mã của một bảng mã (tạm gọi
là bảng mã 8 bit) chỉ có thể tối đa là 256.
Do bảng mã ASCII không đủ để biểu diễn các kí tự của các ngôn ngữ khác, ví dụ như tiếng Việt, nên
Microsoft đã nới rộng bảng mã ASCII bằng cách sử dụng 128 điểm mã có giá trị từ 128-255 để mã hóa cho
các kí tự ngoài ASCII này. Tuy nhiên do chỉ có 128 điểm mã, trong khi số lượng các kí tự của các ngôn ngữ
khác nhiều hơn, nên Microsoft đã tạo ra nhiều bảng mã khác nhau cho từng loại ngôn ngữ [1
]. Ví dụ:
code page 1250 1251 1252 1253 1254 1258
etc.,
upper
128
Eastern Europe Cyrillic West Euro
ANSI
Greek Turkish Vietnamese etc.,
lower
128
ASCII ASCII ASCII ASCII ASCII ASCII etc.,
Tuy nhiên trong từng bảng mã này, không phải tất cả các kí tự của một ngôn ngữ đều có trong bảng mã.
Hay nói chính xác hơn là không phải tất cả các kí tự đều được biểu diễn bằng duy nhất một điểm mã. Lấy ví
dụ tiếng Việt chúng ta có 134 kí tự tổ hợp từ 28 chữ cái và 5 dấu thanh. Do chỉ có 128 điểm mã nên bảng
mã windows-1258 dành cho tiếng Việt biểu diễn một số kí tự thành hai điểm mã liên tiếp, một điểm mã dành
cho kí tự cơ sở và một điểm mã dành cho dấu thanh. Ví dụ: kí tự “ế” được biểu diễn bằng hai điểm mã

2
tương ứng với các kí tự ê và kí tự dấu sắc: ế = ê + ́ . Cách biểu diễn như vậy được gọi là cách biểu diễn
tách rời (decomposed) mà thuật ngữ chúng ta hay gọi là tổ hợp.
Bảng mã TCVN3-ABC dùng 134 điểm mã để biểu diễn hết các kí tự tiếng Việt, chính điều này đã dẫn đến
phải sử dụng một số điểm mã của bảng mã ASCII. Đây chính là lí do mà các trang web sử dụng bảng mã
này không hiển thị được kí tự ư trong các trình duyệt Internet Explorer 5.0 trở lên. Cách biểu diễn như vậy
được gọi là cách biểu diễn kết hợp sẵn (precomposed) mà thuật ngữ chúng ta hay gọi là dựng sẵn.
1.2. Bảng mã Unicode
Về mặt bản chất các bảng mã trên của Windows là bảng mã 8-bit, nghĩa là mỗi điểm mã được mã hóa bằng
đúng một đơn vị mã 8-bit. Chính điều này đã giới hạn số lượng các các kí tự được mã chỉ là 256. Do đó
trong một văn bản không thể cùng hiển thị nhiều kí tự của các ngôn ngữ khác nhau được.
Unicode ra đời nhằm thống nhất chung các kí tự của mọi ngôn ngữ trong một bảng mã duy nhất [2
]. Hai vấn
đề nên lưu ý khi đề cập đến thuật ngữ Unicode đó là:
- Tập kí tự mà Unicode biểu diễn: ở đây muốn nói đến tập kí tự và cách ánh xạ các kí tự bằng các
điểm mã tương ứng.
- Cách mã hóa các điểm mã thành các đơn vị mã.
Unicode dùng 16 bit để biểu diễn các điểm mã, do đó nó có thể biểu diễn được đến 65,536 kí tự có điểm mã
nằm trong khoảng từ 0-65,535. Do vậy với Unicode người ta có thể biểu diễn được hầu hết các kí tự của
các ngôn ngữ.
Cách đơn giản nhất để mã hóa các kí tự Unicode là biểu diễn mỗi điểm mã bằng đúng một đơn vị mã 16-bit.
Đây chính là cách mã hóa nguyên thủy của Unicode trong phiên bản 2.0 được ISO/IEC chuẩn hóa thành
ISO/IEC 10646 hay còn gọi là UCS-2. Tuy nhiên, để tương thích với các hệ thống xử lí trước khi Unicode ra
đời cũng như tối ưu hóa trong quá trình lưu trữ và truyền dữ liệu, người ta dùng các cách khác nhau để mã
hóa các điểm mã thành các đơn vị mã. Mỗi cách mã hóa như vậy được gọi là một dạng biến đổi của
Unicode (UTF – Unicode Transformation Format). Thông dụng nhất hiện nay là UTF-8 và UTF-16 dùng dãy
các đơn vị mã có độ dài khác nhau để mã hóa các điểm mã. UTF-8 dùng 1 đến 4 đơn vị mã 8-bit trong khi
UTF-16 dùng 1 đến 2 đơn vị mã 16-bit để mã hóa. Ví dụ sau minh họa cách mã hóa của UTF-8:
- 128 kí tự đầu tiên của Unicode từ điểm mã U+0000 đến U+007F, được mã hóa thành 1 byte.
- Từ điểm mã U+0080 đến U+07FF, được mã hóa thành 2 byte.
- Từ điểm mã U+0800 đến U+FFFF, được mã hóa thành 3 byte.
- Từ điểm mã U+0800 đến U+FFFF, được mã hóa thành 4 byte.
Như vậy khi đề cập đến Unicode trong lập trình, cần phải xác định rõ chúng ta dùng bảng mã Unicode theo
dạng biến đổi nào: UCS-2, UTF-8, hay UTF-16, … UCS-2 được dùng trong các hệ quản trị cơ sở dữ liệu
như SQL Server 7.0/2000, Microsoft Access 2000, UTF-8 thường được dùng trong các ứng dụng web, trong
khi UTF-16 lại được dùng trong các hệ thống như Windows 2000/XP, Java, …
2. Lập trình web với tiếng Việt Unicode
2.1. Chỉ định bảng mã dùng trong trang web
Khi một trang web được server chuyển xuống cho client, trình duyệt sẽ dùng thông tin về bảng mã mà trang
web đó sử dụng để chuyển dãy các byte trong tài liệu đó thành các kí tự tương ứng để hiển thị lên màn
hình. Ngoài ra, một khi dữ liệu trong các FORM được gửi đi sau khi người dùng submit, trình duyệt cũng sẽ
căn cứ vào bảng mã này để chuyển đổi dữ liệu khi truyền đi. Ví dụ, nếu trang web được chỉ định dùng bảng

3
mã windows-1252 thì khi FORM được submit, dữ liệu sẽ được mã hóa theo bảng mã này cho dù trước đó
trong các hộp điều khiển của FORM, dữ liệu được gõ dưới dạng Unicode [3
].
Việc chỉ định bảng mã có vai trò rất quan trọng trong việc hiển thị đúng nội dung mà người thiết kế mong
muốn, bởi vì nếu không chỉ định bảng mã được dùng trong trang web hiện hành một cách rõ ràng, trình
duyệt sẽ sử dụng bảng mã mặc định. Ví dụ, nếu dữ liệu chuyển đến cho trang web là E1 BB 81, nếu chỉ
định bảng mã là UTF-8 thì 3 byte này chính là biểu diễn mã của kí tự “ề” trong khi nếu hệ thống dùng bảng
mã mặc định, ví dụ như windows-1252, thì 3 byte này lại được xem như là biểu diễn 3 kí tự khác nhau và sẽ
được hiển thị là “á»”.
Để chỉ định bảng mã mà trang web hiện hành sử dụng, ta dùng tag META với thuộc tính HTTP-EQUIV được
gán là Content-Type, và chỉ định tên của bảng mã được dùng trong thuộc tính CONTENT (Thông tin về các
bảng mã được dùng trên Windows có thể xem tại [4
]). Trong ví dụ sau, tag META được dùng để chỉ định
bảng mã windows-1252 cho một trang web:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1252">
Để yêu cầu trình duyệt sử dụng một bảng mã cho toàn bộ trang web, ta phải đặt tag META này trước tag
BODY. Thông thường là đặt tag META này trong tag HEAD như ví dụ sau:
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1252">
<TITLE>New Page 1</TITLE>
</HEAD>
<BODY>

</BODY>
</HTML>

Trong trường hợp bảng mã được chỉ định không có khả năng biểu diễn được tất cả các kí tự của trang web,
người ta phải dùng đến số tham chiếu của kí tự (NCRs - numerical character references). Số tham chiếu kí
tự là điểm mã của kí tự Unicode tương ứng mà nó biểu diễn. Số tham chiếu kí tự có hai dạng thập phân và
thập lục phân. Dạng thập phân có cú pháp là “&#D;”, với D là số thập phân. Dạng thập lục phân có cú pháp
là “&#xH;”, với H là số thập lục phân. Ví dụ: &#229; và &#xE5; là các số tham chiếu của kí tự “a” trong bảng
mã Unicode. Một khi gặp số tham chiếu của kí tự, trình duyệt sẽ tham chiếu trực tiếp đến kí tự có điểm mã
tương ứng trong bảng mã Unicode mà không sử dụng đến bảng mã được chỉ định hiện hành [5
].
Lấy ví dụ một trang web được mã hóa với bảng mã windows-1252, lúc đó để hiển thị đoạn văn bản: “Tiếng
Việt”, dữ liệu cho trang web phải là “Ti&#7871;ng Vi&#7879;t” , trong đó &#7871; và &#7879; lần lượt là các
số tham chiếu của các kí tự “ế” và “ệ” trong bảng mã Unicode.
Điều này cho phép giải thích tại sao, các trang web không dùng bảng mã UTF-8, ví dụ như windows-1252,
vẫn có thể hiển thị được các kí tự Unicode không thuộc bảng mã đó hay khi chuyển đổi từ bảng mã UTF-8
sang windows-1252, MS FrontPage 2000 lại tự động thêm vào các số tham chiếu kí tự theo cách trên.
2.2. Hoạt động của webserver
Khi trình duyệt yêu cầu một trang .asp, trình xử lí trang asp tại webserver sẽ thông dịch các mã lệnh ở trong
trang web này và gửi kết quả về cho trình duyệt. Thông thường, lệnh Response.Write được dùng cho các
kết xuất từ các hằng chuỗi hay từ các biến ra màn hình. Ví dụ như:


4

<%
Response.Write “Chào mừng bạn đến với trang web này” ‘in một hằng chuỗi
Response.Write rs(”TEN_NV”) ‘in dữ liệu của một biến, ví dụ như là một trường của recordset
%>


Để yêu cầu webserver mã hóa các dữ liệu trong các hằng chuỗi và biến theo bảng mã sẽ được dùng để
hiển thị tại client, ta cần phải đặt thuộc tính CodePage về bảng mã tương ứng. Các lệnh trong ví dụ sau sẽ
yêu cầu webserver mã hóa các chuỗi dữ liệu theo bảng mã UTF-8 (Thông tin về các codepage tương ứng
với các bảng mã xem tại [4
]):
<%Session.CodePage=65001%> // Dùng cho toàn bộ các trang trong Session hiện hành
<%@CodePage=65001%> // Dùng cho trang hiện hành
Lấy ví dụ trong trường hợp dùng cơ sở dữ liệu SQL Server 7.0, dữ liệu được trả về từ các câu truy vấn theo
bảng mã UCS-2. Nếu ta chỉ định CodePage là 65001, webserver sẽ tự động chuyển dữ liệu từ UCS-2 sang
UTF-8, ngược lại nếu không chỉ định thuộc tính CodePage, webserver sẽ chuyển dữ liệu đó đến client theo
bảng mã mặc định (ví dụ như windows-1252). Điều này giải thích cho trường hợp một số trang web asp hiển
thị không đúng dữ liệu Unicode được lưu trong các cơ sở dữ liệu như SQL Server 7.0/2000, MS Access
2000.
Ngoài ra, các trang asp có sử dụng đoạn mã lệnh thiết lập CodePage là 65001 phải được lưu theo định
dạng tương ứng là UTF-8 [6
].
Như vậy, việc thiết lập thuộc tính CodePage trong trang asp sẽ giúp cho webserver hiểu được các dữ liệu
được lưu trong các cơ sở dữ liệu, hằng chuỗi kí tự, … theo bảng mã nào để mã hóa (encode) nó trước khi
chuyển đến cho trình duyệt. Việc chỉ định bảng mã dùng trong trang web bằng tag META sẽ giúp cho trình
duyệt diễn dịch (decode) dữ liệu được chuyển đến từ webserver đúng nhất khi hiển thị [7
].
2.3. Các bước cơ bản của lập trình web asp sử dụng tiếng Việt Unicode
- Soạn và lưu trữ tập tin .asp dưới dạng mã hóa UTF-8.
- Trong các tập tin asp, chèn các đoạn mã chỉ định cho web server và trình duyệt xử lí dữ liệu trong
trang web như là UTF-8. Các đoạn mã này phải đặt ở đầu trang asp. Sử dụng ví dụ mẫu sau:
<%@CODEPAGE=65001%>
<%Session.Codepage=65001%>
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">
</HEAD>
<BODY>
</BODY>
</HTML>
- Sử dụng các hệ quản trị CSDL hỗ trợ Unicode như SQLServer 7.0/2000, MS Access 2000. Nếu
dùng SQL Server thì phải khai báo kiểu dữ liệu cho các trường lưu dữ liệu Unicode là NCHAR,
NVARCHAR, NTEXT, … Các kiểu dữ liệu như TEXT, MEMO, HYPERLINK trong MS Access 2000
mặc định là hỗ trợ lưu dữ liệu Unicode.
- Truy xuất cơ sở dữ liệu thông qua JScript/VBScript/ODBC.
- Khi làm việc trên hệ quản trị CSDL SQL Server 7.0/2000, nếu dùng các hằng chuỗi trong các câu
lệnh SQL, phải thêm tiếp đầu ngữ N (bắt buộc là chữ in hoa) vào [8
]. Nếu không sử dụng tiếp đầu

5
ngữ này, SQL Server sẽ tự động chuyển chuỗi dữ liệu sang bảng mã mặc định hiện hành trước khi
sử dụng nó trong các thao tác cập nhật CSDL. Ví dụ, nếu bạn dùng câu lệnh sau: INSERT INTO
SINHVIEN(TEN_SV) VALUES(‘Trần Nam Hải’) thì hằng chuỗi dữ liệu ‘Trần Nam Hải’ sẽ được SQL
Server xem như là chuỗi kí tự thường chứ không phải là chuỗi Unicode. Điều này sẽ dẫn đến hậu
quả là dữ liệu sẽ được lưu trữ không chính xác. Ví dụ như dữ liệu của kí tự “ầ” trong chuỗi trên là
E1 BA A7, sẽ được lưu thành 3 kí tự khác nhau. Trong khi đó nếu dùng câu lệnh INSERT INTO
SINHVIEN(TEN_SV) VALUES(N‘Trần Nam Hải’) thì 3 byte E1 BA A7 sẽ được xem như là một kí tự
khi lưu xuống [9
].
3. Hỗ trợ Unicode của các phần mềm
3.1. Các phần mềm hỗ trợ soạn thảo trang web
- Visual Studio.NET, Notepad, MS FrontPage2002: Hỗ trợ lưu tập tin dưới dạng UTF-8
- Visual InterDev 6.0: Nếu trong trang asp ta sử dụng các hằng chuỗi được gõ vào dưới dạng
Unicode, ví dụ như: Response.Write “Chào mừng bạn “ thì lúc lưu tập tin, chương trình sẽ phát hiện
ra trong trang asp này có xuất hiện kí tự Unicode và yêu cầu lưu xuống dưới dạng Unicode, nếu
không các kí tự Unicode sẽ bị mất. Tuy nhiên, nếu chọn lưu dưới dạng Unicode thì chương trình sẽ
lưu tập tin này dưới dạng mã hóa UCS-2. Hiện nay webserver IIS không thể xử lí được trang asp
này [10
]. Do đó không nên dùng Visual InterDev 6.0 để soạn thảo các trang asp trong các ứng dụng
Unicode tiếng Việt.
- Các phần mềm thông dụng hỗ trợ gõ tiếng Việt Unicode: UniKey, VietKey.
3.2. Các phần mềm hệ thống khác
- SQL Server 7.0/2000 và MS Access 2000 hỗ trợ Unicode. Với mỗi kí tự Unicode, hệ thống sẽ sử
dụng bảng mã UCS-2 để lưu trữ, nghĩa là dùng cố định 2 byte cho một kí tự. SQL 6.5 và MS Access
97 không hỗ trợ Unicode.
- IIS 5.0 không thể đọc được các tập tin lưu dưới dạng UCS-2 [10
], không hỗ trợ CodePage của bảng
mã UTF-16 là 1200 [11
]. IIS 4.0 không hỗ trợ CodePage của bảng mã UTF-8 là 65001 [11].
Tóm lại
Unicode ra đời nhằm khắc phục hạn chế về số lượng kí tự được mã hóa của các bảng mã 8-bit trước đó,
cho phép mọi ngôn ngữ có thể sử dụng chung một bảng mã duy nhất. Do vấn đề tương thích trong lưu trữ
và truyền dữ liệu mà Unicode có các dạng mã hóa khác nhau như UCS-2, UTF-8, UTF-16. UTF-8 là dạng
mã hóa Unicode thông dụng nhất trong các ứng dụng web hiện nay.
Để viết các ứng dụng web dùng tiếng Việt Unicode, cần chọn các phần mềm soạn thảo hỗ trợ lưu trữ tập tin
dưới dạng mã hóa UTF-8 như Visual Studio.NET, MS FrontPage2000, NotePad, … ; sử dụng các hệ quản
trị CSDL hỗ trợ Unicode như SQL Server 7.0/2000, MS Access 2000, …; đặt các đoạn mã chỉ định bảng mã
mà webserver và trình duyệt dùng để mã hóa và giải mã dữ liệu.
Tài liệu trích dẫn
1. http://www.microsoft.com/globaldev/articles/unicode.asp

2. http://www.unicode.org/unicode/standard/principles.html

3. http://support.microsoft.com/default.aspx?scid=kb;en-us;Q303612

4. http://msdn.microsoft.com/library/default.asp?url=/workshop/author/dhtml/reference/charsets/charset4.asp

5. http://www.w3.org/TR/html401/charset.html#code-position


6
6. http://support.microsoft.com/default.aspx?scid=KB;EN-US;Q295063&
7. http://msdn.microsoft.com/library/default.asp?url=/library/en-us/iisref/html/psdk/asp/vbob150l.asp

8. http://support.microsoft.com/default.aspx?scid=kb;en-us;Q239530

9. http://support.microsoft.com/default.aspx?scid=kb;en-us;q232580

10. http://support.microsoft.com/default.aspx?scid=kb;en-us;Q245000

11. http://support.microsoft.com/default.aspx?scid=kb;[LN];Q254313


HẾT
KẾT XUẤT DỮ LIỆU RA DẠNG EXCEL TỪ TRANG ASP
Thông thường, các ứng dụng web kết xuất dữ liệu của các báo cáo ra dưới dạng bảng biểu. Sẽ rất
cần thiết nếu người dùng cũng nhận được dữ liệu này dưới dạng Excel để có thể sử dụng cho các
mục đích khác.
Kĩ thuật để đạt được mục đích này khá đơn giản. Ý tưởng chính của kĩ thuật này là sử dụng thuộc
tính ContentType của đối tượng Response trong ASP và thực hiện theo các bước tuần tự sau:
Bước 1: Chỉ định dữ liệu sẽ được chuyển đi theo định dạng Excel
Đơn giản chỉ cần dùng câu lệnh: Response.ContentType = “application/vnd.ms-excel”. Thông
thường, cần phải đặt câu lệnh Response.Buffer = True và Response.Clear trước câu lệnh này để
đảm bảo dữ liệu được chuyển xuống client chính xác.
Bước 2: Kết xuất dữ liệu dưới dạng bảng theo cách làm thông thường.
Dòng đầu tiên của bảng chứa tên của các cột sẽ được hiển thị trong tập tin excel.
Hãy xem ví dụ minh họa sau:
Data2Excel.asp
<%
Response.Buffer = True
Response.Clear
‘ thiết lập định dạng sẽ kết xuất là Excel
Response.ContentType = “application/vnd.ms-excel”

‘ kết nối với CSDL
strDSN = "DRIVER=Microsoft Access Driver (*.mdb);DBQ="
‘ đường dẫn tương đối đến tập tin CSDL
strDSN = strDSN & Server.MapPath("myDB.mdb")
set Conn = Server.CreateObject("ADODB.Connection")
Conn.Open strDSN
strSQL = “SELECT * FROM myTable”
set rs = Conn.Execute(strSQL)
rowstart = “<tr>”
rowend = “</tr>”
cellstart = “<td>”
cellend = “</td>”
Response.Write “<TABLE border=1>”
‘ dòng đầu tiên in tên các cột
Response.Write rowstart
For i = 0 to rs.Fields.Count -1
Response.Write cellstart & "<b>" & rs.Fields(i).name & "</b>" & cellend
Next
Response.Write rowend
‘ in dữ liệu của từng dòng
Do while not rs.EOF
Response.Write rowstart
For i = 0 to rs.Fields.Count –1
Response.Write cellstart & rs.Fields(i)& cellend
Next
Response.Write rowend
rs.MoveNext
Loop
rs.Close
set rs = Nothing
Conn.Close
set Conn = nothing
Response.Write “</TABLE>”
Response.End
%>

Bàn luận:
Ưu điểm của cách làm trên là cho phép bạn sử dụng các đoạn mã sẵn có lúc kết xuất dữ liệu ra dạng
bảng theo cách thông thường để chuyển sang định dạng Excel. Tuy nhiên việc kết xuất dữ liệu theo
định dạng Excel như trong ví dụ trên có thể chiếm tài nguyên của webserver đặc biệt khi dữ liệu lớn
do đó chỉ nên dùng cách này nếu trang này không được sử dụng thường xuyên.
Nếu muốn kết xuất dữ liệu lớn và thực hiện thường xuyên, ta có thể kết xuất thông qua định dạng
CSV (Comma-Separated Values) để tối ưu hơn. Các tập tin theo định dạng CSV là các tập tin văn
bản mà dữ liệu trong các cột được ngăn cách với nhau bởi dấu phẩy “,” (comma), rất thường được
dùng cho việc trao đổi dữ liệu giữa các hệ quản trị CSDL và các chương trình bảng tính như Excel.
Ví dụ, nếu bạn mở một tập tin csv có nội dung như sau trong Excel, ta sẽ nhận được một bảng 3
dòng, 3 cột:
Doe,John,944-7077
Johnson,Mary,370-3920
Smith,Abigail,299-3958
Để chuyển dữ liệu sang định dạng CSV, vẫn với cách làm tương tự bằng cách thay đổi thuộc tính
ContentType về dạng “application/csv” và thêm dòng lệnh sau để yêu cầu trình duyệt hiển thị hộp
thoại tải tập tin về: Response.AddHeader "Content-Disposition", "filename=mydata.csv;". Sau đó,
thay vì định dạng dữ liệu dưới dạng bảng, ta định dạng dữ liệu theo dạng dữ liệu các cột được phân
cách với nhau bằng dấu phẩy “,”. Xem ví dụ minh họa sau:
Data2CSV.asp
<%
Response.Buffer = True
Response.Clear
‘ thiết lập định dạng sẽ kết xuất là Excel
Response.ContentType = “application/csv”
Response.AddHeader "Content-Disposition", "filename=mydata.csv;"

‘ kết nối với CSDL
strDSN = "DRIVER=Microsoft Access Driver (*.mdb);DBQ="
‘ đường dẫn tương đối đến tập tin CSDL
strDSN = strDSN & Server.MapPath("myDB.mdb")
set Conn = Server.CreateObject("ADODB.Connection")
Conn.Open strDSN
strSQL = “SELECT * FROM myTable”
set rs = Conn.Execute(strSQL)
‘ dòng đầu tiên in tên các cột
For i = 0 to rs.Fields.Count -1
Response.Write rs.Fields(i).name & ",”
Next
Response.Write vbNewLine ‘ kết thúc một dòng dữ liệu
‘ in dữ liệu của từng dòng
Do while not rs.EOF
For i = 0 to rs.Fields.Count –1
Response.Write rs.Fields(i)& “, ”
Next
Response.Write vbNewLine ‘ kết thúc một dòng dữ liệu
rs.MoveNext
Loop
rs.Close
set rs = Nothing
Conn.Close
set Conn = nothing
Response.End
%>

Hạn chế của định dạng này là do dữ liệu chỉ là các kí tự ASCII nên sẽ không dùng được trong
trường hợp dữ liệu sử dụng Unicode, ngoài ra cần phải có cách xử lí thích hợp trong trường hợp dữ
liệu trong các cột có dấu phẩy “,”. Excel xử lí trường hợp này bằng cách thay đặt toàn bộ dữ liệu
trong dấu “”. Ví dụ nếu bạn có dữ liệu là Abc, xyz thì dữ liệu sẽ được đổi thành “Abc, xyz”
Tham khảo thêm tại:
http://www.web-savant.com/users/kathi/asp/samples/tut/Export_to_Excel.asp

http://gethelp.devx.com/techtips/asp_pro/10min/10min0699.asp


Lê Đình Duy – ldduy@fit.hcmuns.edu.vn

HIỂN THỊ HÌNH ẢNH TỪ CƠ SỞ DỮ LIỆU
TRONG CÁC ỨNG DỤNG WEB

Lê Đình Duy
Khoa CNTT – ĐHKHTN Tp.HCM
ldduy@fit.hcmuns.edu.vn
12.2002

1. Giới thiệu
Việc lưu trữ và hiển thị hình ảnh từ CSDL trong các ứng dụng web là cần thiết. Ví dụ như các ứng dụng
quản lí hồ sơ của nhân viên, ngoài thông tin bằng văn bản như Họ tên, địa chỉ, bằng cấp, … sẽ rất cần thiết
nếu có thêm dữ liệu về ảnh của nhân viên. Hay trong các ứng dụng bán hàng, bên cạnh thông tin về sản
phẩm như Tên sản phẩm, phân loại sản phẩm, giá cả, … hình ảnh trực quan về sản phẩm cũng rất cần thiết
để giúp cho người dùng dễ dàng hơn khi chọn lựa, …
Thông thường người ta dùng một trong hai cách để đạt được mục đích này. Cách thứ nhất là lưu trữ tập tin
hình ảnh trên một thư mục riêng, trong CSDL ngoài dữ liệu văn bản chỉ lưu đường dẫn đến tập tin hình ảnh.
Cách thứ hai là lưu trữ cả dữ liệu hình ảnh và văn bản trong cùng một bản ghi trong CSDL.
Cách tiếp cận thứ nhất thường được dùng hơn vì CSDL có kích thước nhỏ và thao tác hiển thị khá đơn giản
thông qua tag IMG với thuộc tính SRC được gán bằng thông tin về đường dẫn đến tập tin hình ảnh đã có
trong CSDL. Hạn chế của cách tiếp cận này là đòi hỏi dữ liệu ảnh phải được lưu trữ trên webserver hoặc ở
một máy tính nào đó mà webserver có thể truy cập được. Trong các ứng dụng mà cơ sở dữ liệu có thể
được sao lưu nhiều bản để phân tán, “rủi ro” sẽ xảy ra nếu các tập tin hình ảnh không được sao lưu theo
đúng đường dẫn sẵn có.
Cách tiếp cận thứ hai do lưu trữ hình ảnh trong CSDL như là dữ liệu nhị phân nên sẽ dẫn đến hạn chế là
làm cho kích thước của CSDL tăng lên đang kể. Nhưng bù lại, dữ liệu hình ảnh và văn bản ở chung một nơi
nên có thể dùng cho các CSDL được sao lưu nhiều nơi. Để lưu trữ dữ liệu hình ảnh trên các hệ quản trị
CSDL ta phải dùng các kiểu dữ liệu dạng nhị phân cho nó. Ví dụ, trong MS SQL Server là kiểu dữ liệu
image, trong MS Access là kiểu dữ liệu OLE Object.
2. Hiển thị hình ảnh có trong CSDL
Nếu dùng cách tiếp cận thứ nhất, ta sẽ tạo ra trong bảng dữ liệu một trường tên chẳng hạn là IMAGE_URL
để lưu trữ đường dẫn đến tập tin hình ảnh, ví dụ như là: images/id1234.gif. Để hiển thị hình ảnh này trong
trang web, đơn giản chỉ cần dùng tag IMG với thuộc tính SRC được gán bằng dữ liệu trong trường
ImageURL như: Response.Write("<IMG SRC="" & rs("IMAGE_URL") & """>").
Nếu dùng cách tiếp cận thứ hai, ta sẽ tạo ra trong bảng dữ liệu một trường có tên chẳng hạn là
APP_IMGDATA để lưu trữ dữ liệu hình ảnh dưới dạng nhị phân. Sau đó, để hiển thị hình ảnh này lên, ta
thực hiện tuần tự các bước sau:
- Đọc dữ liệu hình ảnh lưu trong ImgData vào recordset.
- Gán thuộc tính ContentType của đối tượng Response tương ứng với định dạng ảnh lưu trữ. Nếu lưu
tập tin dưới dạng .gif, ta đặt Response.ContentType=”image/gif”.
- Sử dụng hàm Response.BinaryWrite để ghi nội dung dữ liệu của hình ảnh ra.

Không có nhận xét nào:

Đăng nhận xét