問題如下:客戶的論壇系統(tǒng)里中文文件名的附件無法下載。我同事們用他們的IE6去測試,確實(shí)無法下載,待我連到客戶的系統(tǒng),發(fā)現(xiàn)附件的文件名相當(dāng)長,差不多30個字。但我的IE卻可以下載,只不過文件名頭部被截斷了。
關(guān)于中文文件下載的問題,網(wǎng)上的咨詢和答疑已經(jīng)很多,我原來處理下載的代碼如下:
response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));
下載的程序里有了這句,一般在IE6的下載提示框上將正確顯示文件的名字,無論是簡體中文,還是日文。不過當(dāng)時確實(shí)沒有仔細(xì)測試文件名很長的中文文件名。先如今經(jīng)過仔細(xì)測試,發(fā)現(xiàn)文字只要超過17個字,就不能下載了。經(jīng)過好一番google和反復(fù)測試,總算對這個問題有了系統(tǒng)的認(rèn)識,分列如下:
一. 通過我原來的方式,也就是先用URLEncoder編碼,當(dāng)中文文字超過17個時,IE6 無法下載文件。這是IE的bug,參見微軟的知識庫文章
KB816868 。原因可能是因?yàn)閕e在處理 Response Header 的時候,對header的長度限制在150字節(jié)左右。而一個漢字編碼成UTF-8是9個字節(jié),那么17個字便是153個字節(jié),所以便會報錯。微軟提供了一個補(bǔ)丁,可以從
這里 下載。這個補(bǔ)丁需要先安裝ie6 sp1。因?yàn)槲移綍r勤打補(bǔ)丁,我的IE6版本號是 6.0.2800.1106.xpsp2_xxxxx。所以我可能已經(jīng)安裝過了補(bǔ)丁,從而可以下載,但仍然出現(xiàn)文件名被截斷的現(xiàn)象。微軟讓我們等待IE下一個service pack的發(fā)布。我今天也上網(wǎng)看到了好消息,迫于firefox的壓力,IE7可能在年中發(fā)布。另外,F(xiàn)irefox 不支持這樣的方式,將把編碼后的%xx%xx直接作為文件名顯示。
二. 我嘗試使用 javamail 的MimeUtility.encode()方法來編碼文件名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,并從
RFC1522 中找到對應(yīng)的標(biāo)準(zhǔn)支持。不過很遺憾,IE6并不支持這一個標(biāo)準(zhǔn)。我試了一下,F(xiàn)irefox是支持的。
三. 按網(wǎng)上很多人提供的解決方案:將文件名編碼成ISO8859-1似乎是有效的解決方案,代碼如下:
response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在確保附件文件名都是簡體中文字的情況下,那么這個辦法確實(shí)是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現(xiàn)在的系統(tǒng)通常都加入了國際化的支持,普遍使用UTF-8。如果文件名中又有簡體中文字,又有繁體中文,還有日文。那么亂碼便產(chǎn)生了。另外,在我的電腦上Firefox(v1.0-en)下載也是亂碼。
折中考慮,我結(jié)合了一、三的方式,代碼片斷如下:
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
* see
http://support.microsoft.com/default.aspx?kbid=816868 */
if (fileName.length() > 150) {
String guessCharset = xxxx /*根據(jù)request的locale 得出可能的編碼,中文操作系統(tǒng)通常是gb2312*/
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
暫且不考慮 Firefox 是因?yàn)樗壳八坪踹€沒有有力侵食到IE的企業(yè)用戶市場。影響客戶買單的常常是進(jìn)度,而不是兼容度。