站长资源网络编程

在服务器端的XSLT过程中的编码问题

整理:jimmy2025/1/10浏览2
简介最近和苹果皮在讨论优化 Weather For Google Earth 的时候使用到了 XSLT 来转换 XML 数据的问题,那这里就必须用到转换引擎,大概过程就是把 XML 文件和 XSLT 文件都转载到内存里用DOM引擎进行转换到我们想要的 HTML(我这个实例里是要生成 KML 文件)。这个
最近和苹果皮在讨论优化 Weather For Google Earth 的时候使用到了 XSLT 来转换 XML 数据的问题,那这里就必须用到转换引擎,大概过程就是把 XML 文件和 XSLT 文件都转载到内存里用DOM引擎进行转换到我们想要的 HTML(我这个实例里是要生成 KML 文件)。这个转换的过程又分客户端和服务器端的,因为客户端的转换需要用户的浏览器完整地支持 XML ,但不是全部的用户的浏览器现在都支持的(IE5、IE4等),所以进行服务端的转换是比较理想的。
    XML文件形式:

<?xml version="1.0" encoding="UTF-8"?>
<weather ver="2.0">
  <head>[...]
  </head>
  <loc id="CHXX0101">[...]  
  </loc>  
  <cc>[...]  
  </cc>  
  <dayf>  
    <lsup>10/28/06 11:16 AM Local Time</lsup>  
    <day d="0" t="Saturday" dt="Oct 28">[...]  
    </day>  
    <day d="1" t="Sunday" dt="Oct 29">[...]  
    </day>  
  </dayf> 
</weather> 
    XSLT文件形式(内容部分省略):

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
    <xsl:template match="/">[...]
</xsl:stylesheet> 

    我开始进行的转换代码,用的是ASP+JavaScirpt :

//========输出类型和流编码==========================
      Response.ContentType = "application/vnd.google-earth.kml+xml";
      Response.CharSet = "UTF-8" ;
//=====获得并载入远程XML文件==========================
      var oXHy = Server.CreateObject("MSXML2.XMLHTTP");
      var url  = http://www.dnxh.cn/ge/CHXX0101.xml;  
      oXHy.open("GET",url,false);
      oXHy.send();
      var oXD = Server.CreateObject("MSXML2.DOMDocument");
      oXD.loadXML(oXHy.responseText);
//======载入XSL文件=========================
      var xsl = Server.CreateObject("Microsoft.XMLDOM");
      xsl.async = false;
      xsl.load(Server.MapPath("gew.xsl"));
//======文件的转换====================
      Response.Write(oXD.transformNode(xsl)); 
    按理说这样应该没有编码的问题了,因为该声明编码的地方都声明了。可是偏偏出了问题。输出的 KML 文件的开头声明里面总是
  <?xml version="1.0" encoding="UTF-16"?>
  通过测试发现 XML 和 XSLT 两个源文件没有问题,那问题就在 ASP 代码里的转换引擎上,后来在RE: [xsl] Problem with Chinese (Solution)这篇文章上大概的找到了原因,这里面说引擎 transformNode 是生成了一个字符串,而在 win32 平台上总是以 UTF-16 来处理字符串的,然后我们再用这个字符串来生成 KML 文件,那结果就只能是 UTF-16 的了。
    解决的办法就是用 transformNodeToObject 引擎。文件转换部分换成 oXD.transformNodeToObject( xsl , Response)。这两个方法的不同之处就是前一个是生成了一个字符串变量,后一个是直接把转换后的 XML 数据保存到指定的节点里了。