用XMLHTTP Post Form时的表单乱码解决方案

<SCRIPT language="VBScript">
 Function StringURLEncode(strInput)
           Dim cset
           cset = LCase(document.charset)
           If cset = "utf-8" Then
                StringURLEncode = window.encodeURI(strInput)
                Exit Function
           End If

         Dim strEncoded, regExp, chCurr, strHexVal, objMatches, objMatch

数据挖掘工具

         strEncoded = strInput

数据挖掘工具

         ′ First, replace all % signs with the encoded value.
         strEncoded = Replace(strEncoded, "%", "%25") 数据挖掘工具

        ′ Next, replace all non-alphanumeric characters with their encoded
        ′ values, EXCEPT FOR the spaces (" ").
        Set regExp = New RegExp
        regExp.Pattern = "[^%A-Za-z0-9 ]"
        regExp.Global = False
        Do
             Set objMatches = regExp.Execute(strEncoded)
            If objMatches.Count <> 0 Then
                 ′ Get the character that matched.
                 Set objMatch = objMatches.Item(0)

数据挖掘研究院

                 ′ Create the URL-Encoded version.
                 chCurr = objMatch.Value
   
                If Abs(Asc(chCurr)) < &HFF Then
                    ′strReturn = strReturn & ThisChr
                    strHexVal = Hex(Asc(chCurr))
                    strHexVal = String(2 - Len(strHexVal), "0") & strHexVal
                   ′ Replace the character with the URL-Encoded version.


                   strEncoded = Replace(strEncoded, chCurr, "%" & strHexVal)
               Else
                   Dim innerCode, Hight8, Low8
                   innerCode = Asc(chCurr)
                   If innerCode < 0 Then
                        innerCode = innerCode + &H10000
                   End If
                    Hight8 = (innerCode  And &HFF00) &HFF
                    Low8 = innerCode And &HFF
                    ′strReturn = strReturn & "%" & Hex(Hight8) &  "%" & Hex(Low8)
                   strEncoded = Replace(strEncoded, chCurr, "%" & Hex(Hight8) &  "%" & Hex(Low8))
                End If   
             End If
       Loop While objMatches.Count <> 0 数据挖掘实验室

     ′ Finally, replace spaces.
     strEncoded = Replace(strEncoded, " ", "+")

数据挖掘工具

     StringURLEncode = strEncoded
End Function   数据挖掘工具

  数据挖掘论坛

Function URLEncoding(vstrIn)
    strReturn = ""
    For i = 1 To Len(vstrIn)
        ThisChr = Mid(vStrIn,i,1)
        If Abs(Asc(ThisChr)) < &HFF Then
            strReturn = strReturn & ThisChr
        Else
            innerCode = Asc(ThisChr)
            If innerCode < 0 Then
                innerCode = innerCode + &H10000
            End If
            Hight8 = (innerCode  And &HFF00) &HFF


            Low8 = innerCode And &HFF
            strReturn = strReturn & "%" & Hex(Hight8) &  "%" & Hex(Low8)
        End If
    Next
    URLEncoding = strReturn
End Function
数据挖掘交友

Function bytes2BSTR(vIn)
    strReturn = ""
    For i = 1 To LenB(vIn)
        ThisCharCode = AscB(MidB(vIn,i,1))
        If ThisCharCode < &H80 Then
            strReturn = strReturn & Chr(ThisCharCode)
        Else
            NextCharCode = AscB(MidB(vIn,i+1,1))
            strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
            i = i + 1
        End If
    Next
    bytes2BSTR = strReturn
End Function

</Script> 数据挖掘交友

  数据挖掘实验室

  数据挖掘实验室

用XMLHTTP Post Form时的表单乱码有两方面的原因——Post表单数据时中文乱码;服务器Response被XMLHTTP不正确编码引起的乱码。换句话说,本文主要解决两个问题——怎样正确Post中文内容&怎样正确显示得到的中文内容。

Part I Post中文内容

先看看E文的表单是怎么提交的:

<SCRIPT language="JavaScript">
strA = "submit1=Submit&text1=scsdfsd";
var oReq = new ActiveXObject("MSXML2.XMLHTTP");
oReq.open("POST","http://ServerName/VDir/TstResult.asp",false);
oReq.setRequestHeader("Content-Length",strA.length);  
oReq.setRequestHeader("CONTENT-TYPE","application/x-www-form-urlencoded");
oReq.send(strA);
</ScRIPT>

如果把strA = "submit1=Submit&text1=scsdfsd";换成:
strA = "submit1=Submit&text1=中文";

你会发现提交上去的东东根本不对,ASP中Request.Form("Text1")根本取不到值。俺用Request.BinaryRead把一个HTML Form中的Post内容写出来看了看,才发现问题——Form提交时也要编码的,编码后的中文是类似于%??%??的转义字符,比如“中文”就被编码为:%D6%D0%CE%C4。呵呵,也怪俺笨,人家CONTENT-TYPE里明明写的清清楚楚——application/x-www-form-urlencoded,urlencoded嘛当然就是这个样子了。既然这样,那我们也知道该怎么办了——自己做转换,代码见上URLEncoding: 数据挖掘实验室

<SCRIPT language="JavaScript">
strA = URLEncoding("submit1=Submit&text1=中文")
oReq = CreateObject("MSXML2.XMLHTTP")
oReq.open "POST","http://ServerName/VDir/TstResult.asp",false
oReq.setRequestHeader "Content-Length",Len(strA)
oReq.setRequestHeader "CONTENT-TYPE","application/x-www-form-urlencoded"
oReq.send strA
</ScRIPT>

Part II.正确显示得到的中文内容

OK,如果你在Server端把Form的内容写到数据库/文件的话,你在那里看到的中文毫无问题,但是,假如你想看看Server的Response——问题来了:如果Response的结果不是XML,XMLHTTP.responseXML里当然是不会有东东的,那就用responseText好了,在代码的最后加一句:

alert(oReq.responseText)
看看俺们辛勤劳动的结果  :P

但是但是.....怎么所有的中文全变成了方格? (我打不出来,有兴趣自己去试,也不用Post,Get一个含有中文的网页就可以发现了。)

原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,如果Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼! 数据挖掘研究院

不过好在还有补救的办法:XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——"a raw undecoded bytes as received directly from the server" :),唯一的问题是,responseBody返回的是一个unsigned bytes数组,我们怎么去访问它,怎么把它转换成BSTR?

数据挖掘工具

<SCRIPT language="JavaScript">
strA = URLEncoding("submit1=Submit&text1=中文")
oReq = CreateObject("MSXML2.XMLHTTP")
oReq.open "POST","http://ServerName/VDir/TstResult.asp",false
oReq.setRequestHeader "Content-Length",Len(strA)
oReq.setRequestHeader "CONTENT-TYPE","application/x-www-form-urlencoded"
oReq.send strA
alert bytes2BSTR(oReq.responseBody)
</ScRIPT>

嘿嘿,是不是很简单啊,用这个再试试看?一切OK!

StringURLEncode 是特殊的地方使用,具体分析。

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:中文排版CSS心得
下一篇:javaScript基础
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • 新年矢量素材下载大集合
  • frame高度宽度固定
  • JavaScript语言参考手册_目录
  • 用XMLHTTP Post Form时的表单乱码解决方案
  • 使用Filter实现动态页面的静态HTML缓冲
  • javascript 通用库(二)
  • 用CSS制作鼠标经过图像
  • javascript 差错功能函数
  • 急死了~~checkbox传值的问题
  • javaScript基础
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • javascript lanscape打印
  • javascript 差错功能函数
  • javascript 通用库(二)
  • javascript 通用库(一)
  • javascript 正则表达式
  • 脚本攻击防范策略完全篇
  • javaScript基础
  • 用XMLHTTP Post Form时的表单乱码解决方案
  • 中文排版CSS心得
  • 使用Filter实现动态页面的静态HTML缓冲
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静