2018-8-26-各种URL编码傻傻分不清楚

2020-06-10 11:20:49 浏览数 (1)

进行web开发时总要遇到URL编码的问题,但是看看.Net提供的库函数真是难以区分。


在StackOverflow上有贴子总结了.Net提供的库函数

  • UrlEncoded: HttpUtility.UrlEncode
  • UrlEncodedUnicode: HttpUtility.UrlEncodeUnicode
  • UrlPathEncoded: HttpUtility.UrlPathEncode
  • WebUtilityUrlEncoded: WebUtility.UrlEncode
  • EscapedDataString: Uri.EscapeDataString
  • EscapedUriString: Uri.EscapeUriString
  • HtmlEncoded: HttpUtility.HtmlEncode
  • HtmlAttributeEncoded: HttpUtility.HtmlAttributeEncode
  • WebUtilityHtmlEncoded: WebUtility.HtmlEncode
  • HexEscaped: Uri.HexEscape

  • HTML类别包括
    • HtmlEncoded: HttpUtility.HtmlEncode
    • HtmlAttributeEncoded: HttpUtility.HtmlAttributeEncode
    • WebUtilityHtmlEncoded: WebUtility.HtmlEncode

    这三种主要是对HTML的保留字符做转义,包括:

    • ""
    • &&
    • ''
    • <&lt;
    • >&gt;

    唯一的区别是HtmlAttributeEncoded没有对>进行转义

  • Hex Hex仅支持ASCII码,将ASCII码字符转换为% Hex数值(大写)
  • UrlEncoded和UrlEncodedUnicode 这两个类的处理方式类似
    • 针对ASCII字符, 对!()*-._不做转义处理,但是对于空格,会被转成
    • 而其余字符和Hex一样转成% Hex数值(小写)

    针对其余字符

    • UrlEncoded采用Utf-8编码,% Hex高位数值(小写) % Hex低位数值(小写)
    • UrlEncodedUnicode采用Unicode编码,%u Unicode数值(小写)
  • UrlPathEncoded
    • 针对ASCII字符仅对空格转换为
    • 针对其余字符同UrlEncoded,采用utf-8编码,% Hex高位数值(小写) % Hex低位数值(小写)
  • WebUtilityUrlEncoded WebUtilityUrlEncoded编码规则和UrlEncoded一模一样,只是所有的编码输出变成了大写
  • EscapedDataString EscapedDataString和WebUtilityUrlEncoded编码规则很相似,也是采用大写形式编码。只是保留字符不同
    • 针对ASCII字符, 对-._~不做转义处理,其余转义为% Hex数值(大写)
    • 针对其余字符,采用Utf-8编码,% Hex高位数值(大写) % Hex低位数值(大写)
  • EscapedUriString EscapedUriString在EscapedDataString扩充了非转义字符 EscapedUriString对 对!#$&'()* ,-./:;=?@[]_~不做转义处理

使用场景

关于使用场景,目前我能总结的不多,欢迎补充:

  • 针对浏览器中的url转义,推荐使用EscapedUriString,可以方便保留:/#?等分隔符的情况下对非ascii字符进行转义

参考链接:.net - URL Encoding using C# - Stack Overflow


本文会经常更新,请阅读原文: https://xinyuehtx.github.io/post/各种URL编码傻傻分不清楚.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名黄腾霄(包含链接: https://xinyuehtx.github.io ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系 。

0 人点赞