urlencode编码 — 为什么要编码

原文链接：https://blog.csdn.net/stpeace/article/details/82892571

参考：https://blog.csdn.net/z69183787/article/details/35987711

web客户端通过http post提交数据到web服务端，其中一个字段名是content, 部分js代码如下：

var xmlHttp = new XMLHttpRequest();
xmlHttp.open('post', 'http://localhost:8080/heheda')
xmlHttp.setRequestHeader("Content-type","application/x-www-form-urlencoded")
xmlHttp.send('content=' + str)

go gin做web服务端，一切工作的好好的。

可是，实际发现，web服务端概率取不到content的内容，快速确认了一下，比如当str="abc%"的时候，web服务端就取不到这个值。

　　然而，tcpdump抓包的内容显示有这个字段啊： content=abc%

也就是说，"abc%"的确传递到了web服务端, 怎么就取不出这个值呢？

要注意：content参数在传递后， web服务端默认content参数进行了urlencode, 所以接受到"abc%"后， web服务端的gin框架对"abc%"进行urldecode, 很显然，独立的"%"服务解析出错（特殊字符），所以在web服务端的代码中取不到"abc%"

那如果确实要传递"abc%"，怎么办呢？先进行urlencode吧，对应的串是"abc%25", 此时"content=abc%25", tcpdump抓包也能看到这个串"content=abc%25"，而在web服务端解析出来的content的内容abc% (web服务端自动进行了urldecode后)

回到题目那个问题，为什么要urlencode呢？

假设我们在http post请求中要传递的内容为"name1=xxx&name2=yyy", 如果xxx的内容为"lucy&key=hehe", 那么整个串就成了"name1=ucy&key=hehe&name2=yyy", 很显然，明明是两个字段，却变成了3个字段, 任何人都无法把原来的正确字段提取出来，一切都是"lucy&key=hehe"在捣鬼，所以，要对"lucy&key=hehe"进行转化，进行urlencode, 免得与"&"，"="产生冲突。

想一下，不进行urlencode，而进行base64编码可以吗？当然可以，只不过，需要自己去base64解码。相比较而言，urlencode就要好很多， web服务端会自己去进行urldecode, 更爽。

最后，要注意html form表单的post请求会默认进行urlencode, 可以抓包试试看。想一想，为什么要怎么做？

为什么需要Url 编码
1. Url 中有些字符会引起歧义 , =,& 号等
2. Url 的编码格式采用的是ASCII 码，而不是Unicode ，这也就是说你不能在Url 中包含任何非ASCII 字符，例如中文

哪些字符需要编码
RFC3986 文档规定，Url 中只允许包含英文字母（a-zA-Z ）、数字（0-9 ）、-_.~4 个特殊字符以及所有保留字符。
Url 可以划分成若干个组件，协议、主机、路径等。RFC3986 中指定了以下字符为保留字符：　! * ' ( ) ; : @ & =+ $ , / ? # [ ]

posted @ 2019-12-20 15:39 大漠垂杨阅读(2137) 评论(0) 收藏举报

刷新页面返回顶部

urlencode编码 — 为什么要编码

公告