码迷,mamicode.com
首页 > 移动开发 > 详细

multipart/form-data和application/x-www-form-urlencoded的区别(二)

时间:2020-05-09 01:28:11      阅读:93      评论:0      收藏:0      [点我收藏+]

标签:请求   原创文章   bsp   的区别   为什么   ati   汉字   cti   tom   

结论:

1 对于spring boot 2.1.8 post content-type:urlencode

可以传输中文:a=卧 室&b=2&c=3

可以传输encode:a%3D%E5%8D%A7+%E5%AE%A4%26b%3D2%26c%3D3

(使用java socket模拟http【重点】springboot json post bug,wireshark抓http包中代码)

    private static void springbootPostUrlEncodeUrlEncode() throws Exception {
        Socket socket = new Socket();
        socket.setTcpNoDelay(true);
        socket.connect(new InetSocketAddress("127.0.0.1", 8080));

        new Thread(new ReadThread(socket.getInputStream())).start();

        String post = "POST /proxy/testhttpsPostUrlEncode HTTP/1.1\r\n";
        StringBuilder sb = new StringBuilder(post);
        sb.append("AUTH: memories\r\n");
        sb.append("Cookie: AUTH=memories\r\n");
        sb.append("Host: \r\n");

        /**
         * 无论此处是否encode,spring boot 2.1.8 都能解析报文并显示正常中文字符
         */
        String bodyUrlEncoded = "a=卧 室&b=2&c=3";
        boolean toEncodeUrl = false;
        if(toEncodeUrl) {
            bodyUrlEncoded = URLEncoder.encode(bodyUrlEncode);
            System.out.println(bodyUrlEncoded);
        }

        sb.append("Content-Type: application/x-www-form-urlencoded\r\n");
        sb.append("Content-Length:" + bodyUrlEncoded.getBytes().length +" \r\n");
        sb.append("\r\n");

        OutputStream outputStream = socket.getOutputStream();
        outputStream.write(sb.toString().getBytes());
        outputStream.write((bodyUrlEncoded).getBytes());
    }

 

1、它是post的默认格式,使用js中URLencode转码方法。包括将name、value中的空格替换为加号;将非ascii字符做百分号编码;将input的name、value用‘=’连接,不同的input之间用‘&’连接。

2、百分号编码什么意思呢。比如汉字‘丁’吧,他的utf8编码在十六进制下是0xE4B881,占3个字节,把它转成字符串‘E4B881’,变成了六个字节,每两个字节前加上百分号前缀,得到字符串“%E4%B8%81”,变成九个ascii字符,占九个字节(十六进制下是0x244534254238253831)。把这九个字节拼接到数据包里,这样就可以传输“非ascii字符的  utf8编码的 十六进制表示的 字符串的 百分号形式”,^_^。

3、同样使用URLencode转码,这种post格式跟get的区别在于,get把转换、拼接完的字符串用‘?’直接与表单的action连接作为URL使用,所以请求体里没有数据;而post把转换、拼接后的字符串放在了请求体里,不会在浏览器的地址栏显示,因而更安全一些。

右边明显看到了一段乱码,为什么呢,以汉字‘丁’为例,其utf8编码为0xE4B881,这三个字节会直接拼接到数据包中,即其在实际发送时只占三字节,上图右边是逐字节转为ascii字符显示的,因此会显示为三个乱码字符

4、由上可见,multipart/form-data将表单中的每个input转为了一个由boundary分割的小格式,没有转码,直接将utf8字节拼接到请求体中,在本地有多少字节实际就发送多少字节,极大提高了效率,适合传输长字节。
————————————————
版权声明:本文为CSDN博主「hula_好天气」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u013827143/article/details/86222486

 

2 从1来看,tomcat会自动decode,至于它以什么规则decode的,我不关心;只是认为,如果text有=&%+这样的字符,不要使用这个contenttype,即使encode,这些字符会被遗漏忽略

https://blog.csdn.net/vickyway/article/details/46375971 该文认为,urlencod contenttype会,json不会

 

multipart/form-data和application/x-www-form-urlencoded的区别(二)

标签:请求   原创文章   bsp   的区别   为什么   ati   汉字   cti   tom   

原文地址:https://www.cnblogs.com/silyvin/p/12853913.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!