自在城财经

U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:

简介: U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:EFBFBDEFBFBDEFBFBD 这样在GBK/CP936/GB2312/GB18030的环境(都是中国标准惹的祸)中显示的话,一个汉字2个字节,最

在超市购物的时候也能看到,下面小编就带大家来了解一下在Visual Studio中的Debug模式下,如果声明一个变量,但是没有初始化,微软会给未初始化的内存复制为0xCC。

给为初始化的内存赋0xCC是有原因的,0xCC其实是INT3中断指令,所以如果在Debug模式下试图去执行这块未初始化的内存的话就会中断程序。

但VS中调试器默认的字符集是MBCS,而在MBCS中0xCCCC正好就是中文中的“烫”,所以显示出来就都是烫…

如果是用分配堆的内存,会初始化成0xCD,0xCDCD在MBCS字符集中就是屯…

锟斤拷则涉及unicode的字符集转换问题,Unicode和老编码的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。

U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:EFBFBDEFBFBDEFBFBD 这样在GBK/CP936/GB2312/GB18030的环境(都是中国标准惹的祸)中显示的话,一个汉字2个字节,最终的结果就是:锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)…


以上是文章"

U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次形成:

"的内容,欢迎阅读自在城财经的其它文章