jjzjj

MultiByte

全部标签

c++ - C标准: Character set and string encoding specification

我发现C标准(C99和C11)在字符/字符串代码位置和编码规则方面含糊不清:首先标准定义了源字符集和执行字符集。本质上它提供了一组字形,但不关联任何数值与他们一起-那么默认字符集是什么?我不是在这里询问编码,而只是询问字形/轨道到数字/代码点的映射。它确实将universalcharacternames定义为ISO/IEC10646,但它是否说这是默认字符集?作为上述内容的扩展-我找不到任何说明什么字符的内容数字转义序列\0和\x表示。从C标准(C99和C11,我没有检查ANSIC)我得到以下关于字符和字符串文字:+---------+-----+------------+------

linux - 波兰语文本出现 msgfmt "invalid multibyte sequence"错误

使用CompleteC++i18ngettext()“helloworld”example我将区域设置从“es_MX”更改为“pl_PL”,并将文本从“hello,world!”更改为“es_MX”。到“无效输入。输入至少20个字符长的字符串。”。波兰语翻译包含多个字符,这些字符会导致msgfmt、“łąźó”出现“无效的多字节序列”错误。翻译的文本是从网页复制的。我认为utf8是问题所在。如果是这样,应该用什么代替?cat>plt.cxx#include#includeintmain(){setlocale(LC_ALL,"");bindtextdomain("plt",".");t

php - htmlentities 'Invalid Multibyte Sequence' 错误

在尝试通过PHP的htmlentities函数运行字符串时,我遇到了一些“无效的多字节序列”错误。有没有办法在调用函数之前清理字符串以防止发生此错误? 最佳答案 从PHP5.4开始,您应该使用以下内容来正确转义输出:$escapedString=htmlspecialchars($string,ENT_QUOTES|ENT_SUBSTITUTE|ENT_DISALLOWED|ENT_HTML5,$stringEncoding);ENT_SUBSTITUTE用�替换无效的代码单元序列(而不是返回空字符串)。ENT_DISALLOWED

php - htmlspecialchars() : Invalid multibyte sequence in argument

我在我的本地站点中遇到此错误。Warning(2):htmlspecialchars():Invalidmultibytesequenceinargumentin[/var/www/html/cake/basics.php,line207]有谁知道,这是什么问题或解决方案应该是什么?谢谢。 最佳答案 如果您的文件是这样编码的,请务必将编码指定为UTF-8:htmlspecialchars($str,ENT_COMPAT,'UTF-8');htmlspecialchars的默认字符集是ISO-8859-1(从PHPv5.4开始,默认字

ruby - 正则表达式错误 : too many multibyte code ranges are specified

我有一个需要匹配一堆字符的正则表达式。代码在ruby​​1.8.7中没有问题,但在1.9中它就结束了。我想这与编码有关,我已经进行了大量的谷歌搜索,所以也许有人可以启发我。代码:#encoding:utf-8non_latin_hashtag_chars=[(0xA960..0xA97F).to_a,#HangulJamoExtended-A(0xAC00..0xD7AF).to_a,#HangulSyllables(0xD7B0..0xD7FF).to_a#HangulJamoExtended-B].flatten.pack('U*').freezee=/[a-z_#{non_lat

ruby - "Invalid multibyte char (US-ASCII)"ä、ü、ö、ß 是 Ascii 的错误!

我的应用程序需要处理一些国际字符,即ä、ü、ö和ß,它们仍然是ascii。当我在处理这些字符时测试ruby​​的行为时,我得到了这个错误:test.rb:1:invalidmultibytechar(US-ASCII)test.rb:1:invalidmultibytechar(US-ASCII)对于这段代码:puts"ilikemychars:ä,ü,öandß!"但奇怪的是:当使用交互式RubyShell时,我没有得到任何错误!编辑:在我的应用程序中,我正在从外部API检索数据。上面的代码只是一个例子! 最佳答案 不,这些字符不

Ruby 1.9.2 字符编码 : invalid multibyte character:/?/

我试图理解为什么这段代码在Ruby1.9.2中不起作用我还试图弄清楚应该如何更改它才能使其工作。这是片段:ruby-1.9.2-p290:009>str="helloworld!"=>"helloworld!"ruby-1.9.2-p290:010>str.gsub("\223","")RegexpError:invalidmultibytecharacter:/?/from(irb):10:in`gsub' 最佳答案 您的ruby​​处于UTF-8模式,但"\223"不是有效的UTF-8字符串。当你在UTF-8中时,任何设置了第八