jjzjj

ruby-on-rails - 如何在 ruby​​ 中使用 utf8 的正则表达式

在RoR中,如何使用utf8代码验证中文或日文单词用于发布表单。在GBK编码中,它使用[\u4e00-\u9fa5]+来验证中文单词。在Php中,它使用/^[\x{4e00}-\x{9fa5}]+$/u用于utf-8页面。 最佳答案 Ruby1.8对UTF-8字符串的支持很差。您需要在正则表达式中单独编写字节,而不是完整的代码:>>"acentuação".scan(/\xC3\xA7/)=>["ç"]要匹配您指定的范围,表达式会变得有点复杂:/([\x4E-\x9E][\x00-\xFF])|(\x9F[\x00-\xA5])/#

ruby - String#encode 未修复 "invalid byte sequence in UTF-8"错误

我知道有很多关于此错误的类似问题,而且我已经尝试了很多,但都没有成功。我遇到的问题涉及字节\xA1并且正在抛出ArgumentError:invalidbytesequenceinUTF-8我尝试了以下但没有成功:"\xA1".encode('UTF-8',:undef=>:replace,:invalid=>:replace,:replace=>"").sub('','')"\xA1".encode('UTF-8',:undef=>:replace,:invalid=>:replace,:replace=>"").force_encoding('UTF-8').sub('','')"

ruby - 相当于 Iconv.conv ("UTF-8//IGNORE",...) 在 Ruby 1.9.X 中?

我正在从远程源读取数据,偶尔会得到一些采用另一种编码的字符。它们并不重要。我想得到一个“最佳猜测”的utf-8字符串,并忽略无效数据。主要目标是获得一个我可以使用的字符串,并且不会遇到以下错误:Encoding::UndefinedConversionError:从ASCII-8BIT到UTF-8的“\xFF”:utf-8中的无效字节序列 最佳答案 我以为是这样:string.encode("UTF-8",:invalid=>:replace,:undef=>:replace,:replace=>"?")将用“?”替换所有已知项。要

错误为 "illegal/malformed utf-8"的 Ruby to_json 问题

我在尝试将散列转换为json字符串时遇到错误JSON::GeneratorError:sourcesequenceisillegal/malformedutf-8。我想知道这是否与编码有关,我怎样才能让to_json只按原样对待\xAE?$irb2.0.0-p247:001>require'json'=>true2.0.0-p247:002>a={"description"=>"iPhone\xAE"}=>{"description"=>"iPhone\xAE"}2.0.0-p247:003>a.to_jsonJSON::GeneratorError:sourcesequenceisi

ruby - 使用 Ruby 将 UTF8 转换为 ANSI

我有一个Ruby脚本,它在Linux机器上远程生成一个UTF8CSV文件,然后通过SFTP将该文件传输到Windows机器。然后我需要用Excel打开这个文件,但是Excel没有UTF8,所以我总是需要在能够将UTF8转换为ANSI的文本编辑器中打开这个文件。我很乐意使用Ruby以编程方式执行此操作并避免手动转换步骤。最简单的方法是什么?PS:我尝试使用iconv但没有成功。 最佳答案 ascii_str=yourUTF8text.unpack("U*").map{|c|c.chr}.join假设您的文本确实适合ascii字符集。

ruby - 如何将 UTF8 组合字符转换为 ruby​​ 中的单个 UTF8 字符?

一些字符,例如Unicode字符'LATINSMALLLETTERCWITHCARON'可以编码为0xC40x8D,但也可以用'LATINSMALLLETTERC'和'COMBININGCARON',即0x630xcc0x8c。更多信息在这里:http://www.fileformat.info/info/unicode/char/10d/index.htm我想知道是否有一个库可以将“LATINSMALLLETTERC”+“COMBININGCARON”转换为“LATINSMALLLETTERCWITHCARON”。或者是否有包含这些转化的表格? 最佳答案

ruby-on-rails - 在 Ruby on Rails 中, '#encoding: utf-8' 和 'config.encoding = "utf-8"' 是否不同?

我可以通过在其顶部添加注释行来指定任何ruby​​文件使用特定编码:#encoding:utf-8但是在Rails的config/application.rb中,我发现了这个:config.encoding="utf-8"它们有什么不同吗?如果我设置了config.encoding="utf-8",我还需要#encoding:utf-8吗? 最佳答案 config/application.rb中的config.encoding="utf-8"部分与Rails应如何解释内容有关。ruby文件中的#encoding:utf-8告诉rub

Ruby:如何自动添加 "# encoding: UTF-8"?

是否有任何gem可以自动将#encoding:UTF-8添加到每个Ruby文件?或者是否有任何其他方法可以防止整个RubyonRails项目(不仅在单个类中)出现invalidmultibytechar(US-ASCII)错误? 最佳答案 升级到Ruby2.0,因为它使UTF-8成为默认编码,从而消除了对魔术注释的需要。 关于Ruby:如何自动添加"#encoding:UTF-8"?,我们在StackOverflow上找到一个类似的问题: https://st

ruby - 从 Ruby 中的字符串中删除非 UTF 字符?

如何从ruby​​字符串中删除非UTF8字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的UTF8。这个:text.gsub!(/\xC2/,'')返回错误:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我也在查看text.unpack('U*')和string.pack,但没有得到任何结果。 最佳答案 您可以为此使用编码。text.encode('UTF-8',:invalid=>:replace,:undef=>

ruby - 如何在 Ruby 中将字符串转换为 UTF8

我正在编写一个使用Hpricot的爬虫。它从某个网页下载字符串列表,然后我尝试将其写入文件。编码有问题:"\xC3"fromASCII-8BITtoUTF-8我有在网页上呈现并以这种方式打印的项目:Développementstr.encoding返回UTF-8,因此force_encoding('UTF-8')没有帮助。我如何将其转换为可读的UTF-8? 最佳答案 您的字符串似乎被错误地编码了:"Développement".encode("iso-8859-1").force_encoding("utf-8")#=>"Dév