我最近一直在使用Rubychr和ord方法,有几件事我不明白。我当前的项目涉及将单个字符与序数值相互转换。据我了解,如果我有一个带有“A”之类的单个字符的字符串,并且我在其上调用ord我会得到它在ASCII表中的位置,即65。调用逆函数,65.chr给我字符值“A”,所以这告诉我Ruby在某个地方有一个有序字符值的集合,它可以使用这个集合来给我一个特定字符的位置,或者字符在一个特定的位置。我在这方面可能是错误的,如果我错了请纠正我。现在我也了解到Ruby的默认字符编码使用UTF-8,因此它可以处理数千种可能的字符。因此,如果我向它询问这样的事情:'好'.ord我得到了该字符的位置,即2
我正在尝试上传一个csv文件,但收到UTF-8中的无效字节序列错误。我正在使用“roo”gem。我的代码是这样的:defupload_results_csvfilespreadsheet=MyFileUtil.open_file(file)header=spreadsheet.row(1)#THISLINERAISESTHEERROR(2..spreadsheet.last_row).eachdo|i|row=Hash[[header,spreadsheet.row(i)].transpose]......endclassMyFileUtildefself.open_file(file
我正在尝试将字符串从ISO-8859-1编码转换为UTF-8,但似乎无法正常工作。这是我在irb中所做的示例。irb(main):050:0>string='Norrlandsvägen'=>"Norrlandsvägen"irb(main):051:0>string.force_encoding('iso-8859-1')=>"Norrlandsv\xC3\xA4gen"irb(main):052:0>string=string.encode('utf-8')=>"Norrlandsvägen"我不确定为什么iso-8859-1中的Norrlandsvägen会被转换为utf-8中
如何通过ruby|ror查看字符集是否为utf-8编码? 最佳答案 检查UTF-8有效性对于大多数多字节编码,可以通过编程方式检测无效字节序列。由于Ruby默认将所有字符串视为UTF-8,您可以检查字符串是否以有效的UTF-8格式给出:#encoding:UTF-8#-------------------------------------------str="Partlyvalid\xE4UTF-8encoding:äöüß"str.valid_encoding?#=>falsestr.scrub('').valid_encodi
为了将字符串转换为UTF-8并替换所有编码错误,您可以这样做:str.encode('utf-8',:invalid=>:replace)唯一的问题是如果str已经是UTF-8则它不起作用,在这种情况下仍然存在任何错误:irb>x="foo\x92bar".encode('utf-8',:invalid=>:replace)=>"foo\x92bar"irb>x.valid_encoding?=>false引用RubyDocs:Pleasenotethatconversionfromanencodingenctothesameencodingencisano-op,i.e.therec
上周,在一些gem安装或gem更新操作中,我收到了与这些类似的错误:ERROR:Whilegeneratingdocumentationforsinatra-1.3.1...MESSAGE:errorgeneratingC:/RailsInstaller/Ruby1.9.2/lib/ruby/gems/1.9.1/doc/sinatra-1.3.1/rdoc/README_de_rdoc.html:incompatibleencodingregexpmatch(UTF-8regexpwithIBM437string)(Encoding::CompatibilityError)类似的:E
我刚刚从ruby1.9.2更新到ruby1.9.3p0(2011-10-30修订版33570)。我的Rails应用程序使用postgresql作为其数据库后端。系统区域设置为UTF8,数据库编码也是如此。Rails应用程序的默认编码也是UTF8。我有中国用户输入汉字和英文字符。字符串存储为UTF8编码字符串。rails版本:3.0.9自更新以来,数据库中的一些现有中文字符串不再正确显示。这不会影响所有字符串,只会影响那些属于序列化哈希的字符串。存储为普通字符串的所有其他字符串看起来仍然是正确的。示例:这是一个序列化的散列,在数据库中存储为UTF8字符串:broken="---!
我有一个Sinatra应用程序(http://analyzethis.espace-technologies.com)执行以下操作检索HTML页面(通过net/http)从response.body创建一个Nokogiri文档提取一些信息并在响应中发回。响应应采用UTF-8编码所以我在尝试阅读使用windows-1256编码的网站(如www.filfan.com或www.masrawy.com)时遇到了问题。问题是编码转换的结果不正确,虽然没有抛出错误。net/httpresponse.body.encoding给出了ASCII-8BIT,无法转换为UTF-8如果我执行Nokogiri
我正在生成CSV文件,这些文件生成后需要在Excel中打开和查看。Excel似乎需要与UTF-8不同的编码。这是我的配置和生成代码:csv_config={col_sep:";",row_sep:"\n",encoding:Encoding::UTF_8}csv_string=CSV.generate(csv_config)do|csv|csv在Excel中打开时,特殊字符显示不正确:TextaTextbTextæTextøTextÃ¥知道如何确保正确编码吗? 最佳答案 如果Excel具有BOM,则它可以理解UTF-8CSV。可
我有一个通过FTP从大型机获取平面文件的进程。这通常工作正常,但有时文件会包含一些重音字符。如果我尝试获取包含口音的文件,整个过程会失败并出现以下错误:Encoding::UndefinedConversionError:"\x88"fromASCII-8BITtoUTF-8那是使用Net::FTP的gettextfile方法。许多人建议简单地切换到getbinaryfile-这样做将允许我下载文件,但生成的文件是我无法再解析的东西(说它是UTF-8,但内容使没有意义)。有没有什么方法可以简单地获取文件并将其保存为ASCII,而无需让Rails自动将输出转换为UTF-8?这是我的代码: