Encoding

ruby - 使用 Ruby 自动打开二进制文件

我正在使用Ruby1.9打开多个文件并将它们复制到存档中。现在有一些二进制文件，但有些不是。由于Ruby1.9不会自动打开二进制文件作为二进制文件，有没有办法自动打开它们呢？(所以“.class”是二进制的，“.txt”不是) 最佳答案实际上，AlexD之前的回答是不完整的。虽然Unix文件系统中确实没有“文本”模式，但Ruby确实在以二进制和非二进制模式打开文件之间有所区别:s=File.open('/tmp/test.jpg','r'){|io|io.read}s.encoding=>#不同于(注意“rb”)s=File.op

ruby - 如何在 Ruby 中检测字符串中的某些 Unicode 字符？

给定一个Ruby1.8.7中的字符串(没有使用\p{}支持Unicode属性的很棒的Oniguruma正则表达式引擎)，我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符；即classStringdefcontains_cjk?...endend>>'日本語'.contains_cjk?=>true>>'광고프로그램'.contains_cjk?=>true>>'艾弗森将退出篮坛'.contains_cjk?=>true>>'Watashihabakanagaijindesu.'.contains_cjk?=>false我怀疑这会归结为查看字符串中的任何字符是否在Unihan

何在 Unicode contains_cjk section contains ruby encoding character-encoding cjk

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列？

我有一个Rails应用程序从Rails版本1开始迁移，我想忽略它上面的所有无效字节序列，以保持向后兼容性。我不知道输入编码。例子:>"-Men\xFC-".split("n")ArgumentError:invalidbytesequenceinUTF-8from(irb):4:in`split'from(irb):4from/home/fotanus/.rvm/rubies/ruby-2.0.0-rc2/bin/irb:16:in`'我可以在一行中解决这个问题，例如:>"-Men\xFC-".unpack("C*").pack("U*").split("n")=>["-Me","ü-

UTF-8 ruby-on-rails 34 section ruby encoding

ruby-on-rails - Encoding::UndefinedConversionError 写入二进制文件时

我有一个网站需要加密和存储上传到服务器的二进制文件。上传和存储工作正常，但在尝试写入加密文件时出现此错误:Encoding::UndefinedConversionError("\xDD"fromASCII-8BITtoUTF-8):导致它的代码如下所示:fd_in=IO.sysopen(self[:name].tempfile.path,"rb")file_in=IO.open(fd_in)fd_out=IO.sysopen(self[:name].tempfile.path+".encrypted","wb")file_out=IO.open(fd_out)cipher=OpenS

UndefinedConversionError ruby-on-rails cipher section 34 ruby

ruby-on-rails - JSON 编码错误转义(Rails 3、Ruby 1.9.2)

在我的Controller中，以下工作(打印“oké”)putsobj.inspect但这不会(呈现“ok\u00e9”)render:json=>obj显然to_json方法转义了unicode字符。有没有办法阻止这种情况？最佳答案将\uXXXX代码设置回utf-8:json_string.gsub!(/\\u([0-9a-z]{4})/){|s|[$1.to_i(16)].pack("U")} 关于ruby-on-rails-JSON编码错误转义(Rails3、Ruby1.9.2

ruby-on-rails Rails section code pre ruby json encoding

ruby-on-rails - ruby 正则表达式错误 : incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)

我遇到了两个错误，都与编码有关并且都相关。我在启动WEBrick时遇到的第一个错误(技术上是警告):/Users/USERNAME/example/config/initializers/bb-ruby.rb:54:warning:invalidUnicodeProperty\P:/\:\-?\P/它所指的行是:/\:\-?\P/,这只是一些正则表达式，最终是这个block的一部分:@@tags['Razzing']=[/\:\-?\P/,'','Razzing',':P',:razzing]然后，我在解析一些字符串时也得到了以下错误(大概是由于同一行)...Encoding::Com

UTF-8 regexp code section ruby-on-rails ruby unicode encoding character-encoding

ruby-on-rails - 您可以在没有源代码的情况下分发 Ruby on Rails 应用程序吗？

我想知道是否可以在没有源代码的情况下分发用于生产的RoR应用程序？我看过thispostonSO，但我的情况有点不同。这将是一个由有一些线索的人管理的应用程序，所以我很高兴仍然需要在客户端安装Apache/Mongrel/MySQL。我真正想要的只是保护源代码。编码似乎是分发PHP应用程序的一种流行方式(例如:Helpspot)。我发现了这些潜在的解决方案:Zenobfuscate-然而，并非所有类型的Ruby代码都受支持，因此算在内RubyEncoder-可能是最好的选择，因为他们的PHP编码器看起来不错(不过我还没有尝试过)但它还不可用。我之前使用过用于PHP的IONcube，它运

分发 ruby-on-rails noreferrer noopener nofollow ruby encoding obfuscation

ruby - ruby 中的#encode 和#force_encoding 有什么区别？

我真的不明白Ruby中String类的#encode和#force_encoding之间的区别。我知道"kam".force_encoding("UTF-8")会强制"kam"以UTF-8编码，但是#encode(编码)不同？http://ruby-doc.org/core-2.0/String.html#method-i-encoding 最佳答案差别还是挺大的。force_encoding设置给定的字符串编码，但不更改字符串本身，即不更改它在内存中的表示形式:'łał'.bytes#=>[197,130,97,197,130]

ruby force_encoding code encoding

ruby 1.9，force_encoding，但检查

我有一个从某种输入中读取的字符串。据我所知，它是UTF8。好的:string.force_encoding("utf8")但是如果这个字符串中的字节实际上不是合法的UTF8，我想现在就知道并采取行动。一般遇到这样的字节，force_encoding("utf8")会引发吗？我相信不会。如果我在做#encode我可以从方便的选项中选择如何处理源编码(或目标编码)中无效的字符。但我不是在执行#encode，而是在执行#force_encoding。它没有这样的选项。这是否有意义string.force_encoding("utf8").encode("utf8")立即获得异常？通常编码fr

force_encoding encoding 34 code ruby character-encoding

ruby - ruby 1.9 中有没有办法从字符串中删除无效的字节序列？

假设你有一个像"€foo\xA0"这样的字符串，编码为UTF-8，有没有办法从这个字符串中删除无效的字节序列？(所以你得到"€foo")在ruby-1.8中，您可以使用Iconv.iconv('UTF-8//IGNORE','UTF-8',"€foo\xA0")但现在已弃用。"€foo\xA0".encode('UTF-8')不执行任何操作，因为它已经是UTF-8。我试过:"€foo\xA0".force_encoding('BINARY').encode('UTF-8',:undef=>:replace,:replace=>'')产生“foo”但这也丢失了有效的多字节字符€

ruby 1.9 code section foo encoding character-encoding ruby-1.9 utf

3 4 567 8 9