encoding_JJZJJ

ruby 1.9 : Regular Expressions with unknown input encoding

在输入编码未知的Ruby1.9中，是否有一种公认的方法来处理正则表达式？假设我的输入恰好是UTF-16编码的:x="foobarbaz"y=x.encode('UTF-16LE')re=/(.*)/x.match(re)=>#bar"1:"bar">y.match(re)Encoding::CompatibilityError:incompatibleencodingregexpmatch(US-ASCIIregexpwithUTF-16LEstring)我目前的方法是在内部使用UTF-8并在必要时重新编码(副本)输入:ify.methods.include?(:encode)#Rub

Expressions encoding section gt ruby regex character-encoding

ruby - Ruby 中的 URI.escape 和 URI.encode 有什么区别？

我试图找出URI.escape和URI.encode之间的区别ruby。两者都没有按照我的意愿进行，即对URL进行完全编码。例如，我希望http://my.web.com为http%3A%2F%2Fmy%2Eweb%2Ecom 最佳答案没有区别。在Ruby1.9.3中encodeissimplyanaliasforescape.[编辑]请注意，这些方法允许对字符的“不安全”描述符进行编码:URI.encode('http://my.web.com',/\W/)#=>"http%3A%2F%2Fmy%2Eweb%2Ecom"谢谢@m

URI escape code section strong ruby

使用 Base64.encode 时的 Ruby 字符编码

查看Ruby的Base64.encode的源代码，我无法确定字符串转换为哪种字符编码，如果有的话，在Base64中对该数据进行编码之前。以Base64编码的Utf-8字符串与以Base64编码的Utf-16字符串有很大不同。Ruby是否对此操作做出任何promise？最佳答案在base64中编码和解码utf-8字符串的示例:text="intérnalionálização"=>"intérnalionálização"text.encoding=>#encoded=Base64.encode64(text)=>"aW50w6l

encode Base section encoding decoded ruby character-encoding base64

ruby-on-rails - 没有数据库的注册或邀请电子邮件验证

我想让我的数据库中几乎没有陈旧的帐户，我正在考虑进行新的注册和邀请，将他们的数据作为加密或散列url放入欢迎电子邮件中。一旦访问url中的链接，信息就会作为帐户添加到数据库中。目前有什么东西可以做到这一点吗？关于以这种方式进行用户注册的任何引用、想法或警告？谢谢!编辑:我做了一个工作示例，url是127个字符。http://localhost/confirm?_=hBRCGVqie5PetQhjiagq9F6kmi7luVxpcpEYMWaxrtSHIPA3rF0Hufy6EgiH%0A%2BL3t9dcgV9es9Zywkl4F1lcMyA%3D%3D%0A显然，更多数据=更大的ur

ruby-on-rails rails strong section encrypt ruby database encryption encoding

ruby - 在 Heroku 中将 UTF-8 设置为默认字符串编码

我需要在Heroku中将默认的ruby字符串编码更改为UTF-8。由于某种原因，它是US-ASCII。$herokuconsoleRubyconsoleformyapp.heroku.com>>"a".encoding=>#但是，如果我在本地运行irb，我会得到不同的结果:$irbruby-1.9.2-p136:001>"a".encoding=>#两者都在ruby1.9.2上运行。我也试过设置这个，但没用:Encoding.default_internal=Encoding.default_external="UTF-8"想法？谢谢，菲利普最佳答

UTF-8 Heroku section pre Encoding ruby

ruby - 多字节字符是否会干扰正则表达式中的结束行字符？

使用这个正则表达式:regex1=/\z/以下字符串匹配:"hello"=~regex1#=>5"こんにちは"=~regex1#=>5但是使用这些正则表达式:regex2=/#$/?\z/regex3=/\n?\z/他们表现出不同:"hello"=~regex2#=>5"hello"=~regex3#=>5"こんにちは"=~regex2#=>nil"こんにちは"=~regex3#=>nil什么是干扰？字符串编码为UTF-8，操作系统为Linux(即$/为"\n")。多字节字符是否会干扰$/？怎么办？最佳答案你报告的问题肯定是Re

多字 ruby code pre regex encoding multibyte ruby-2.0

ruby - 使用 Ruby 自动打开二进制文件

我正在使用Ruby1.9打开多个文件并将它们复制到存档中。现在有一些二进制文件，但有些不是。由于Ruby1.9不会自动打开二进制文件作为二进制文件，有没有办法自动打开它们呢？(所以“.class”是二进制的，“.txt”不是) 最佳答案实际上，AlexD之前的回答是不完整的。虽然Unix文件系统中确实没有“文本”模式，但Ruby确实在以二进制和非二进制模式打开文件之间有所区别:s=File.open('/tmp/test.jpg','r'){|io|io.read}s.encoding=>#不同于(注意“rb”)s=File.op

ruby section code file encoding binary

ruby - 如何在 Ruby 中检测字符串中的某些 Unicode 字符？

给定一个Ruby1.8.7中的字符串(没有使用\p{}支持Unicode属性的很棒的Oniguruma正则表达式引擎)，我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符；即classStringdefcontains_cjk?...endend>>'日本語'.contains_cjk?=>true>>'광고프로그램'.contains_cjk?=>true>>'艾弗森将退出篮坛'.contains_cjk?=>true>>'Watashihabakanagaijindesu.'.contains_cjk?=>false我怀疑这会归结为查看字符串中的任何字符是否在Unihan

何在 Unicode contains_cjk section contains ruby encoding character-encoding cjk

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列？

我有一个Rails应用程序从Rails版本1开始迁移，我想忽略它上面的所有无效字节序列，以保持向后兼容性。我不知道输入编码。例子:>"-Men\xFC-".split("n")ArgumentError:invalidbytesequenceinUTF-8from(irb):4:in`split'from(irb):4from/home/fotanus/.rvm/rubies/ruby-2.0.0-rc2/bin/irb:16:in`'我可以在一行中解决这个问题，例如:>"-Men\xFC-".unpack("C*").pack("U*").split("n")=>["-Me","ü-

UTF-8 ruby-on-rails 34 section ruby encoding

ruby-on-rails - Encoding::UndefinedConversionError 写入二进制文件时

我有一个网站需要加密和存储上传到服务器的二进制文件。上传和存储工作正常，但在尝试写入加密文件时出现此错误:Encoding::UndefinedConversionError("\xDD"fromASCII-8BITtoUTF-8):导致它的代码如下所示:fd_in=IO.sysopen(self[:name].tempfile.path,"rb")file_in=IO.open(fd_in)fd_out=IO.sysopen(self[:name].tempfile.path+".encrypted","wb")file_out=IO.open(fd_out)cipher=OpenS

UndefinedConversionError ruby-on-rails cipher section 34 ruby