jjzjj

encoding

全部标签

ruby 1.9 : Regular Expressions with unknown input encoding

在输入编码未知的Ruby1.9中,是否有一种公认的方法来处理正则表达式?假设我的输入恰好是UTF-16编码的:x="foobarbaz"y=x.encode('UTF-16LE')re=/(.*)/x.match(re)=>#bar"1:"bar">y.match(re)Encoding::CompatibilityError:incompatibleencodingregexpmatch(US-ASCIIregexpwithUTF-16LEstring)我目前的方法是在内部使用UTF-8并在必要时重新编码(副本)输入:ify.methods.include?(:encode)#Rub

ruby - Ruby 中的 URI.escape 和 URI.encode 有什么区别?

我试图找出URI.escape和URI.encode之间的区别ruby。两者都没有按照我的意愿进行,即对URL进行完全编码。例如,我希望http://my.web.com为http%3A%2F%2Fmy%2Eweb%2Ecom 最佳答案 没有区别。在Ruby1.9.3中encodeissimplyanaliasforescape.[编辑]请注意,这些方法允许对字符的“不安全”描述符进行编码:URI.encode('http://my.web.com',/\W/)#=>"http%3A%2F%2Fmy%2Eweb%2Ecom"谢谢@m

使用 Base64.encode 时的 Ruby 字符编码

查看Ruby的Base64.encode的源代码,我无法确定字符串转换为哪种字符编码,如果有的话,在Base64中对该数据进行编码之前。以Base64编码的Utf-8字符串与以Base64编码的Utf-16字符串有很大不同。Ruby是否对此操作做出任何promise? 最佳答案 在base64中编码和解码utf-8字符串的示例:text="intérnalionálização"=>"intérnalionálização"text.encoding=>#encoded=Base64.encode64(text)=>"aW50w6l

ruby-on-rails - 没有数据库的注册或邀请电子邮件验证

我想让我的数据库中几乎没有陈旧的帐户,我正在考虑进行新的注册和邀请,将他们的数据作为加密或散列url放入欢迎电子邮件中。一旦访问url中的链接,信息就会作为帐户添加到数据库中。目前有什么东西可以做到这一点吗?关于以这种方式进行用户注册的任何引用、想法或警告?谢谢!编辑:我做了一个工作示例,url是127个字符。http://localhost/confirm?_=hBRCGVqie5PetQhjiagq9F6kmi7luVxpcpEYMWaxrtSHIPA3rF0Hufy6EgiH%0A%2BL3t9dcgV9es9Zywkl4F1lcMyA%3D%3D%0A显然,更多数据=更大的ur

ruby - 在 Heroku 中将 UTF-8 设置为默认字符串编码

我需要在Heroku中将默认的ruby​​字符串编码更改为UTF-8。由于某种原因,它是US-ASCII。$herokuconsoleRubyconsoleformyapp.heroku.com>>"a".encoding=>#但是,如果我在本地运行irb,我会得到不同的结果:$irbruby-1.9.2-p136:001>"a".encoding=>#两者都在ruby​​1.9.2上运行。我也试过设置这个,但没用:Encoding.default_internal=Encoding.default_external="UTF-8"想法?谢谢,菲利普 最佳答

ruby - 多字节字符是否会干扰正则表达式中的结束行字符?

使用这个正则表达式:regex1=/\z/以下字符串匹配:"hello"=~regex1#=>5"こんにちは"=~regex1#=>5但是使用这些正则表达式:regex2=/#$/?\z/regex3=/\n?\z/他们表现出不同:"hello"=~regex2#=>5"hello"=~regex3#=>5"こんにちは"=~regex2#=>nil"こんにちは"=~regex3#=>nil什么是干扰?字符串编码为UTF-8,操作系统为Linux(即$/为"\n")。多字节字符是否会干扰$/?怎么办? 最佳答案 你报告的问题肯定是Re

ruby - 使用 Ruby 自动打开二进制文件

我正在使用Ruby1.9打开多个文件并将它们复制到存档中。现在有一些二进制文件,但有些不是。由于Ruby1.9不会自动打开二进制文件作为二进制文件,有没有办法自动打开它们呢?(所以“.class”是二进制的,“.txt”不是) 最佳答案 实际上,AlexD之前的回答是不完整的。虽然Unix文件系统中确实没有“文本”模式,但Ruby确实在以二进制和非二进制模式打开文件之间有所区别:s=File.open('/tmp/test.jpg','r'){|io|io.read}s.encoding=>#不同于(注意“rb”)s=File.op

ruby - 如何在 Ruby 中检测字符串中的某些 Unicode 字符?

给定一个Ruby1.8.7中的字符串(没有使用\p{}支持Unicode属性的很棒的Oniguruma正则表达式引擎),我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符;即classStringdefcontains_cjk?...endend>>'日本語'.contains_cjk?=>true>>'광고프로그램'.contains_cjk?=>true>>'艾弗森将退出篮坛'.contains_cjk?=>true>>'Watashihabakanagaijindesu.'.contains_cjk?=>false我怀疑这会归结为查看字符串中的任何字符是否在Unihan

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列?

我有一个Rails应用程序从Rails版本1开始迁移,我想忽略它上面的所有无效字节序列,以保持向后兼容性。我不知道输入编码。例子:>"-Men\xFC-".split("n")ArgumentError:invalidbytesequenceinUTF-8from(irb):4:in`split'from(irb):4from/home/fotanus/.rvm/rubies/ruby-2.0.0-rc2/bin/irb:16:in`'我可以在一行中解决这个问题,例如:>"-Men\xFC-".unpack("C*").pack("U*").split("n")=>["-Me","ü-

ruby-on-rails - Encoding::UndefinedConversionError 写入二进制文件时

我有一个网站需要加密和存储上传到服务器的二进制文件。上传和存储工作正常,但在尝试写入加密文件时出现此错误:Encoding::UndefinedConversionError("\xDD"fromASCII-8BITtoUTF-8):导致它的代码如下所示:fd_in=IO.sysopen(self[:name].tempfile.path,"rb")file_in=IO.open(fd_in)fd_out=IO.sysopen(self[:name].tempfile.path+".encrypted","wb")file_out=IO.open(fd_out)cipher=OpenS