php - 从 PHP 以 UTF-8 编码

coder 2024-07-03 原文

我不太擅长编码，但我什至对这里的基础知识都感到失望。

我正在尝试创建一个被识别为 UTF-8 的文件

header("Content-Type: text/plain; charset=utf-8");
header("Content-disposition: attachment; filename=test.txt");
echo "test";
exit();

也试过

header("Content-Type: text/plain; charset=utf-8");
header("Content-disposition: attachment; filename=test.txt");
echo utf8_encode("test");
exit();

然后我用 Notepad++ 打开文件，它说它的当前编码是 ANSI 而不是 UTF-8，我错过了什么我应该如何输出这个文件。

我最终会为 Affiliate Window 程序输出产品的 XML 文件。另外，如果它有帮助，我的网络服务器是 Centos、Apache2、PHP 5.2.8。

在此先感谢您的帮助!

最佳答案

正如 Filip 所说，编码不是文件的固有属性；这是隐含的。这意味着除非您知道要解释的文件的编码是什么，否则无法确定它。你能做的最好的事情就是猜测。这大概是 Notepad++ 等程序所做的。由于您发送的实际数据可以用许多不同的编码进行解释，因此它只会选择最喜欢的候选者。对于 Notepad++，这似乎是 ANSI(这本身就是一个相当不准确的分类)，而其他程序可能默认为其他东西。

之所以必须在 HTTP header 中指定字符集，正是因为文件本身不包含此信息，因此需要通知浏览器。将文件保存到磁盘后，此信息将不可用。

如果您要提供的文件是 XML 文档，您可以选择将编码信息放入实际文档中。这样它在文件保存到磁盘后被保留。例如。如果您使用的是 utf-8，则应将其放在文档的顶部:

<?xml version="1.0" encoding="utf-8" ?>

请注意，除了获取有关字符集的元信息外，您还需要确保您提供的数据实际上是 utf-8 编码的。这几乎是相同的场景:您需要隐式地知道您的数据采用什么编码。函数 utf8_encode 是(尽管名称)明确用于将 iso-8859-1 转换为 utf-8。因此，如果您在已经使用 utf-8 编码的数据上使用它，您将得到双重编码，结果是乱码数据。

字符集本身并没有那么复杂。问题是，如果你不小心把事情弄清楚，你就会把事情搞砸。无论何时你有一个字符串，你都应该绝对确定你知道它采用的是哪种编码。否则它就不是一个字符串——它只是一团二进制数据。

关于php - 从 PHP 以 UTF-8 编码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1327202/

有关php - 从 PHP 以 UTF-8 编码的更多相关文章

ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 用逗号、双引号和编码解析 csv - 2
我正在使用ruby1.9解析以下带有MacRoman字符的csv文件#encoding:ISO-8859-1#csv_parse.csvName,main-dialogue"Marceu","Giveittohimóhe,hiswife."我做了以下解析。require'csv'input_string=File.read("../csv_parse.rb").force_encoding("ISO-8859-1").encode("UTF-8")#=>"Name,main-dialogue\r\n\"Marceu\",\"Giveittohim\x97he,hiswife.\"\
C# 到 Ruby sha1 base64 编码 - 2
我正在尝试在Ruby中复制Convert.ToBase64String()行为。这是我的C#代码:varsha1=newSHA1CryptoServiceProvider();varpasswordBytes=Encoding.UTF8.GetBytes("password");varpasswordHash=sha1.ComputeHash(passwordBytes);returnConvert.ToBase64String(passwordHash);//returns"W6ph5Mm5Pz8GgiULbPgzG37mj9g="当我在Ruby中尝试同样的事情时，我得到了相同sha
ruby-on-rails - 有没有一种工具可以在编码时自动保存对文件的增量更改？ - 2
我最喜欢的Google文档功能之一是它会在我工作时不断自动保存我的文档版本。这意味着即使我在进行关键更改之前忘记在某个点进行保存，也很有可能会自动创建一个保存点。至少，我可以将文档恢复到错误更改之前的状态，并从该点继续工作。对于在MacOS(或UNIX)上运行的Ruby编码器，是否有具有等效功能的工具？例如，一个工具会每隔几分钟自动将Gitcheckin我的本地存储库以获取我正在处理的文件。也许我有点偏执，但这点小保险可以让我在日常工作中安心。最佳答案虚拟机有些人可能讨厌我对此的回应，但我在编码时经常使用VIM，它具有自动保存功
c - Ruby - 源代码 - 编码风格 - 2
查看Ruby代码，它具有以下proc_arity:staticVALUEproc_arity(VALUEself){intarity=rb_proc_arity(self);returnINT2FIX(arity);}更多的是C编码风格问题，但为什么staticVALUE在单独的一行而不是像这样的:staticVALUEproc_arity(VALUEself) 最佳答案它来自UNIX世界，因为它有助于轻松grep函数的定义:$grep-n'^proc_arity'*.c或使用vim:/^proc_arity
ruby - 如何以编程方式删除实例上的 "singleton information"以使其编码(marshal)？ - 2
我创建了一个由于“在运行时执行的单例元类定义”而无法编码的对象(这段代码的描述是否正确？)。这是通过以下代码执行的:#defineclassXthatmyusesingletonclassmetaprogrammingfeatures#throughcallofmethod:break_marshalling!classXdefbreak_marshalling!meta_class=class我该怎么做才能使对象编码正确？是否可以从对象instance_of_x的classX中“移除”单例组件？我真的需要一个建议，因为我们的一些对象需要通过Marshal.dump序列化机制进行缓存。
ruby - 更改字符编码 - 2
我在使用Ruby1.9.2p290更改文本文件的编码时遇到问题。我收到错误消息invalidbytesequenceinUTF-8(ArgumentError)。问题(我认为)在于字符集似乎是未知的。如果我执行以下操作，则从命令行:$filetest.txt我得到:Non-ISOextended-ASCIIEnglishtext,withCRLFlineterminators或者，或者，如果我这样做:$file-itest.txt我得到:test.txt:text/plain;charset=unknown但是，如果我这样做，在Ruby中:data=File.open("test.tx
ruby-on-rails - 在 rails 中显示 base64 编码的图像 - 2
我正在向我的Controller发送一个base64图像并按原样保存它。现在我需要显示该图像。这是我要显示的内容，但未显示图像:"/>为了编码，我使用了这个java脚本函数encodeURIComponent();我的编码图像格式:data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/........ 最佳答案你不需要解码base64应该可以关于ruby-on-rails-在rails中显示base64编码的图像，我们在StackOve
ruby - 如何设置 Mechanize 页面编码？ - 2
我试图通过点击一个链接获得一个带有ISO-8859-1编码的页面，所以代码类似于这样:page_result=page.link_with(:text=>'link_text').click到目前为止，我得到的结果编码错误，所以我看到的字符如下:'T�tulo:'insteadof'Título:'我尝试了几种方法，包括:使用代理在第一个请求中声明编码:@page_search=@agent.get(:url=>'http://www.server.com',:headers=>{'Accept-Charset'=>'ISO-8859-1'})说明页面本身的编码page_result.
ruby-on-rails - Rails 导入 CSV 错误 : invalid byte sequence in UTF-8 - 2
尝试在我的Rails应用程序中导入CSV文件时，出现错误UTF-8中的无效字节序列。一切正常，直到我添加了一个gsub方法来将其中一个CSV列与我的数据库中的一个字段进行比较。当我导入CSV文件时，我想检查每一行的地址是否包含在特定客户端的不同地址数组中。我有一个带有alt_addresses属性的客户端模型，其中包含客户端地址的几种不同可能格式。然后我有一个引用模型(如果您熟悉本地SEO，您就会知道这个术语)。引用模型没有地址字段，但它有一个nap_correct?字段(NAP代表“姓名”、“地址”、“电话号码”)。如果CSV行的名称、地址和电话号码与我在该客户的数据库中拥有的相同，

php - 从 PHP 以 UTF-8 编码

有关php - 从 PHP 以 UTF-8 编码的更多相关文章

随机推荐