我在使用xml时遇到了一些问题。我知道这是个很难回答的问题,但我找到的答案并不能解决我的问题。问题是,当我使用php domdocument在xml文件中添加e或_或其他特殊字符时,它会将e保存为xe9,将_保存为xe4。我不知道这是否可以,但当我想显示输出时,它会在这里显示问号。
我试了很多。就像在php domdocument中删除和添加de-xml头中的编码一样。我还尝试使用file_get_contents和php utf-8u decode来获取xml。我试过使用iso intead,但没有解决我的问题。相反,我有时会遇到php-xml解析错误。我一定做错了什么,但是什么?这是我的问题,我怎样才能解决这个问题。
我的XML文件如下所示:
XE9和XE4有黑色背景。
<?xml version="1.0" encoding="UTF-8"?>
<root>
<row id="1">
<question>blah</question>
<answer>blah</answer>
</row>
<row id="2">
<question>xE9</question>
<answer>xE4</answer>
</row>
</root>
function __construct($filePath) {
$this->file = $filePath;
$this->label = array('Vraag', 'Antwoord');
$xmlStr = file_get_contents($filePath);
$xmlStr = utf8_decode($xmlStr);
$this->xmlDoc = new DOMDocument('1.0', 'UTF-8');
$this->xmlDoc->preserveWhiteSpace = false;
$this->xmlDoc->formatOutput = true;
//$this->xmlDoc->load($filePath);
$this->xmlDoc->loadXML($xmlStr);
}
//creates new xml row and saves it in xml file
function addNewRow($question, $answer) {
$nextAttr = $this->getNextRowId();
$parentNode = $this->xmlDoc->documentElement;
$rowNode = $this->xmlDoc->createElement('row');
$rowNode = $parentNode->appendChild($rowNode);
$rowNode->setAttribute('id', $nextAttr);
$q = $this->xmlDoc->createElement('question');
$q = $rowNode->appendChild($q);
$qText = $this->xmlDoc->createTextNode($question);
$qText = $q->appendChild($qText);
$a = $this->xmlDoc->createElement('answer');
$a = $rowNode->appendChild($a);
$aText = $this->xmlDoc->createTextNode($answer);
$aText = $a->appendChild($aText);
$this->xmlDoc->save($this->file);
}
最佳答案
好吧,下面的内容有点粗糙/冗长,特别是你已经做了很多尝试。只要试着保持新鲜的眼睛,想想一旦你在编码上犯了一个小错误,它往往已经被搞砸了。因此,正确理解哪些力学在这里起作用是很重要的。
我试图解决在php的domdocument中运行的一些机制。您可能会发现这很有趣或令人畏惧,甚至在最后,解决方案也非常简单,甚至不需要更改php代码,但我还是想解决这个问题,因为stackoverflow和php手册上没有太多的文档,有更多的参考资料是很好的,因为正确理解这一点很重要——正如我已经写过的那样。
因此,默认情况下,xml是utf-8格式的。utf-8几乎是当今互联网的完美选择。当然,这在任何情况下都不是完全正确的,但总的来说,这是一个安全的赌注。所以XML本身和它的默认编码UTF-8是非常好的。
这对domdocument意味着什么?只是在默认情况下,domdocument将采用这种编码,我们不需要关心它。下面是一个简单的演示,输出如下注释:
$doc = new DOMDocument();
$doc->save('php://output');
# <?xml version="1.0"?>
<?xml version="1.0"?>。$doc = new DOMDocument('1.0', 'UTF-8');
##### Encoding Parameter
$doc->save('php://output');
# <?xml version="1.0" encoding="UTF-8"?>
$doc = new DOMDocument('♥♥ love, hugs and kisses ♥♥', 'UTF-8');
$doc->save('php://output');
# <?xml version="♥♥ love, hugs and kisses ♥♥" encoding="UTF-8"?>
$doc = new DOMDocument('♥♥ love, hugs and kisses ♥♥', 'ISO-8859-1');
$doc->save('php://output');
# <?xml version="♥♥ love, hugs and kisses ♥♥" encoding="ISO-8859-1"?>
♥)。如果我们直接在其中添加一个iso-8859-1字符,比如ö(php中的二进制字符串"\xF6")会发生什么?$doc = new DOMDocument("♥♥ l\xF6ve, hugs and kisses ♥♥", 'ISO-8859-1');
$doc->save('php://output');
# Warning: DOMDocument::save(): output conversion failed due to conv error,
# bytes 0xF6 0x76 0x65 0x2C
# ^^^^ | | |
# "ö" v e space
$doc = new DOMDocument('♥♥ löve, hugs and kisses ♥♥', 'ISO-8859-1');
$doc->save('php://output');
# <?xml version="♥♥ l�ve, hugs and kisses ♥♥" encoding="ISO-8859-1"?>
$doc = new DOMDocument('1.0', 'UTF-8');
$doc->appendChild($doc->createElement('root'))
->appendChild($doc->createElement('question'))
->appendChild($doc->createTextNode("l\xF6ve, hugs and kisses"));
$doc->save('php://output');
# <?xml version="1.0" encoding="UTF-8"?>
# <root><question>l�ve, hugs and kisses</question></root>
->appendChild($doc->createTextNode(utf8_encode("l\xF6ve, hugs and kisses")));
########### (works with ISO-8859-1 only (!))
# <?xml version="1.0" encoding="UTF-8"?>
# <root><question>löve, hugs and kisses</question></root>
关于php - 来自xml的php utf-8解码返回问号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16308192/
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
所以我开始关注ruby,很多东西看起来不错,但我对隐式return语句很反感。我理解默认情况下让所有内容返回self或nil但不是语句的最后一个值。对我来说,它看起来非常脆弱(尤其是)如果你正在使用一个不打算返回某些东西的方法(尤其是一个改变状态/破坏性方法的函数!),其他人可能最终依赖于一个返回对方法的目的并不重要,并且有很大的改变机会。隐式返回有什么意义?有没有办法让事情变得更简单?总是有返回以防止隐含返回被认为是好的做法吗?我是不是太担心这个了?附言当人们想要从方法中返回特定的东西时,他们是否经常使用隐式返回,这不是让你组中的其他人更容易破坏彼此的代码吗?当然,记录一切并给出
为什么以下不同?Time.now.end_of_day==Time.now.end_of_day-0.days#falseTime.now.end_of_day.to_s==Time.now.end_of_day-0.days.to_s#true 最佳答案 因为纳秒数不同:ruby-1.9.2-p180:014>(Time.now.end_of_day-0.days).nsec=>999999000ruby-1.9.2-p180:015>Time.now.end_of_day.nsec=>999999998
在Ruby1.9.3(可能还有更早的版本,不确定)中,我试图弄清楚为什么Ruby的String#split方法会给我某些结果。我得到的结果似乎与我的预期相反。这是一个例子:"abcabc".split("b")#=>["a","ca","c"]"abcabc".split("a")#=>["","bc","bc"]"abcabc".split("c")#=>["ab","ab"]在这里,第一个示例返回的正是我所期望的。但在第二个示例中,我很困惑为什么#split返回零长度字符串作为返回数组的第一个值。这是什么原因呢?这是我所期望的:"abcabc".split("a")#=>["bc"
我一直在研究RubyKoans,我发现about_open_classes.rbkoan很有趣。特别是他们修改Integer#even?方法的最后一个测试。我想尝试一下这个概念,所以我打开了Irb并尝试运行Integer.respond_to?(:even?),但令我惊讶的是我得到了错误。然后我尝试了Fixnum.respond_to?(:even?)并得到了错误。我还尝试了Integer.respond_to?(:respond_to?)并得到了true,当我执行2.even?时,我也得到了true。我不知道发生了什么。谁能告诉我缺少什么? 最佳答案
无论时间在哪个时区表示,时区差异是否总是被忽略?直觉上,对于那些使用UTC+2的人来说,从EPOCH开始经过的秒数应该更高。然而,事实并非如此。 最佳答案 Epoch基于utc时区https://en.wikipedia.org/wiki/Unix_time它与您当前所在的时区无关。 关于ruby-Time.to_i是否总是以UTC返回自EPOCH以来的秒数?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.
我在思考流量控制的最佳实践。我应该走哪条路?1)不要检查任何东西并让程序失败(更清晰的代码,自然的错误消息):defself.fetch(feed_id)feed=Feed.find(feed_id)feed.fetchend2)通过返回nil静默失败(但是,“CleanCode”说,你永远不应该返回null):defself.fetch(feed_id)returnunlessfeed_idfeed=Feed.find(feed_id)returnunlessfeedfeed.fetchend3)抛出异常(因为不按id查找feed是异常的):defself.fetch(feed_id
在几个项目中,我希望有一个类似rakeserver的rake任务,它将通过任何需要的方式开始为该应用程序提供服务。这是一个示例:task:serverdo%x{bundleexecrackup-p1234}end这行得通,但是当我准备停止它时,按Ctrl+c并没有正常关闭;它中断了Rake任务本身,它说rakeaborted!并给出堆栈跟踪。在某些情况下,我必须执行Ctrl+c两次。我可能可以用Signal.trap写一些东西来更优雅地中断它。有没有更简单的方法? 最佳答案 trap('SIGINT'){puts"Yourmessa