jjzjj

c++ - 有没有办法修改样式表,以便将带有空标签的 XML 文档转换为 <tag/>?

coder 2024-02-22 原文

我从 codeproject 中提取了一些代码重新缩进 XML 文档。有谁知道我如何修改样式表以使 XML 文件的转换将导致空标签显示为 <tag />而不是 <tag></tag>

// http://www.codeproject.com/Articles/43309/How-to-create-a-simple-XML-file-using-MSXML-in-C
MSXML2::IXMLDOMDocumentPtr FormatDOMDocument(MSXML2::IXMLDOMDocumentPtr pDoc)
{
    LPCSTR const static szStyleSheet =
        R"!(<?xml version="1.0" encoding="utf-8"?>)!"
        R"!(<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">)!"
        R"!(    <xsl:output method="xml" indent="yes"/>)!"
        R"!(    <xsl:template match="@* | node()">)!"
        R"!(        <xsl:copy>)!"
        R"!(            <xsl:apply-templates select="@* | node()"/>)!"
        R"!(        </xsl:copy>)!"
        R"!(    </xsl:template>)!"
        R"!(</xsl:stylesheet>)!";

    MSXML2::IXMLDOMDocumentPtr pXmlStyleSheet;
    pXmlStyleSheet.CreateInstance(__uuidof(MSXML2::DOMDocument60));
    pXmlStyleSheet->loadXML(szStyleSheet);

    MSXML2::IXMLDOMDocumentPtr pXmlFormattedDoc;
    pXmlFormattedDoc.CreateInstance(__uuidof(MSXML2::DOMDocument60));

    CComPtr<IDispatch> pDispatch;
    HRESULT hr = pXmlFormattedDoc->QueryInterface(IID_IDispatch, (void**)&pDispatch);
    if (SUCCEEDED(hr))
    {
        _variant_t    vtOutObject;
        vtOutObject.vt = VT_DISPATCH;
        vtOutObject.pdispVal = pDispatch;
        vtOutObject.pdispVal->AddRef();

        hr = pDoc->transformNodeToObject(pXmlStyleSheet, vtOutObject);
    }

    //By default it is writing the encoding = UTF-16. Let us change the encoding to UTF-8

    // <?xml version="1.0" encoding="UTF-8"?>
    MSXML2::IXMLDOMNodePtr pXMLFirstChild = pXmlFormattedDoc->GetfirstChild();
    // A map of the a attributes (vesrsion, encoding) values (1.0, UTF-8) pair
    MSXML2::IXMLDOMNamedNodeMapPtr pXMLAttributeMap =  pXMLFirstChild->Getattributes();
    MSXML2::IXMLDOMNodePtr pXMLEncodNode = pXMLAttributeMap->getNamedItem(_T("encoding"));
    pXMLEncodNode->PutnodeValue(_T("UTF-8"));    //encoding = UTF-8

    return pXmlFormattedDoc;
}

最佳答案

此样式表导致尽可能写入空标记(使用 MSXML6):

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output method="xml" indent="yes"/>

    <xsl:template match="@* | node()">
        <xsl:copy>
            <xsl:apply-templates select="@* | node()"/>
        </xsl:copy>
    </xsl:template>

    <xsl:template match="*[not(*) and not(normalize-space()) and not(comment()) and not(processing-instruction())]">
        <xsl:element name="{name()}" namespace="{namespace-uri()}">
            <xsl:copy-of select="./@*"/>
        </xsl:element>
    </xsl:template>
</xsl:stylesheet>

这是通过避免 xsl:copy 来实现的对于没有子元素、文本、注释或处理指令的元素,并使用“手动”复制元素 xsl:element .请注意,属性也与嵌套的 xsl:copy-of 一起复制。 .

例如,这个 XML 文档:

<Document>
<empty> </empty>
<empty-2/>
<non-empty>
Some text
</non-empty>

<non-empty-2 some-attribute="attribute text">
<empty-3/>
<non-empty-3><empty-4/><empty-with-attribute another-attribute="some more text">    


</empty-with-attribute>
</non-empty-3>
</non-empty-2>

<abc:non-empty-with-namespace xmlns:abc="urn:test:abc">
<abc:empty-with-namespace abc:namespaced-attribute="namespaced attribute text"/>
</abc:non-empty-with-namespace>

<non-empty-comment>
<!-- A comment -->
</non-empty-comment>

<non-empty-proc-instr>
<?some-instruction?>
</non-empty-proc-instr>

</Document>

将使用您的 FormatDOMDocument 转换为以下内容函数,带有更新的样式表:

<?xml version="1.0" encoding="UTF-8"?>
<Document>
    <empty/>
    <empty-2/>
    <non-empty>
Some text
</non-empty>
    <non-empty-2 some-attribute="attribute text">
        <empty-3/>
        <non-empty-3>
            <empty-4/>
            <empty-with-attribute another-attribute="some more text"/>
        </non-empty-3>
    </non-empty-2>
    <abc:non-empty-with-namespace xmlns:abc="urn:test:abc">
        <abc:empty-with-namespace abc:namespaced-attribute="namespaced attribute text"/>
    </abc:non-empty-with-namespace>
    <non-empty-comment>
        <!-- A comment -->
    </non-empty-comment>
    <non-empty-proc-instr>
        <?some-instruction?>
    </non-empty-proc-instr>
</Document>

要按名称将空标签限制为仅某些元素,您可以调整 match添加元素名称检查的模式:contains('|list|of|element|names|', concat('|',name(),'|')) .请注意,名称列表以 | 分隔。 ,还有一个 |在列表的开头和结尾,我们也将元素名称与这些分隔符连接起来。这个技巧使我们能够使用 contains (正好匹配任意子串)实现在列表中查找的效果。

例如,允许 non-empty 为空标签, empty-2 , empty-4abc:empty-with-namespace元素,更新后的样式表将是:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
    <xsl:output method="xml" indent="yes"/>

    <xsl:template match="@* | node()">
        <xsl:copy>
            <xsl:apply-templates select="@* | node()"/>
        </xsl:copy>
    </xsl:template>

    <xsl:template match="*[contains('|non-empty|empty-2|empty-4|abc:empty-with-namespace|',  concat('|',name(),'|')) and not(*) and not(normalize-space()) and not(comment()) and not(processing-instruction())]">
        <xsl:element name="{name()}" namespace="{namespace-uri()}">
            <xsl:copy-of select="./@*"/>
        </xsl:element>
    </xsl:template>
</xsl:stylesheet>

FormatDOMDocument 的输出会变成:

<?xml version="1.0" encoding="UTF-8"?>
<Document>
    <empty></empty>
    <empty-2/>
    <non-empty>
Some text
</non-empty>
    <non-empty-2 some-attribute="attribute text">
        <empty-3></empty-3>
        <non-empty-3>
            <empty-4/>
            <empty-with-attribute another-attribute="some more text"></empty-with-attribute>
        </non-empty-3>
    </non-empty-2>
    <abc:non-empty-with-namespace xmlns:abc="urn:test:abc">
        <abc:empty-with-namespace abc:namespaced-attribute="namespaced attribute text"/>
    </abc:non-empty-with-namespace>
    <non-empty-comment>
        <!-- A comment -->
    </non-empty-comment>
    <non-empty-proc-instr>
        <?some-instruction?>
    </non-empty-proc-instr>
</Document>

请注意,尽管我们指定了 non-empty作为该列表中可能的空标记,它不会显示为空,因为它实际上有一个文本节点(这就是我们想要的)。另外,请注意 empty不在我们的列表中,它带有一个结束标记为 <empty></empty>这也是我们在这种情况下想要的(对于 empty-3 也是如此)。

关于c++ - 有没有办法修改样式表,以便将带有空标签的 XML 文档转换为 <tag/>?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29036336/

有关c++ - 有没有办法修改样式表,以便将带有空标签的 XML 文档转换为 <tag/>?的更多相关文章

  1. ruby-on-rails - 在 Rails 中将文件大小字符串转换为等效千字节 - 2

    我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,

  2. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  3. ruby - 将数组的内容转换为 int - 2

    我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]

  4. ruby - 将散列转换为嵌套散列 - 2

    这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[

  5. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

    我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

  6. ruby - 在院子里用@param 标签警告 - 2

    我试图使用yard记录一些Ruby代码,尽管我所做的正是所描述的here或here#@param[Integer]thenumberoftrials(>=0)#@param[Float]successprobabilityineachtrialdefinitialize(n,p)#initialize...end虽然我仍然得到这个奇怪的错误@paramtaghasunknownparametername:the@paramtaghasunknownparametername:success然后生成的html看起来很奇怪。我称yard为:$yarddoc-mmarkdown我做错了什么?

  7. ruby-on-rails - 如何优雅地重启 thin + nginx? - 2

    我的瘦服务器配置了nginx,我的ROR应用程序正在它们上运行。在我发布代码更新时运行thinrestart会给我的应用程序带来一些停机时间。我试图弄清楚如何优雅地重启正在运行的Thin实例,但找不到好的解决方案。有没有人能做到这一点? 最佳答案 #Restartjustthethinserverdescribedbythatconfigsudothin-C/etc/thin/mysite.ymlrestartNginx将继续运行并代理请求。如果您将Nginx设置为使用多个上游服务器,例如server{listen80;server

  8. ruby-on-rails - rspec should have_select ('cars' , :options => ['volvo' , 'saab' ] 不工作 - 2

    关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion在首页我有:汽车:VolvoSaabMercedesAudistatic_pages_spec.rb中的测试代码:it"shouldhavetherightselect"dovisithome_pathit{shouldhave_select('cars',:options=>['volvo','saab','mercedes','audi'])}end响应是rspec./spec/request

  9. ruby-on-rails - date_field_tag,如何设置默认日期? [ rails 上的 ruby ] - 2

    我想设置一个默认日期,例如实际日期,我该如何设置?还有如何在组合框中设置默认值顺便问一下,date_field_tag和date_field之间有什么区别? 最佳答案 试试这个:将默认日期作为第二个参数传递。youcorrectlysetthedefaultvalueofcomboboxasshowninyourquestion. 关于ruby-on-rails-date_field_tag,如何设置默认日期?[rails上的ruby],我们在StackOverflow上找到一个类似的问

  10. ruby-on-rails - Nokogiri:使用 XPath 搜索 <div> - 2

    我使用Nokogiri(Rubygem)css搜索寻找某些在我的html里面。看起来Nokogiri的css搜索不喜欢正则表达式。我想切换到Nokogiri的xpath搜索,因为这似乎支持搜索字符串中的正则表达式。如何在xpath搜索中实现下面提到的(伪)css搜索?require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(ABBlaCD3"HTML_END#my_blockisgivenmy_bl="1"#my_eqcorrespondstothisregexmy_eq="\/[0-9]+\/"#FIXMEThefoll

随机推荐