我正在尝试通过 C# 为网页上的随机元素生成 CSS 选择器。一些背景:
我使用带有 WebBrowser 控件的表单。在导航时,可以询问光标下元素的 CSS 选择器。获取 html 元素是微不足道的,当然,通过以下方式:
WebBrowser.Document.GetElementFromPoint(<Point>);
目标是创建一个“严格”的 css 选择器,指向光标下的元素,a-la:
html > body > span:eq(2) > li:eq(5) > div > div:eq(3) > span > a
此选择器基于 :eq 运算符,因为它旨在由 jQuery 和/或 SizzleJS 处理(这两个支持 :eq - 原始 CSS 选择器不支持。竖起大拇指@BoltClock 帮助我澄清这一点)。所以,你明白了。为了实现这一目标,我们将检索到的 HtmlElement 提供给以下方法,并通过询问我们遇到的每个元素的父元素开始向上提升 DOM 树:
private static List<String> GetStrictCssForHtmlElement(HtmlElement element)
{
List<String> familyTree;
for (familyTree = new List<String>(); element != null; element = element.Parent)
{
string ordinalString = CalculateOrdinalPositionAmongSameTagSimblings(element);
if (ordinalString == null) return null;
familyTree.Add(element.TagName.ToLower() + ordinalString);
}
familyTree.Reverse();
return familyTree;
}
private static string CalculateOrdinalPositionAmongSameTagSimblings(HtmlElement element, bool simplifyEq0 = true)
{
int count = 0;
int positionAmongSameTagSimblings = -1;
if (element.Parent != null)
{
foreach (HtmlElement child in element.Parent.Children)
{
if (element.TagName.ToLower() == child.TagName.ToLower())
{
count++;
if (element == child)
{
positionAmongSameTagSimblings = count - 1;
}
}
}
if (positionAmongSameTagSimblings == -1) return null; // Couldn't find child in parent's offsprings!?
}
return ((count > 1) ? (":eq(" + positionAmongSameTagSimblings + ")") : ((simplifyEq0) ? ("") : (":eq(0)")));
}
此方法已对各种页面可靠地起作用。然而,有一个特别的页面让我印象深刻:
http://www.delicious.com/recent
由于一个非常简单的原因,尝试检索列表中任何元素(位于页面中心)的 CSS 选择器失败:
在提升到达第一个 SPAN 元素之后(您可以通过使用 IE9 的网络开发工具检查页面进行验证来发现它),它会尝试通过计算它在相同标签兄弟中的顺序位置来处理它。为此,我们需要询问它是 sibling 的父节点。这就是事情变得奇怪的地方。 SPAN 元素报告它的 Parent 是一个带有 id="recent-index"的 DIV 元素。然而,它不是SPAN 的直接父级(直接父级是 LI class="wrap isAdv")。这会导致该方法失败,因为 - 不出所料 - 它无法在 child 中发现 SPAN。
但它变得更加奇怪。我检索并隔离了 SPAN 本身的 HtmlElement。然后我得到它的 Parent 并使用它重新下降回到 SPAN 元素,使用:
HtmlElement regetSpanElement = spanElement.Parent.Children[0].Children[1].Children[1].Children[0].Children[2].Children[0];
这将我们带回到我们开始的 SPAN 节点......但是有一个转折:
regetSpanElement.Parent.TagName;
这现在将 LI 报告为父 X-X。怎么会这样?有什么见解吗?
再次感谢您。
注意事项:
我保存了 Html 代码(因为它在 WebBrowser.Document.Html 中显示)并亲自检查以 100% 确定没有发生任何有趣的事情(也就是提供给 WebBrowser 控件的代码与我看到的代码不同)在 IE9 中——但这并没有发生,结构与相关路径 100% 匹配)。
我正在使用此处概述的说明在 IE9 模式下运行 WebBrowser 控件:
http://www.west-wind.com/weblog/posts/2011/May/21/Web-Browser-Control-Specifying-the-IE-Version
试图让 WebBrowser 控件和 IE9 尽可能相似地运行。
我怀疑观察到的效果可能是由于某些脚本在我背后运行所致。但是,我在网络编程方面的知识还不足以确定它。
编辑:错别字
最佳答案
依赖 :eq() 很难!很难从动态的 DOM 中可靠地重新选择。当然,它可能适用于非常静态的页面,但事情每天都在变得更加动态。您可能会考虑稍微改变策略。尝试使用更智能更灵活的选择器。也许像这样弹出一些 javascript:
predictCss = function(s, noid, noclass, noarrow) {
var path, node = s;
var psep = noarrow ? ' ' : ' > ';
if (s.length != 1) return path; //throw 'Requires one element.';
while (node.length) {
var realNode = node[0];
var name = (realNode.localName || realNode.tagName || realNode.nodeName);
if (!name || name == '#document') break;
name = name.toLowerCase();
if(node.parent().children(name).length > 1){
if (realNode.id && !noid) {
try {
var idtest = $(name + '#' + realNode.id);
if (idtest.length == 1) return name + '#' + realNode.id + (path ? '>' + path : '');
} catch (ex) {} // just ignore the exception, it was a bad ID
} else if (realNode.className && !noclass) {
name += '.' + realNode.className.split(/\s+/).join('.');
}
}
var parent = node.parent();
if (name[name.length - 1] == '.') {
name = name.substring(0, name.length - 1);
}
siblings = parent.children(name);
//// If you really want to use eq:
//if (siblings.length > 1) name += ':eq(' + siblings.index(node) + ')';
path = name + (path ? psep + path : '');
node = parent;
}
return path
}
并用它来生成各种选择器:
var elem = $('#someelement');
var epath = self.model.util.predictCss(elem, true, true, false);
var epathclass = self.model.util.predictCss(elem, true, false, false);
var epathclassid = self.model.util.predictCss(elem, false, false, false);
然后分别使用:
var relem= $(epathclassid);
if(relem.length === 0){
relem = $(epathclass);
if(relem.length === 0){
relem = $(epath);
}
}
如果您最好的选择器仍然包含多个元素,那么您必须在如何匹配 dom 元素方面发挥创意——也许是 levenshtein 或者可能有一些特定的文本,或者您可以回退到 eq.希望对您有所帮助!
顺便说一句,我假设你有 jQuery - 由于 sizzle 引用。例如,您可以在附加到 body 的最后一个子项的脚本标记中的自执行匿名函数中注入(inject)上述内容。
关于c# - HtmlElement.Parent 返回错误的父级,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6832451/
大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返
我遵循MichaelHartl的“RubyonRails教程:学习Web开发”,并创建了检查用户名和电子邮件长度有效性的测试(名称最多50个字符,电子邮件最多255个字符)。test/helpers/application_helper_test.rb的内容是:require'test_helper'classApplicationHelperTest在运行bundleexecraketest时,所有测试都通过了,但我看到以下消息在最后被标记为错误:ERROR["test_full_title_helper",ApplicationHelperTest,1.820016791]test
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
我是rails的新手,想在form字段上应用验证。myviewsnew.html.erb.....模拟.rbclassSimulation{:in=>1..25,:message=>'Therowmustbebetween1and25'}end模拟Controller.rbclassSimulationsController我想检查模型类中row字段的整数范围,如果不在范围内则返回错误信息。我可以检查上面代码的范围,但无法返回错误消息提前致谢 最佳答案 关键是您使用的是模型表单,一种显示ActiveRecord模型实例属性的表单。c
我正在尝试编写一个将文件上传到AWS并公开该文件的Ruby脚本。我做了以下事情:s3=Aws::S3::Resource.new(credentials:Aws::Credentials.new(KEY,SECRET),region:'us-west-2')obj=s3.bucket('stg-db').object('key')obj.upload_file(filename)这似乎工作正常,除了该文件不是公开可用的,而且我无法获得它的公共(public)URL。但是当我登录到S3时,我可以正常查看我的文件。为了使其公开可用,我将最后一行更改为obj.upload_file(file
我克隆了一个rails仓库,我现在正尝试捆绑安装背景:OSXElCapitanruby2.2.3p173(2015-08-18修订版51636)[x86_64-darwin15]rails-v在您的Gemfile中列出的或native可用的任何gem源中找不到gem'pg(>=0)ruby'。运行bundleinstall以安装缺少的gem。bundleinstallFetchinggemmetadatafromhttps://rubygems.org/............Fetchingversionmetadatafromhttps://rubygems.org/...Fe
在Cooper的书BeginningRuby中,第166页有一个我无法重现的示例。classSongincludeComparableattr_accessor:lengthdef(other)@lengthother.lengthenddefinitialize(song_name,length)@song_name=song_name@length=lengthendenda=Song.new('Rockaroundtheclock',143)b=Song.new('BohemianRhapsody',544)c=Song.new('MinuteWaltz',60)a.betwee
我是Google云的新手,我正在尝试对其进行首次部署。我的第一个部署是RubyonRails项目。我基本上是在关注thisguideinthegoogleclouddocumentation.唯一的区别是我使用的是我自己的项目,而不是他们提供的“helloworld”项目。这是我的app.yaml文件runtime:customvm:trueentrypoint:bundleexecrackup-p8080-Eproductionconfig.ruresources:cpu:0.5memory_gb:1.3disk_size_gb:10当我转到我的项目目录并运行gcloudprevie
我有两个Rails模型,即Invoice和Invoice_details。一个Invoice_details属于Invoice,一个Invoice有多个Invoice_details。我无法使用accepts_nested_attributes_forinInvoice通过Invoice模型保存Invoice_details。我收到以下错误:(0.2ms)BEGIN(0.2ms)ROLLBACKCompleted422UnprocessableEntityin25ms(ActiveRecord:4.0ms)ActiveRecord::RecordInvalid(Validationfa