jjzjj

Mechanize

全部标签

windows - 使用 Strawberry(可移植)Perl(适用于 Windows 7)安装 Mechanize 时遇到问题

我在StackOverflow上的其他地方看到过帖子,暗示我安装Mechanize以与StrawberryPerl一起使用时出现的那种问题是由于公司防火墙造成的,但我不在公司防火墙后面。我确实使用ISP调制解调器,并且在桌面上安装了防病毒软件。我应该如何配置cpan来避免这个问题?----------------------------------------------WelcometoStrawberryPerlPortableEdition!*URL-http://www.strawberryperl.com/*seeREADME.TXTformoreinfo----------

python - 将 Python 与 mechanize 和 BeautifulSoup 捆绑在一起

这个问题在这里已经有了答案:HowcanIdistributepythonprograms?(8个答案)关闭9年前。我已经用Python开发了一个工具,我将提供给一个组织。假设该组织正在运行Windows,并且没有安装Python、mechanize或BeautifulSoup模块。现在捆绑/打包我的工具的最佳方式是什么,以便他们可以以最小的开销运行它?到目前为止,我要求他们做很多事情。安装说明:第1步。从此处下载并安装Python2.7.3http://www.python.org/ftp/python/2.7.3/python-2.7.3.msi第2步。从此处下载并安装easy_i

javascript - 我如何使用 Perl 抓取一个用 JavaScript 显示其内容的网站?

我需要编写一个Perl脚本来抓取网站。该网站只能使用JavaScript进行抓取,并且用户使用的是Windows。我对Win32::IE::Mechanize有所了解在装有IE6的工作机器上,但后来我转移到装有IE8的上网本上,甚至无法获取一个简单的页面。Win32::IE::Mechanize是否与最新版本的IE保持同步?但是,更重要的是,鉴于最近的WinXP机器,抓取仅通过JavaScript显示其内容的网站的最快、最简单的方法是什么? 最佳答案 WWW::Selenium.它允许您指定要使用的浏览器(从一开始就支持IE和Fir

windows - 运行 Perl 脚本通过 DOS 命令提示符调用网页?

我的工作场所使用XP,我试图在其上运行以下脚本usestrict;usewarnings;useWWW::Mechanize;my$mech=WWW::Mechanize->new();$mech->get('http://google.com');$mech->submit_form(form_number=>0,fields=>{q=>'ledzeppelin',});print$mech->content;但是,当我尝试通过DOS运行脚本时,我总是收到一条错误消息,指出无法加载该页面,因为我的计算机因超时而无法连接到google.com:80。据我所知,这不是网络问题,因为我的浏

c# - C# 中的 WebBrowsing - 库、工具等 - 是否类似于 Perl 中的 Mechanize?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭4年前。Improvethisquestion寻找类似于Mechanizefor.NET的东西...如果您不知道Mechanize是什么..http://search.cpan.org/dist/WWW-Mechanize/我将在此处维护一个建议列表。任何用于浏览/发布/屏幕抓取的东西(WebRequest和WebBrowserControl除外)。解析HTMLAgilityPack-http://www.cod

php - PHP 应用程序和 Ruby 应用程序之间的通信、传递信息

我主要从事PHP工作,并且更喜欢这样做,因为似乎有更多的工作使用这种语言,至少在我所在的领域(而且我对它还是很陌生,所以我想继续更好地学习这门语言)..但对于我想做的某些事情,我需要使用不适用于PHP但适用于Ruby的WWWMechanize库(是的,我知道PHP有一些替代方案,但我已经尝试过它们,但它们对我不起作用所以我需要这样做),所以我想用PHP编写我的大部分应用程序,然后在我需要使用这个库时调用Ruby,然后将信息传回PHP,是的,我知道这会很“慢”"但在这种情况下这不是问题,因为这不是公共(public)Web应用程序,它仅供商业使用..我想知道在两种语言之间传递信息的最佳方

java - Java Mechanize

我想知道是否有类似Perl/Python的Java机制。谢谢! 最佳答案 看看HtmlUnit.它类似于Perl的WWW::Mechanize.还有一个名为WWW::HtmlUnit的Perl版本。(它使用Inline::Java向Perl公开Java库的方法)。 关于java-JavaMechanize,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/2867499/

ruby-on-rails - 检查站点是否已在搜索引擎和目录中列出的代码

我目前正在用Rails开发一个应用程序,它需要检查一个网站是否已在Google、Bing、Yahoo、Yelp和黄页中列出。根据我的研究,最好的方法是在Google和Bing上检查site:domain.com并查找结果并在Yahoo目录中检查该域。还有其他方法吗?我的意思是一些代码片段来检查域的主页或使用他们的API或类似的东西。还有如何查看Yelp和黄页。 最佳答案 您可以使用mechanize并编写web风格的驱动程序谷歌:在搜索词上用这个搜索你的域site:checkmeout360.comhttps://www.googl

asp.net - 使用 Python Mechanize 对 aspx 进行屏幕截图 - Javascript 表单提交

我正在尝试在scraperwiki(http://ratings.food.gov.uk/QuickSearch.aspx?q=po30)上使用Mechanize/Python抓取英国食品评级机构数据aspx搜索结果页面(例如http://scraperwiki.com/scrapers/food_standards_agency/),但想出了一个尝试跟随具有以下形式的“下一页”链接时出现问题:"id="ctl00_ContentPlaceHolder1_uxResults_uxNext"title="Next>"/>表单处理程序如下所示:当我手动单击下一步链接时,HTTP跟踪显示__

python - Python 的 mechanize 模块错误

我正在使用mechanize模块从Python执行一些网络查询。我希望我的程序能够容错并优雅地处理各种错误(错误的URL、403/404响应)。但是,我在mechanize的文档中找不到它针对各种错误抛出的错误/异常。我只是这样调用它:self.browser=mechanize.Browser()self.browser.addheaders=[('User-agent',browser_header)]self.browser.open(query_url)self.result_page=self.browser.response().read()我怎么知道这里会抛出哪些错误/异