我要抓取的网站使用的是javascript:request.open("POST",url,true);通过ajax获取我需要抓取的额外信息。我尝试了各种排列:r=mechanize.urlopen("https://site.tld/dir/"+url,urllib.urlencode({'none':'none'}))让Mechanize获取页面,但它总是导致我再次获取登录HTML,表明出现问题。根据Firebug,Firefox似乎没有向POST添加任何HTTP数据,我正在添加一个空字段以尝试强制urlopen使用“POST”而不是“GET”,希望网站忽略该字段。我认为Mecha
forlinkinbr.links(url_regex="inquiry-results.jsp"):cb[link.url]=linkforpage_linkincb.values():forlinkinbr.links(url_regex="inquiryDetail.jis"):....................url=link.absolute_urlbr.follow_link(link)......................br.follow_link(page_link)这是我的代码。基本上,它从特定页面中提取页面链接[第1、2、3、4、5页的链接...]和数
Mechanize(Python)无法打开http摘要URL,返回401。我用谷歌搜索并尝试调试但没有成功。我的代码是这样的。importmechanizeproject="test"baseurl="http://trac.somewhere.net"loginurl="%s/%s/login"%(baseurl,project)b=mechanize.Browser()b.add_password(baseurl,"user","secret","someRealm")b.open(loginurl) 最佳答案 Mechaniz
我刚刚下载了easy_install,但我在安装mechanize时遇到问题,我是否应该随时处理站点包。在下面的第一次尝试中,我得到了一个错误。在下面的第二次尝试中,我得到命令未找到,这很奇怪,因为我确定它已下载。names-computer:~names$cd/Users/names/Desktop/names-computer:~/Desktopnames$sh/Users/names/Desktop/mechanize-0.1.9-py2.5.egg/Users/names/Desktop/mechanize-0.1.9-py2.5.egg:/Users/names/Deskto
下面是我正在使用的代码。谁能告诉我我在这里缺少什么?br.select_form("aspnetForm")br.form.set_all_readonly(False)FILENAME="2BProcessed.txt"#br['ctl00$PlaceHolderMain$UploadDocumentSection$ctl03$InputFile']=FILENAMEbr.form.add_file(open(FILENAME),'text/plain',FILENAME)printbr.formprint"--------------------------------------
我真的很困惑。我基本上是在尝试使用pythonMechanize在网站上填写表格。除了下拉菜单外,我一切正常。我用什么来选择它,我用什么来赋值?我不知道我是否应该输入选择的名称或它的数值。非常感谢您的帮助,谢谢。代码片段:try:br.open("http://www.website.com/")try:br.select_form(nr=0)br['number']="mynumber"br['from']="herpderp@gmail.com"br['subject']="Yellow"br['carrier']="203"br['message']="Hello,World!"
我需要从我填写表格的页面中删除一些数据(已经用mechanize做到了)。问题是,该页面在许多页面上返回数据,而我无法从这些页面获取数据。从第一个结果页面获取它们没有问题,因为它已经在搜索后显示-我只需提交表单并获得响应。我分析了结果页面的源代码,它似乎使用了JavaScript、RichFaces(一些带有ajax的JSF库,但我可能是错的,因为我不是网络专家)。但是,我设法弄清楚了如何到达剩余的结果页面。我需要点击这种形式的链接(href="javascript:void(0);",完整代码如下):12345678910»»»»»newRichFaces.ui.DataScroll
我正在尝试访问使用Symfony框架设计的本地网站。它与网络浏览器和CURL完美配合,但当我使用Mechanize时,我总是得到服务器的401未经授权的答案。importmechanize#Browserbr=mechanize.Browser()br.set_debug_http(True)br.set_debug_redirects(True)br.set_debug_responses(True)#Doesnotchangeanythingevenifwechangethosbr.addheaders=[('User-agent','Mozilla/5.0(X11;U;Linux
我想使用pythonmechanize填写表格。表格看起来像:=Submit)(readonly)>>如何将live或undefinesource(复选框)的值设置为True(勾选)或False(取消勾选)live和undefinsource的项目是:>>>printbr.form.controls[4].get_items()[]>>>printbr.form.controls[3].get_items()[] 最佳答案 我的一种做法是br.find_control("live").items[0].selected=True
各位程序员大家好!我正在尝试使用python和mechanize模块编写一个脚本来登录我大学的“食物平衡”页面...这是我尝试登录的页面:http://www.wcu.edu/11407.asp该网站有以下表单登录:WCUIDNumberPIN由此我们知道我需要填写以下字段:1.名字=id2.姓名=PIN随着Action:action=https://itapp.wcu.edu/BanAuthRedirector/Default.aspx这是我到目前为止编写的脚本:#!/usr/bin/python2-Wignoreimportmechanize,cookielibfromtimeim