我有以下问题我成功启动了SeleniumGridhub:java-jarselenium-server-standalone-2.53.0.jar-rolehub之后,我尝试使用以下命令启动PhantomJS节点:phantomjs--webdriver=8090--webdriver-selenium-grid-hub=http://localhost:4444但出现错误:[INFO-2016-03-25T13:56:28.397Z]GhostDriver-Main-runningonport8090[INFO-2016-03-25T13:56:28.397Z]GhostDriver
我刚刚构建了一个angularjsweb应用程序,我正在尝试使其可抓取,以便它可以被google正确索引。也因此我可以申请adsense批准。我研究了解决方案,但发现它们很困惑。大多数人都在讨论使用phantomjs或等效物来拍摄内容的动态快照,然后将这些内容提供给机器人,但我真的无法理解它。我的网站位于www.covervidz.com。谁能帮忙?! 最佳答案 我会研究名为Prerender.io的服务-他们解决了这个问题。如果失败,您可以尝试提供定期更新的静态html文件。 关于ja
我们正在将一个PHP应用程序迁移到AngularJS,并希望保持我们的网站排名。显然,我们将使用301重定向,但如果您转到AngularJS前端并使用预呈现的HTML,主要搜索引擎是否会保持SEO排名?我只是想确保即使我们允许Angular应用程序可以通过phantomJS和预呈现的HTML进行爬取,我们仍然保持我们的Google排名。 最佳答案 我看过的大部分文章,讲讲indexinganAngularapp.我假设一旦你解决了这个问题,你就可以担心排名了。你问的是保持你的排名。如果你保持你的排名,你将如何确保你的排名保持不变。什
我正在创建一个内置搜索引擎的Ember应用程序,比如搜索房屋。随着房屋的发现/添加或移除/出售,我的结果发生了很大变化。因此我的搜索结果一直在变化。我也有每个房子的页面,上面有一个类似的房子部分,显示总是更换与这个相似的房子。我正在努力寻找使搜索引擎可以抓取此应用的最佳方法。我希望discourse为每个页面使用noscript标签,但由于我所有的房屋页面都可以包含不同的信息和结构,具体取决于代理/卖家,这将需要更多的工作,基本上是在重复客户正在做的事情!我可以走phantomjs路线并缓存我的所有页面并通过escapedfragment_方法提供服务,但我认为这将是一种资源密集型方法
更新好的,我已经找到错误了!我使用的字体来自http://www.typography.com/如果我从中删除指向字体的链接(或者甚至把它放在正文中)每次都能正确获取网站!总结:如果您使用的是从远程域加载的webfonts(也有某种许可证批准过程),那么spiderable包会崩溃!原问题:所以我得到了这个使用meteor.js构建的简单网站。它在DigitalOcean上,使用meteorup部署(启用phantomjs)并且它使用spiderable包。Here'sthesite,it'sasimpleportfolio.现在当我做例子时curlhttp://portfolio.n
背景我目前正在使用Google的#!方法通过代理和PhantomJS的组合为一个动态网站设置SEO索引。我们的Web应用程序不仅托管我们自己的应用程序,还托管由第三方提供的任意数量的应用程序。由于我无法控制这些应用程序(因此无法控制它们的加载时间),因此在处理GoogleBot查询时我现在面临两种选择:缓存生成的HTML并将缓存的响应返回给GoogleBot。在每次GoogleBot请求时刷新缓存,但返回陈旧的响应使用基于时间的缓存机制。到期时,GoogleBot会收到新生成的响应显然我更愿意选择(2),但我担心GoogleBot在读取已抓取的HTML之前会超时。问题GoogleBot
我正在使用Judo.js为我的Ember网络应用程序创建站点地图和html快照。对站点上基本url的简单测试失败。站点地图生成得很好,但是无论urlConfig对象包含多少个URL(或者页面有多“小”),它都会抛出“stdoutmaxBufferexceeded”错误。首先它记录Preparingtosnapshot:2(其中2是我指定的url的数量)。然后记录Finishedsnapshotting:2然而,它会“挂起”大约6秒并吐出:Error:stdoutmaxBufferexceeded]cmd:'C:\Windows\\system31\\cmd.exe/s/c"phanto
我刚刚使用MeteorUp部署了一个网站,我正在尝试确定我的网站是否可以被Google抓取。当我执行curlwww.compmaker.com?_escaped_fragment_=它返回包含所有文本的页面。此外,当我搜索“compmaker.com”作为搜索查询时,它似乎在描述中列出了我的网站和一些内容。但是,在Google网站管理员中,当我转到FetchAsGoogle并按FetchandRender时,HTML中的内容丢失了。此外,Adsense拒绝了我的网站,因为它看不到上面的任何文字。所以我想知道,spiderable真的有效吗?如果不是,为什么当我使用curl时我实际上可以
我想拍摄我的angularjsSPA的html快照。Angular应用程序正在从另一个域上的tomcat服务器获取数据。SPA在chrome浏览器中可以成功获取数据,但是在phantomjs浏览器中会出现如下错误。ERROR{"data":null,"status":0,"config":{"method":"GET","transformRequest":[null],"transformResponse":[null],"url":"https://localhost:8443/gomovie/control/getHomeData","headers":{"Content-Typ
我已经安装了phantomjs(因为我正在尝试让系统使我的网站在Angular上可抓取),但我遇到了一个“nomod”错误,该错误仅发生在phantomjs服务器上(实时版本工作得很好).................loadingcontrollers....对于app.js'usestrict';angular.module('myApp',['ngAnimate','ngAria',....]).filter().....config(function($routeProvider,$stateProvider,$urlRouterProvider,$authProvider,