是否有人抓取或使用 FB API 从公共(public)个人资料的墙贴中访问数据?如果您只是转到 URL,您可以检查元素以查看大部分数据以及墙上无限滚动的 ajax 调用。
我将如何着手完成这项工作?
以下帖子没有得到回复,或者只是场景不同但很接近:
Get wall feed from a public Facebook page using Graph API - is it really this complex?
How to show facebook feed messages from my site without access_token?
作为我想要完成的一个例子,这个公共(public)文件 https://www.facebook.com/aurelia.filion有一个 2013 年 11 月 21 日的墙贴,假设我想从中获取数据。怎么办?
最佳答案
除非您有明确的书面许可,否则禁止抓取 Facebook。
Facebook 的自动数据收集条款(复制日期 2017 年 3 月 19 日)
这些条款适用于您通过自动方式从 Facebook 收集数据,例如通过收集机器人、机器人、蜘蛛或抓取工具(“自动数据收集”),以及您对这些数据的使用。
未经 Facebook 明确书面许可,您不得参与自动数据收集。
获得参与自动数据收集的许可即表示您同意遵守这些自动数据收集条款,这些条款通过引用纳入权利和责任声明。
您同意,您对通过自动数据收集收集的数据的使用仅限于在互联网上显示的搜索索引,除非 Facebook 单独批准其他用途和在互联网上显示。
您同意不会出售通过自动数据收集收集的或从通过自动数据收集收集的数据派生的任何数据。
您同意不会以聚合或批量形式传输通过自动数据收集收集的数据。
您同意,您将根据 Facebook 的书面请求销毁您通过自动数据收集收集的所有数据,并且您将证明此类销毁将受到伪证处罚。
您同意 Facebook 可以出于任何原因随时撤销授予的任何许可,并且您同意在收到此类撤销通知后立即停止收集和使用通过自动数据收集收集的数据。
您同意在收到 Facebook 的此类核算请求后十 (10) 天内提供对通过自动数据收集收集的数据的所有使用情况的核算。
您同意不会规避 Facebook 为防止违反这些条款而实现的任何措施。
您同意您不会违反任何机器人排除 header 中的限制。
您同意您只会使用您自己的真实 IP 地址/用户代理身份,并且不会在其他服务的 IP 地址/用户代理字符串下掩盖您的服务。
您同意,未经 Facebook 明确书面同意,您不会将任何批准的 IP 地址或用户代理转让给任何一方。
您同意,任何违反这些条款的行为都可能导致您立即被禁止访问所有 Facebook 网站、产品和服务。您承认并同意违反或威胁违反这些条款将造成无法弥补的伤害,金钱赔偿将是不充分的补救措施,并且 Facebook 有权获得临时和永久禁令救济,而无需提供任何 margin 或其他担保,限制您或代表您行事的任何人免于此类违约或威胁违约。本文中的任何内容均不得解释为阻止 Facebook 寻求其可用的任何和所有补救措施,包括追回金钱损失。
此处的任何内容均不得解释为授予或许可任何知识产权,无论是通过禁止反言、暗示还是其他方式。
在此处阅读完整列表 https://www.facebook.com/apps/site_scraping_tos_terms.php
关于javascript - 我想从公开的 Facebook 墙贴中获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25458263/
有没有办法在这个简单的get方法中添加超时选项?我正在使用法拉第3.3。Faraday.get(url)四处寻找,我只能先发起连接后应用超时选项,然后应用超时选项。或者有什么简单的方法?这就是我现在正在做的:conn=Faraday.newresponse=conn.getdo|req|req.urlurlreq.options.timeout=2#2secondsend 最佳答案 试试这个:conn=Faraday.newdo|conn|conn.options.timeout=20endresponse=conn.get(url
我有一个rubyonrails应用程序。我按照facebook的说明添加了一个像素。但是,要跟踪转化,Facebook要求您将页面置于达到预期结果时出现的转化中。即,如果我想显示客户已注册,我会将您注册后转到的页面作为成功对象进行跟踪。我的问题是,当客户注册时,在我的应用程序中没有登陆页面。该应用程序将用户带回主页。它在主页上显示了一条消息,所以我想看看是否有一种方法可以跟踪来自Controller操作而不是实际页面的转化。我需要计数的Action没有页面,它们是ControllerAction。是否有任何人都知道的关于如何执行此操作的gem、文档或最佳实践?这是进入布局文件的像素
我有一个存储主机名的Ruby数组server_names。如果我打印出来,它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点,但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类?输出:ge
我想获取模块中定义的所有常量的值:moduleLettersA='apple'.freezeB='boy'.freezeendconstants给了我常量的名字:Letters.constants(false)#=>[:A,:B]如何获取它们的值的数组,即["apple","boy"]? 最佳答案 为了做到这一点,请使用mapLetters.constants(false).map&Letters.method(:const_get)这将返回["a","b"]第二种方式:Letters.constants(false).map{|c
我安装了ruby版本管理器,并将RVM安装的ruby实现设置为默认值,这样'哪个ruby'显示'~/.rvm/ruby-1.8.6-p383/bin/ruby'但是当我在emacs中打开inf-ruby缓冲区时,它使用安装在/usr/bin中的ruby。有没有办法让emacs像shell一样尊重ruby的路径?谢谢! 最佳答案 我创建了一个emacs扩展来将rvm集成到emacs中。如果您有兴趣,可以在这里获取:http://github.com/senny/rvm.el
假设我有这个范围:("aaaaa".."zzzzz")如何在不事先/每次生成整个项目的情况下从范围中获取第N个项目? 最佳答案 一种快速简便的方法:("aaaaa".."zzzzz").first(42).last#==>"aaabp"如果出于某种原因你不得不一遍又一遍地这样做,或者如果你需要避免为前N个元素构建中间数组,你可以这样写:moduleEnumerabledefskip(n)returnto_enum:skip,nunlessblock_given?each_with_indexdo|item,index|yieldit
我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur
如何在Ruby中获取BasicObject实例的类名?例如,假设我有这个:classMyObjectSystem我怎样才能使这段代码成功?编辑:我发现Object的实例方法class被定义为returnrb_class_real(CLASS_OF(obj));。有什么方法可以从Ruby中使用它? 最佳答案 我花了一些时间研究irb并想出了这个:classBasicObjectdefclassklass=class这将为任何从BasicObject继承的对象提供一个#class您可以调用的方法。编辑评论中要求的进一步解释:假设你有对象
是否可以在应用程序中包含的gem代码中知道应用程序的Rails文件系统根目录?这是gem来源的示例:moduleMyGemdefself.included(base)putsRails.root#returnnilendendActionController::Base.send:include,MyGem谢谢,抱歉我的英语不好 最佳答案 我发现解决类似问题的解决方案是使用railtie初始化程序包含我的模块。所以,在你的/lib/mygem/railtie.rbmoduleMyGemclassRailtie使用此代码,您的模块将在
我有一个应用程序可以读取文件的内容并为其编制索引。我将它们存储在磁盘本身中,但现在我使用的是AmazonS3,因此以下方法不再适用。事情是这样的:defperform(docId)@document=Document.find(docId)if@document.file?#Youshould'tcreateanewversion@document.versionlessdo|doc|@document.file_content=Cloudoc::Extractor.new.extract(@document.file.file)@document.saveendendend@docu