我正在使用 PHP 和 MySQL 建立一个站点,它本质上只是现有数据库的 Web 前端。可以理解,我的客户非常热衷于防止任何人能够复制数据库中的数据,但同时希望所有内容都公开可用,甚至希望有一个“查看全部”链接来显示数据库中的每条记录。
虽然我已采取一切措施来防止诸如 SQL 注入(inject)攻击之类的攻击,但没有什么可以阻止任何人以 html 格式查看所有记录并运行某种脚本将此数据解析回另一个数据库。即使我要删除“查看全部”链接,从理论上讲,有人仍然可以使用自动化过程逐条检查每条记录并将它们编译到一个新数据库中,从根本上掌握所有信息。
有没有人有任何好的策略来防止甚至只是阻止他们可以分享。
最佳答案
虽然没有什么可以阻止有决心的人抓取公开内容,但您可以做一些基本的事情来减轻客户的担忧:
用户帐户、IP 地址、用户代理等的速率限制... - 这意味着您限制特定用户组在特定时间段内可以下载的数据量。如果检测到大量数据正在传输,则关闭帐户或 IP 地址。
需要 JavaScript - 确保客户端类似于交互式浏览器,而不是准系统蜘蛛...
RIA - 通过富 Internet 应用程序界面使您的数据可用。基于 JavaScript 的网格包括 ExtJs、YUI、Dojo 等。更丰富的环境包括 Flash 和 Silverlight,如 1kevgriff mentions .
将数据编码为图像。这对普通用户来说相当麻烦,但您可以将一些数据表或值编码为图像而不是文本,这会击败大多数文本解析器,但当然也不是万无一失的。
robots.txt - 拒绝明显的网络蜘蛛,已知的机器人用户代理。
用户代理:*
不允许:/
使用机器人元标记。这将停止符合蜘蛛。例如,这将阻止 Google 将您编入索引:
<meta name="robots"content="noindex,follow,noarchive">
有不同程度的威慑,第一种选择可能是侵入性最小的。
关于php - 从网站数据库中避免 'data scraping' 的顶级技术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2066756/
我正在尝试测试是否存在表单。我是Rails新手。我的new.html.erb_spec.rb文件的内容是:require'spec_helper'describe"messages/new.html.erb"doit"shouldrendertheform"dorender'/messages/new.html.erb'reponse.shouldhave_form_putting_to(@message)with_submit_buttonendendView本身,new.html.erb,有代码:当我运行rspec时,它失败了:1)messages/new.html.erbshou
我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
我已经从我的命令行中获得了一切,所以我可以运行rubymyfile并且它可以正常工作。但是当我尝试从sublime中运行它时,我得到了undefinedmethod`require_relative'formain:Object有人知道我的sublime设置中缺少什么吗?我正在使用OSX并安装了rvm。 最佳答案 或者,您可以只使用“require”,它应该可以正常工作。我认为“require_relative”仅适用于ruby1.9+ 关于ruby-主要:Objectwhenrun
我花了三天的时间用头撞墙,试图弄清楚为什么简单的“rake”不能通过我的规范文件。如果您遇到这种情况:任何文件夹路径中都不要有空格!。严重地。事实上,从现在开始,您命名的任何内容都没有空格。这是我的控制台输出:(在/Users/*****/Desktop/LearningRuby/learn_ruby)$rake/Users/*******/Desktop/LearningRuby/learn_ruby/00_hello/hello_spec.rb:116:in`require':cannotloadsuchfile--hello(LoadError) 最佳
我已经像这样安装了一个新的Rails项目:$railsnewsite它执行并到达:bundleinstall但是当它似乎尝试安装依赖项时我得到了这个错误Gem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension./System/Library/Frameworks/Ruby.framework/Versions/2.0/usr/bin/rubyextconf.rbcheckingforlibkern/OSAtomic.h...yescreatingMakefilemake"DESTDIR="cleanmake"DESTDIR="
关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion在首页我有:汽车:VolvoSaabMercedesAudistatic_pages_spec.rb中的测试代码:it"shouldhavetherightselect"dovisithome_pathit{shouldhave_select('cars',:options=>['volvo','saab','mercedes','audi'])}end响应是rspec./spec/request
似乎无法为此找到有效的答案。我正在阅读Rails教程的第10章第10.1.2节,但似乎无法使邮件程序预览正常工作。我发现处理错误的所有答案都与教程的不同部分相关,我假设我犯的错误正盯着我的脸。我已经完成并将教程中的代码复制/粘贴到相关文件中,但到目前为止,我还看不出我输入的内容与教程中的内容有什么区别。到目前为止,建议是在函数定义中添加或删除参数user,但这并没有解决问题。触发错误的url是http://localhost:3000/rails/mailers/user_mailer/account_activation.http://localhost:3000/rails/mai