对于一个新项目,我希望结合使用 MySQL、Sphinx 和 MongoDB。 MySQL 用于关系数据和数值搜索,Sphinx 用于自由文本搜索,MongoDB 用于地理数据。就我的(快速)基准测试而言,MongoDB 是地理查询最快的,sphinx 是自由文本搜索最快的,而 MySQL 是关系数据搜索最快的。因此,为了获得最佳性能,我可能必须将它们组合到我的项目中。
然而,这有三个缺点。
所以问题是我应该将这三者结合起来,省去一个(可能是 MongoDB 并使用 Sphinx 处理地理数据)还是只使用一个(MongoDB 或 MySQL)?
为了了解数据,关系数据约为 6GB,地理数据约为 4GB,自由文本数据约为 16GB。
最佳答案
不太了解 3 个数据库中包含的记录/集合/文档是否具有数据库间引用。 EG如果用户名、职位、电话号码在Mysql中,用户地址在Mongo中。我假设答案是肯定的。
恕我直言,不推荐使用 3 种不同的存储解决方案,因为:
1)(最重要的)您不能聚合来自 2 个数据库的数据(以可扩展的方式)。
例子: 假设您将用户数据(用户名)保存在 Mysql 中,将用户地理坐标保存在 Mongo 中。您不能查询对位于两个数据库上的字段进行过滤器/排序。例如,您不能:
SELECT all users
WHERE name starts with 'A'
SORT BY distance_from_center
同样适用于 Sphinx。
解决方案:您要么限制在单个数据库上可用的数据,要么将数据从一个数据库复制/镜像到另一个数据库。
2)维护成本:维护3台服务器,不同的备份/冗余策略,不同的扩展策略;开发成本:开发者必须使用3个查询库,3种不同的查询方式等等。
3) 必须手动处理的不一致/同步问题(例如,你想在 mongo 和 mysql 中都插入数据;假设 mongo 写入了数据,但 mysql 引发了引用完整性异常,所以现在你有一个数据库之间不一致)
4)关于硬件成本,唯一吃RAM的是MongoDB(建议它必须在ram中拥有所有索引)。对于 MySQL 和 Solr 服务器,您可以控制内存消耗。
我会做什么:
如果我不需要所有 SQL 功能(如事务、引用完整性、连接等),我会选择 Mongo
如果我需要这些功能,并且我可以忍受较低的地理操作性能,我会选择 MySQL
现在,如果我需要(我的意思是,我真的真的需要)全文搜索,而 Mongo/Mysql FTS 功能还不够,我还会附加一个 FTS 服务器,如 Sphinx、Solr、Elasticsearch 等
关于mysql - 结合 MySQL、Sphinx 和 MongoDB。好主意?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6840760/
我在开发的Rails3网站的一些搜索功能上遇到了一个小问题。我有一个简单的Post模型,如下所示:classPost我正在使用acts_as_taggable_on来更轻松地向我的帖子添加标签。当我有一个标记为“rails”的帖子并执行以下操作时,一切正常:@posts=Post.tagged_with("rails")问题是,我还想搜索帖子的标题。当我有一篇标题为“Helloworld”并标记为“rails”的帖子时,我希望能够通过搜索“hello”或“rails”来找到这篇帖子。因此,我希望标题列的LIKE语句与acts_as_taggable_on提供的tagged_with方法
从MB升级到新的MBP后,Apple的迁移助手没有移动我的gem。我这次是通过macports安装rubygems,希望在下次升级时避免这种情况。有什么我应该注意的陷阱吗? 最佳答案 如果你想把你的gems安装在你的主目录中(在传输过程中应该复制过来,作为一个附带的好处,会让你以你自己的身份运行geminstall,而不是root),将gemhome:键设置为您在~/.gemrc中的主目录中的路径. 关于通过MacPorts的RubyGems是个好主意吗?,我们在StackOverf
文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co
我几天前在我的rubyonrails2.3.2上安装了Sphinx和Thinking-Sphinx,基本搜索效果很好。这意味着,没有任何条件。现在,我想用一些条件过滤搜索。我有公告模型,索引如下所示:define_indexdoindexestitle,:as=>:title,:sortable=>trueindexesdescription,:as=>:description,:sortable=>trueend也许我错了,但我注意到只有当我将:sortable=>true语法添加到这些属性时,我才能将它们用作搜索条件。否则它找不到任何东西。现在,我还在使用acts_as_tag
我刚刚安装了Sphinx(发行版:archlinux)并下载了源代码。然后我为Rails安装了“ThinkingSphinx”插件。我关注了officialpagesetup和thisScreencastfromRyanBates,但是当我尝试为模型建立索引时,出现了这个错误:$rakethinking_sphinx:index(in/home/benoror/Dropbox/Proyectos/cotizahoy)Sphinxcannotbefoundonyoursystem.Youmayneedtoconfigurethefollowingsettingsinyourconfig/
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭9年前。我需要从基于ruby的应用程序使用AmazonSimpleNotificationService,但不知道从哪里开始。您对从哪里开始有什么建议吗?
我看到其他人也遇到过类似的问题,但没有一个解决方案对我有用。0.3.14gem与其他gem文件一起存在。我已经完全按照此处指示完成了所有操作:https://github.com/brianmario/mysql2.我仍然得到以下信息。我不知道为什么安装程序指示它找不到include目录,因为我已经检查过它存在。thread.h文件存在,但不在ruby目录中。相反,它在这里:C:\RailsInstaller\DevKit\lib\perl5\5.8\msys\CORE\我正在运行Windows7并尝试在Aptana3中构建我的Rails项目。我的Ruby是1.9.3。$gemin
我已经开始使用mysql2gem。我试图弄清楚一些基本的事情——其中之一是如何明确地执行事务(对于批处理操作,比如多个INSERT/UPDATE查询)。在旧的ruby-mysql中,这是我的方法:client=Mysql.real_connect(...)inserts=["INSERTINTO...","UPDATE..WHEREid=..",#etc]client.autocommit(false)inserts.eachdo|ins|beginclient.query(ins)rescue#handleerrorsorabortentirelyendendclient.commi
Ruby有一些不错的文档生成器,例如Yard、rDoc,甚至Glyph。问题是Sphinx可以做网站、PDF、epub、LaTex等。它在重组文本中完成所有这些事情。在Ruby世界中有替代方案吗?也许是程序的组合?如果我也能使用Markdown就更好了。 最佳答案 自1.0版以来,Sphinx有了“域”的概念,它是从Python和/或C以外的语言标记代码实体(如方法调用、对象、函数等)的方法。有一个rubydomain,所以你可以只使用Sphinx本身。您唯一会缺少的(我认为)是Sphinx使用autodoc从源代码自动创建文档
我正在尝试绕过rails配置这个极其复杂的迷宫。到目前为止,我设法在ubuntu上设置了rvm(出于某种原因,ruby在ubuntu存储库中已经过时了)。我设法建立了一个Rails项目。我希望我的测试项目使用mysql而不是mysqlite。当我尝试“rakedb:migrate”时,出现错误:“!!!缺少mysql2gem。将其添加到您的Gemfile:gem'mysql2'”当我尝试“geminstallmysql”时,出现错误,告诉我需要为安装命令提供参数。但是,参数列表很大,我不知道该选择哪些。如何通过在ubuntu上运行的rvm和mysql获取rails3?谢谢。