jjzjj

mysql - 大数据集——NoSQL、NewSQL、SQL..?脑炒

我需要一些建议。我在数据挖掘领域的一家新公司工作。这基本上是一个研究项目的副产品。无论如何,我们拥有大量非结构化数据,我们正在对这些数据进行各种NLP、分类和聚类分析。我们有数以百万计的消息,包括推特消息、博客帖子、论坛帖子、新论文、报告等……所有文本。总而言之,我们正在获取大约300GB以上的文本数据并且每天都在增长(每天增长大约10GB)!因此,我们需要在某个地方以一种我们可以实际处理和查询并获得相对实时结果的格式存储所有这些信息。我们需要在某个地方存储这些数据的任何方式...由于这是一家新公司,我们真的不能/不想为许可产品付费,例如VoltDB、Oracle等企业版遥不可及。我认

mysql - NewSQL 与传统优化/分片

就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter为指导。8年前关闭。我们是一家小型初创公司,拥有大量写入的SAAS应用程序,并且(终于!)到了我们的使用出现扩展问题的地步。我们有一个小团队,因此我们非常感谢能够将系统管理员卸载到Heroku和RDS。虽然Heroku(大部分)很好,但我们在RDS方面存在一些问题:缩放。这是最大的担忧。我们目前运行一个XLRDS实例。通过简单的优化,我们将能够坚持一段时间,但除非我们对我们的应

mysql - NewSQL 与传统优化/分片

就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter为指导。8年前关闭。我们是一家小型初创公司,拥有大量写入的SAAS应用程序,并且(终于!)到了我们的使用出现扩展问题的地步。我们有一个小团队,因此我们非常感谢能够将系统管理员卸载到Heroku和RDS。虽然Heroku(大部分)很好,但我们在RDS方面存在一些问题:缩放。这是最大的担忧。我们目前运行一个XLRDS实例。通过简单的优化,我们将能够坚持一段时间,但除非我们对我们的应

sql - 可扩展的 RDBMS 替代方案、NoSQL、NewSQL

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭4年前。Improvethisquestion我正在寻找传统DBMS(如PostgreSQL或MySQL)的可扩展替代方案。在传统数据库中我没有以下特性:自动分片以确保线性可扩展性。具有自动故障转移和恢复功能的复制以确保高可用性。没有单点故障。如果我可以牺牲事务,MongoDB看起来是个不错的选择。我还查看了几个新的SQL数据库。NewSQL似乎适合我的目的:VoltDB、TiDB、cockroachDB。但我担

分库分表真的适合你的系统吗?聊聊分库分表和NewSQL如何选择

曾几何时,“并发高就分库,数据大就分表”已经成了处理MySQL数据增长问题的圣经。面试官喜欢问,博主喜欢写,候选人也喜欢背,似乎已经形成了一个闭环。但你有没有思考过,分库分表真的适合你的系统吗?分表在业务刚刚发展起来的时候,流量全部打到了一个MySQL上,用户信息全落到了user表。后来,user表的数据量越来越大了。于是,你做了一次垂直拆分,将原来的user表拆分成了新的user表和user_details表。这样一拆之后,用户的信息分散到两个表,user表的数据量一下就变小了,user表数据量过大的问题暂时就解决了。但随着业务的发展,线上的流量越来越大,单个MySQL已经扛不住流量的压力了

分库分表真的适合你的系统吗?聊聊分库分表和NewSQL如何选择

曾几何时,“并发高就分库,数据大就分表”已经成了处理MySQL数据增长问题的圣经。面试官喜欢问,博主喜欢写,候选人也喜欢背,似乎已经形成了一个闭环。但你有没有思考过,分库分表真的适合你的系统吗?分表在业务刚刚发展起来的时候,流量全部打到了一个MySQL上,用户信息全落到了user表。后来,user表的数据量越来越大了。于是,你做了一次垂直拆分,将原来的user表拆分成了新的user表和user_details表。这样一拆之后,用户的信息分散到两个表,user表的数据量一下就变小了,user表数据量过大的问题暂时就解决了。但随着业务的发展,线上的流量越来越大,单个MySQL已经扛不住流量的压力了