jjzjj

DataStax

全部标签

hadoop - DSE 4 分析节点 ~ 它是否并且应该有数据?

我们一直想知道为什么我们的一个集群显示分析节点拥有数据。为了便于阅读,我编辑了ips、token和主机ID%nodetoolstatusDatacenter:Cassandra=====================Status=Up/Down|/State=Normal/Leaving/Joining/Moving--AddressLoadOwnsHostIDTokenRackUN172.32.x.x46.83GB18.5%someguid0rack1UN172.32.x.x60.26GB33.3%anotherguidranbignumberrack1UN172.32.x.x63

java - 为什么最新版本的 apache-cassandra-X.X.X.jar 中没有类 CqlStorage

类org.apache.cassandra.hadoop.pig.CqlStorage是一个pigCassandra驱动程序。此类存在于以下Cassandra版本中,2.0.5(apache-cassandra-2.0.5.jar)2.1.12(apache-cassandra-2.1.12.jar)但在最新版本中缺少它2.2.4(apache-cassandra-2.2.4.jar)3.0.0(apache-cassandra-3.0.0-alpha1.jar)不确定它为什么停产以及相同的替代品是什么。 最佳答案 在这里查看关于它

hadoop - Cassandra 是用于 OLAP 还是 OLTP 或两者?

Cassandra不像RDBMS那样遵守ACID,而是CAP。因此,Cassandra从CAP中挑选出AP,并将其留给用户来调整一致性。我绝对不能将Cassandra用于核心银行交易,因为C*稍微不一致。但Cassandra的写入速度非常快,这对OLTP非常有利。我可以将C*用于OLAP,因为读取速度非常快,这也有利于报告。所以我知道只有当您的应用程序不需要您的数据在一段时间内保持一致但读写应该很快时,C*才是好的?如果我的理解是正确的,请列出一些应用程序? 最佳答案 ACID是关系数据库的属性,其中BASE是大多数nosql数据库

hadoop - Pig & Cassandra & DataStax 拆分控制

我一直在使用Pig和我的Cassandra数据来完成各种惊人的分组壮举,这些壮举几乎不可能用命令式编写。我正在使用DataStax的Hadoop和Cassandra集成,我不得不说它非常令人印象深刻。向那些家伙致敬!!我有一个非常小的沙盒集群(2节点),我正在其中对这个系统进行一些测试。我有一个CQL表,它有~53M行(每个大约350字节),我注意到Mapper稍后需要很长时间来处理这53M行。我开始查看日志,发现map反复溢出(我从映射器中看到177次溢出),我认为这是问题的一部分。CassandraInputFormat和JobConfig的组合只创建了一个映射器,所以这个映射器必

mysql - C* 端的过滤器 - 将过滤器/范围查询从 Spark 下推到 C*

我使用datastax/spark-cassandra-connector和填充了1B+行的C*表(datastax-enterprisedse4.7.0)开发spark1.2.1。我需要对时间戳参数执行范围过滤器/where查询。在不加载整个1B+行表以激发内存(可能需要数小时才能完成)并且实际上将查询推回C*的情况下,最好的方法是什么?将rdd与JoinWithCassandraTable结合使用,还是将数据框与下推结合使用?还有别的吗? 最佳答案 JoinWithCassandraTable成为我的最佳解决方案。我从这篇文章中

java - Cassandra Datastax 驱动程序 - 连接池

我正在尝试了解DatastaxCassandraDriver中的连接池,以便在我的网络服务中更好地使用它。我有1.0版的文档。它说:TheJavadriverusesconnectionsasynchronously,somultiplerequestscanbesubmittedonthesameconnectionatthesametime.他们通过联系了解什么?当连接到集群时,我们有:一个构建器、一个集群和一个session。其中哪一个是连接?比如有这个参数:maxSimultaneousRequestsPerConnection-numberofsimultaneousrequ

java - 从 java.util.Date 获取年份

我在Cassandra列族中有一个日期列。当我使用datastaxjavaAPI从这个CF检索数据时,这个日期对象可以作为java.util.Date对象。它有一个getYear()方法,但已弃用。相应的javadoc说:AsofJDKversion1.1,replacedbyCalendar.get(Calendar.YEAR)-1900.如何从这个日期对象中正确获取年、月、日属性? 最佳答案 你能试试吗;//createacalendarCalendarcal=Calendar.getInstance();cal.setTime

java - 使用 "executeAsync"时如何限制对 cassandra 的写入请求?

我正在使用datastaxjava驱动程序3.1.0连接到cassandra集群,我的cassandra集群版本是2.0.10。我正在以QUORUM一致性异步编写。privatefinalExecutorServiceexecutorService=Executors.newFixedThreadPool(10);publicvoidsave(Stringprocess,intclientid,longdeviceid){Stringsql="insertintostorage(process,clientid,deviceid)values(?,?,?)";try{BoundStat

java - cassandra的cqlsh控制台操作超时错误

我有一个三节点Cassandra集群,我创建了一个包含超过2,000,000行的表。当我在cqlsh中执行此(selectcount(*)fromuserdetails)查询时,出现此错误:OperationTimedOut:errors={},last_host=192.168.1.2当我为更少的行或限制为50,000运行计数函数时,它工作正常。 最佳答案 count(*)实际上是对所有数据进行分页。因此,没有限制的selectcount(*)fromuserdetails预计会在有那么多行时超时。这里有一些细节:http://p

python - Datastax cassandra-driver (python) 导入失败

导入datastaxcassandra-driver(python)时出现如下错误错误File"cassandra.py",line1,infromcassandra.clusterimportClusterFile"/home/vagrant/cassandra.py",line1,infromcassandra.clusterimportClusterImportError:Nomodulenamedcluster这是代码fromcassandra.clusterimportClusterprintdir(cassandra.cluster)cluster=Cluster()ses