jjzjj

rapidminer

全部标签

regex - 如何在使用正则表达式 Windows csv 时保留换行符

我正在尝试在Windows8机器上的Rapidminer中使用正则表达式来保留csv文件中与特定字符串匹配的行。我编写了选择正确行的正则表达式,但输出不保留换行符并显示为连续字符串。对于如何保留换行符的任何建议,我将不胜感激。我的文件看起来像这样:"ABCDEF","text",numbers,"JAN1,2014","text",numbers,10"BCDEFG","text",numbers,"JAN1,2014","text",numbers,1"CDEFGH","text",numbers,"FEB1,2014","text",numbers,12"CDEFGH","text

如何从RapidMiner中的聚类方法中计算戴维斯·博尔丁?

我想在没有K均值的情况下群集数据。例如,我更喜欢与DBSCAN或支持向量群集聚类。因此,我需要评估使用DaviesBouldinMetric的聚类的性能,但我不知道如何计算Rapidminer中的DaviesBouldin进行DBSCAN或支持向量群集。请帮我。谢谢你。看答案运营商ClusterDistancePerformance允许计算戴维斯-博尔丁的有效性度量。这需要一个包含群集质心的群集模型将其传递给它,这意味着无法与dbscan这样的方法和支持向量群集,因为它们不产生群集质心。

apache-spark - 在 rapidminer : error occurred during submitting or starting the spark job 上运行 Spark

我正在使用rapidminer从大型数据集中提取规则。Radoop是hadoop生态系统的扩展,而sparkRM运算符允许进行fp-growth,从从hive检索数据到探索分析。我正在尝试:-Windows8.1-hadoop6.2-Spark1.5-hive2.1我已将spark-default-conf配置如下:#spark.masteryarn#spark.eventLog.enabledtrue#spark.eventLog.dirhdfs://namenode:8021/directory#spark.serializerorg.apache.spark.serializer