Classification

用于商业用途的 Java 机器学习库？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭6年前。Improvethisquestion有人知道我可以用于商业产品的优秀Java机器学习库吗？不幸的是，Weka和Rapidminer不允许这样做。我已经找到了ApacheMahout和JavaDataMininngPackage.有没有人使用过它们并提供一些决策支持？该任务需要聚类和分类算法。

用途 Java section class noreferrer machine-learning cluster-analysis classification

Blockchain classification区块链分类

目录1.publicblockchain2.privateblockchain3.consortiumblockchain区块链采用不同的共识机制，区块链分为三类：公链、私链、联盟链。1.publicblockchain公链公开、透明的，信息对任何人都可见；任何人都可以在链上发起交易，任何人都可以按共识接入区块链。没有人可以修改链上数据、也没有机构或组织能够关闭一条公链，公链只会因为失去共识而凋零2.privateblockchain私链是不公开、只有被授权的节点才可以参与并查看数据的私有区块链，也称为permissionedblockchain。私有链通常用于组织内部，链的读写权限掌握在某个

区块 classification xff0c blockchain xff0 区块链公链

java - Lucene:异常 - 查询解析器在 "some word"之后遇到 <EOF>

我正在研究一个分类问题，使用LuceneAPI根据训练数据将产品评论分类为正面、负面或中立。我正在使用一个包含评论对象的数组列表-“reviewList”，它在抓取网页时存储每个评论的属性。然后使用索引器对包括“极性”和“评论内容”的评论属性进行索引。然后，根据索引对象，我需要对剩余的评论对象进行分类。但是在这样做的同时，有一个审查对象，查询解析器在“审查内容”中遇到EOF字符，因此终止。导致错误的行已相应注释-IndexReaderreader=IndexReader.open(FSDirectory.open(newFile("index")));IndexSearchersear

amp Lucene QueryParser apache java classification query-parser

python - Keras:binary_crossentropy 和 categorical_crossentropy 混淆

在使用TensorFlow一段时间后，我阅读了一些Keras教程并实现了一些示例。我找到了几个使用keras.losses.binary_crossentropy作为损失函数的卷积自动编码器的教程。我认为binary_crossentropy应该不是一个多类损失函数并且很可能会使用二进制标签，但实际上Keras(TFPython后端)调用tf.nn.sigmoid_cross_entropy_with_logits，它实际上用于具有不互斥的多个独立类的分类任务。另一方面，我对categorical_crossentropy的期望是用于多类分类，其中目标类有相互依赖，但不一定是一个-热编

crossentropy categorical_crossentropy code python tensorflow keras classification cross-entropy

python - 多项式朴素贝叶斯参数 alpha 设置？ scikit学习

有谁知道在做朴素贝叶斯分类时如何设置alpha参数吗？例如我首先使用词袋构建特征矩阵，矩阵的每个单元格都是词的计数，然后我使用tf(termfrequency)对矩阵进行归一化。但是当我使用朴素贝叶斯构建分类器模型时，我选择使用多项式N.B(我认为这是正确的，而不是伯努利和高斯)。默认的alpha设置是1.0(文档说它是拉普拉斯平滑，我不知道是什么)。结果真的很糟糕，只有21%的召回率找到了正类(目标类)。但是当我设置alpha=0.0001(我随机选择)时，结果得到95%的召回率。此外，我检查了多项式N.Bformula，我认为这是因为alpha问题，因为如果我使用单词计数作为特征，

贝叶朴素 section alpha python scikit-learn classification naivebayes

python - Scikit 学习错误消息 'Precision and F-score are ill-defined and being set to 0.0 in labels'

这个问题在这里已经有了答案:UndefinedMetricWarning:F-scoreisill-definedandbeingsetto0.0inlabelswithnopredictedsamples(7个答案)ClassificationReport-PrecisionandF-scoreareill-defined(2个答案)关闭去年。我正在研究二元分类模型，分类器是朴素贝叶斯。我有一个几乎平衡的数据集，但是我在预测时收到以下错误消息:UndefinedMetricWarning:PrecisionandF-scoreareill-definedandbeingsetto0.

ill-defined Precision section train 39 python scikit-learn classification

python - SkLearn 多项式 NB : Most Informative Features

由于我的分类器在测试数据上产生了大约99%的准确率，我有点怀疑并想深入了解我的NB分类器最有用的特征，看看它正在学习什么样的特征。以下主题非常有用:Howtogetmostinformativefeaturesforscikit-learnclassifiers?至于我的特征输入，我仍在尝试，目前我正在使用CountVectorizer测试一个简单的unigram模型:vectorizer=CountVectorizer(ngram_range=(1,1),min_df=2,stop_words='english')关于上述主题，我发现了以下函数:defshow_most_inform

Informative Features 16.2420 2420 section python machine-learning scikit-learn classification text-classification

python - 如何在 sklearn 中使用 OneHotEncoder 的输出？

我有一个带有2个分类变量、ID变量和一个目标变量(用于分类)的PandasDataframe。我设法用OneHotEncoder转换分类值。这导致稀疏矩阵。ohe=OneHotEncoder()#FirstIremappedthestringvaluesinthecategoricalvariablestointegersasOneHotEncoderneedsintegersasinput...remappingcode...ohe.fit(df[['col_a','col_b']])ohe.transform(df[['col_a','col_b']])但我不知道如何在Decisi

OneHotEncoder 何在 39 code section python pandas scikit-learn classification one-hot-encoding

python - 如何在 Scikit 中计算多类分类的混淆矩阵？

我有一个多类分类任务。当我基于scikitexample运行我的脚本时如下:classifier=OneVsRestClassifier(GradientBoostingClassifier(n_estimators=70,max_depth=3,learning_rate=.02))y_pred=classifier.fit(X_train,y_train).predict(X_test)cnf_matrix=confusion_matrix(y_test,y_pred)我收到这个错误:File"C:\ProgramData\Anaconda2\lib\site-packages\s

中计混淆 code section confusion_matrix python scikit-learn classification confusion-matrix

python - 从 python 输出创建 ARFF 文件

gardai-plan-crackdown-on-troublemakers-at-protest-2438316.html':{'dail':1,'focus':1,'actions':1,'trade':2,'protest':1,'identify':1,'previous':1,'detectives':1,'republican':1,'group':1,'monitor':1,'clashes':1,'civil':1,'charge':1,'breaches':1,'travelling':1,'main':1,'disrupt':1,'real':1,'policing

python ARFF 39 section file classification weka

3 4 567 8 9