jjzjj

Classification

全部标签

用于商业用途的 Java 机器学习库?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion有人知道我可以用于商业产品的优秀Java机器学习库吗?不幸的是,Weka和Rapidminer不允许这样做。我已经找到了ApacheMahout和JavaDataMininngPackage.有没有人使用过它们并提供一些决策支持?该任务需要聚类和分类算法。

Blockchain classification区块链分类

目录1.publicblockchain2.privateblockchain3.consortiumblockchain区块链采用不同的共识机制,区块链分为三类:公链、私链、联盟链。1.publicblockchain公链公开、透明的,信息对任何人都可见;任何人都可以在链上发起交易,任何人都可以按共识接入区块链。没有人可以修改链上数据、也没有机构或组织能够关闭一条公链,公链只会因为失去共识而凋零2.privateblockchain私链是不公开、只有被授权的节点才可以参与并查看数据的私有区块链,也称为permissionedblockchain。私有链通常用于组织内部,链的读写权限掌握在某个

java - Lucene:异常 - 查询解析器在 "some word"之后遇到 <EOF>

我正在研究一个分类问题,使用LuceneAPI根据训练数据将产品评论分类为正面、负面或中立。我正在使用一个包含评论对象的数组列表-“reviewList”,它在抓取网页时存储每个评论的属性。然后使用索引器对包括“极性”和“评论内容”的评论属性进行索引。然后,根据索引对象,我需要对剩余的评论对象进行分类。但是在这样做的同时,有一个审查对象,查询解析器在“审查内容”中遇到EOF字符,因此终止。导致错误的行已相应注释-IndexReaderreader=IndexReader.open(FSDirectory.open(newFile("index")));IndexSearchersear

python - Keras:binary_crossentropy 和 categorical_crossentropy 混淆

在使用TensorFlow一段时间后,我阅读了一些Keras教程并实现了一些示例。我找到了几个使用keras.losses.binary_crossentropy作为损失函数的卷积自动编码器的教程。我认为binary_crossentropy应该不是一个多类损失函数并且很可能会使用二进制标签,但实际上Keras(TFPython后端)调用tf.nn.sigmoid_cross_entropy_with_logits,它实际上用于具有不互斥的多个独立类的分类任务。另一方面,我对categorical_crossentropy的期望是用于多类分类,其中目标类有相互依赖,但不一定是一个-热编

python - 多项式朴素贝叶斯参数 alpha 设置? scikit学习

有谁知道在做朴素贝叶斯分类时如何设置alpha参数吗?例如我首先使用词袋构建特征矩阵,矩阵的每个单元格都是词的计数,然后我使用tf(termfrequency)对矩阵进行归一化。但是当我使用朴素贝叶斯构建分类器模型时,我选择使用多项式N.B(我认为这是正确的,而不是伯努利和高斯)。默认的alpha设置是1.0(文档说它是拉普拉斯平滑,我不知道是什么)。结果真的很糟糕,只有21%的召回率找到了正类(目标类)。但是当我设置alpha=0.0001(我随机选择)时,结果得到95%的召回率。此外,我检查了多项式N.Bformula,我认为这是因为alpha问题,因为如果我使用单词计数作为特征,

python - Scikit 学习错误消息 'Precision and F-score are ill-defined and being set to 0.0 in labels'

这个问题在这里已经有了答案:UndefinedMetricWarning:F-scoreisill-definedandbeingsetto0.0inlabelswithnopredictedsamples(7个答案)ClassificationReport-PrecisionandF-scoreareill-defined(2个答案)关闭去年。我正在研究二元分类模型,分类器是朴素贝叶斯。我有一个几乎平衡的数据集,但是我在预测时收到以下错误消息:UndefinedMetricWarning:PrecisionandF-scoreareill-definedandbeingsetto0.

python - SkLearn 多项式 NB : Most Informative Features

由于我的分类器在测试数据上产生了大约99%的准确率,我有点怀疑并想深入了解我的NB分类器最有用的特征,看看它正在学习什么样的特征。以下主题非常有用:Howtogetmostinformativefeaturesforscikit-learnclassifiers?至于我的特征输入,我仍在尝试,目前我正在使用CountVectorizer测试一个简单的unigram模型:vectorizer=CountVectorizer(ngram_range=(1,1),min_df=2,stop_words='english')关于上述主题,我发现了以下函数:defshow_most_inform

python - 如何在 sklearn 中使用 OneHotEncoder 的输出?

我有一个带有2个分类变量、ID变量和一个目标变量(用于分类)的PandasDataframe。我设法用OneHotEncoder转换分类值。这导致稀疏矩阵。ohe=OneHotEncoder()#FirstIremappedthestringvaluesinthecategoricalvariablestointegersasOneHotEncoderneedsintegersasinput...remappingcode...ohe.fit(df[['col_a','col_b']])ohe.transform(df[['col_a','col_b']])但我不知道如何在Decisi

python - 如何在 Scikit 中计算多类分类的混淆矩阵?

我有一个多类分类任务。当我基于scikitexample运行我的脚本时如下:classifier=OneVsRestClassifier(GradientBoostingClassifier(n_estimators=70,max_depth=3,learning_rate=.02))y_pred=classifier.fit(X_train,y_train).predict(X_test)cnf_matrix=confusion_matrix(y_test,y_pred)我收到这个错误:File"C:\ProgramData\Anaconda2\lib\site-packages\s

python - 从 python 输出创建 ARFF 文件

gardai-plan-crackdown-on-troublemakers-at-protest-2438316.html':{'dail':1,'focus':1,'actions':1,'trade':2,'protest':1,'identify':1,'previous':1,'detectives':1,'republican':1,'group':1,'monitor':1,'clashes':1,'civil':1,'charge':1,'breaches':1,'travelling':1,'main':1,'disrupt':1,'real':1,'policing