jjzjj

python - 值错误 : feature_names mismatch: in xgboost in the predict() function

我训练了一个XGBoostRegressor模型。当我必须使用这个经过训练的模型来预测新输入时,predict()函数会抛出feature_names不匹配错误,尽管输入特征向量与训练数据具有相同的结构。此外,为了构建与训练数据具有相同结构的特征向量,我做了很多低效的处理,例如添加新的空列(如果数据不存在),然后重新排列数据列,以便它与培训结构相匹配。是否有更好、更简洁的方式来格式化输入以使其与训练结构相匹配? 最佳答案 在这种情况下,模型构建时列名的顺序与模型评分时列名的顺序不同。我已经使用以下步骤来克服这个错误先加载pickle

python - 如何知道 Scikit-learn 中 predict_proba 的返回数组中表示哪些类

我从Scikit-learn开始......>>>importsklearn>>>sklearn.__version__'0.13.1'>>>fromsklearnimportsvm>>>model=svm.SVC(probability=True)>>>X=[[1,2,3],[2,3,4]]#featurevectors>>>Y=['apple','orange']#classes>>>model.fit(X,Y)>>>model.predict_proba([1,2,3])array([[0.39097541,0.60902459]])我怎么知道哪个类应该是哪个?

python - 如何将 predict_generator 与 ImageDataGenerator 一起使用?

我是Keras的新手。我训练了一个模型并想预测存储在子文件夹中的一些图像(例如用于训练)。为了进行测试,我想预测7个类(子文件夹)中的2个图像。下面的test_generator看到了14张图像,但我得到了196个预测。错误在哪里?非常感谢!test_datagen=ImageDataGenerator(rescale=1./255)test_generator=test_datagen.flow_from_directory(test_dir,target_size=(200,200),color_mode="rgb",shuffle="false",class_mode='cate

python - cross_val_score 和 cross_val_predict 的区别

我想评估一个使用交叉验证的scikitlearn构建的回归模型,我很困惑,我应该使用cross_val_score和cross_val_predict这两个函数中的哪一个。一种选择是:cvs=DecisionTreeRegressor(max_depth=depth)scores=cross_val_score(cvs,predictors,target,cv=cvfolds,scoring='r2')print("R2-Score:%0.2f(+/-%0.2f)"%(scores.mean(),scores.std()*2))另一个,使用标准r2_score的cv预测:cvp=Dec

python - Keras 模型的 predict 和 predict_on_batch 方法有什么区别?

根据kerasdocumentation:predict_on_batch(self,x)Returnspredictionsforasinglebatchofsamples.但是,在批处理上调用标准predict方法似乎没有任何区别,无论它是一个元素还是多个元素。model.predict_on_batch(np.zeros((n,d_in)))与相同model.predict(np.zeros((n,d_in)))(形状为(n,d_out)的numpy.ndarray 最佳答案 不同之处在于当您传递大于一批的x数据时。predi

python - scikit-learn cross_val_predict 准确度分数是如何计算的?

cross_val_predict(参见doc,v0.18)是否使用如下代码所示的k-fold方法计算每个折叠的准确度并最终平均它们或不?cv=KFold(len(labels),n_folds=20)clf=SVC()ypred=cross_val_predict(clf,td,labels,cv=cv)accuracy=accuracy_score(labels,ypred)printaccuracy 最佳答案 不,它没有!根据crossvalidationdoc页面,cross_val_predict不返回任何分数,而只返回基

python - LogisticRegression.predict_proba 的 scikit-learn 返回值

LogisticRegression.predict_proba函数究竟返回什么?在我的示例中,我得到如下结果:[[4.65761066e-039.95342389e-01][9.75851270e-012.41487300e-02][9.99983374e-011.66258341e-05]]从其他计算中,我知道,使用sigmoid函数,第二列是概率。documentation说,第一列是n_samples,但那不可能,因为我的示例是评论,是文本而不是数字。文档还说,第二列是n_classes。这当然不可能,因为我只有两个类(即+1和-1),并且该函数应该是关于计算样本真正存在的概率

python - predict_proba 用于交叉验证模型

我想通过交叉验证从逻辑回归模型预测概率。我知道您可以获得交叉验证分数,但是否可以从predict_proba返回值而不是分数?#importsfromsklearn.linear_modelimportLogisticRegressionfromsklearn.cross_validationimport(StratifiedKFold,cross_val_score,train_test_split)fromsklearnimportdatasets#setupdatairis=datasets.load_iris()X=iris.datay=iris.target#setupmod

python - keras:model.predict和model.predict_proba有什么区别

我发现model.predict和model.predict_proba都给出了相同的2D矩阵,表示每一行的每个类别的概率。这两个函数有什么区别? 最佳答案 预测predict(self,x,batch_size=32,verbose=0)为输入样本生成输出预测,以批处理方式处理样本。参数x:theinputdata,asaNumpyarray.batch_size:integer.verbose:verbositymode,0or1.返回ANumpyarrayofpredictions.predict_probapredict_p

python - 请求例如 : Recurrent neural network for predicting next value in a sequence

谁能给我一个(pybrain)python中递归神经网络的实际示例,以预测序列的下一个值?(我已经阅读了pybrain文档,我认为没有明确的例子。)我还发现了这个question.但是我看不到它在更一般的情况下是如何工作的。因此,我想问这里是否有人可以提出一个如何使用循环神经网络预测pybrain中序列的下一个值的清晰示例。举个例子。例如,我们有一个[1,7]范围内的数字序列。Firstrun(Sofirstexample):124623451356714712356Secondrun(Sosecondexample):125624451256714612336Thirdrun(Sot