predict

python - 值错误 : feature_names mismatch: in xgboost in the predict() function

我训练了一个XGBoostRegressor模型。当我必须使用这个经过训练的模型来预测新输入时，predict()函数会抛出feature_names不匹配错误，尽管输入特征向量与训练数据具有相同的结构。此外，为了构建与训练数据具有相同结构的特征向量，我做了很多低效的处理，例如添加新的空列(如果数据不存在)，然后重新排列数据列，以便它与培训结构相匹配。是否有更好、更简洁的方式来格式化输入以使其与训练结构相匹配？最佳答案在这种情况下，模型构建时列名的顺序与模型评分时列名的顺序不同。我已经使用以下步骤来克服这个错误先加载pickle

feature_names mismatch section 训练 code python pandas machine-learning regression xgboost

python - 如何知道 Scikit-learn 中 predict_proba 的返回数组中表示哪些类

我从Scikit-learn开始......>>>importsklearn>>>sklearn.__version__'0.13.1'>>>fromsklearnimportsvm>>>model=svm.SVC(probability=True)>>>X=[[1,2,3],[2,3,4]]#featurevectors>>>Y=['apple','orange']#classes>>>model.fit(X,Y)>>>model.predict_proba([1,2,3])array([[0.39097541,0.60902459]])我怎么知道哪个类应该是哪个？

中表 predict_proba gt section model python scikit-learn

python - 如何将 predict_generator 与 ImageDataGenerator 一起使用？

我是Keras的新手。我训练了一个模型并想预测存储在子文件夹中的一些图像(例如用于训练)。为了进行测试，我想预测7个类(子文件夹)中的2个图像。下面的test_generator看到了14张图像，但我得到了196个预测。错误在哪里？非常感谢!test_datagen=ImageDataGenerator(rescale=1./255)test_generator=test_datagen.flow_from_directory(test_dir,target_size=(200,200),color_mode="rgb",shuffle="false",class_mode='cate

ImageDataGenerator predict_generator generator code test_generator python machine-learning keras deep-learning

python - cross_val_score 和 cross_val_predict 的区别

我想评估一个使用交叉验证的scikitlearn构建的回归模型，我很困惑，我应该使用cross_val_score和cross_val_predict这两个函数中的哪一个。一种选择是:cvs=DecisionTreeRegressor(max_depth=depth)scores=cross_val_score(cvs,predictors,target,cv=cvfolds,scoring='r2')print("R2-Score:%0.2f(+/-%0.2f)"%(scores.mean(),scores.std()*2))另一个，使用标准r2_score的cv预测:cvp=Dec

cross cross_val_predict code python machine-learning scikit-learn regression cross-validation

python - Keras 模型的 predict 和 predict_on_batch 方法有什么区别？

根据kerasdocumentation:predict_on_batch(self,x)Returnspredictionsforasinglebatchofsamples.但是，在批处理上调用标准predict方法似乎没有任何区别，无论它是一个元素还是多个元素。model.predict_on_batch(np.zeros((n,d_in)))与相同model.predict(np.zeros((n,d_in)))(形状为(n，d_out)的numpy.ndarray 最佳答案不同之处在于当您传递大于一批的x数据时。predi

predict predict_on_batch code section python deep-learning keras

python - scikit-learn cross_val_predict 准确度分数是如何计算的？

cross_val_predict(参见doc，v0.18)是否使用如下代码所示的k-fold方法计算每个折叠的准确度并最终平均它们或不？cv=KFold(len(labels),n_folds=20)clf=SVC()ypred=cross_val_predict(clf,td,labels,cv=cv)accuracy=accuracy_score(labels,ypred)printaccuracy 最佳答案不，它没有!根据crossvalidationdoc页面，cross_val_predict不返回任何分数，而只返回基

cross_val_predict scikit-learn code 39 labels python cross-validation

python - LogisticRegression.predict_proba 的 scikit-learn 返回值

LogisticRegression.predict_proba函数究竟返回什么？在我的示例中，我得到如下结果:[[4.65761066e-039.95342389e-01][9.75851270e-012.41487300e-02][9.99983374e-011.66258341e-05]]从其他计算中，我知道，使用sigmoid函数，第二列是概率。documentation说，第一列是n_samples，但那不可能，因为我的示例是评论，是文本而不是数字。文档还说，第二列是n_classes。这当然不可能，因为我只有两个类(即+1和-1)，并且该函数应该是关于计算样本真正存在的概率

LogisticRegression predict_proba code section python machine-learning scikit-learn probability logistic-regression

python - predict_proba 用于交叉验证模型

我想通过交叉验证从逻辑回归模型预测概率。我知道您可以获得交叉验证分数，但是否可以从predict_proba返回值而不是分数？#importsfromsklearn.linear_modelimportLogisticRegressionfromsklearn.cross_validationimport(StratifiedKFold,cross_val_score,train_test_split)fromsklearnimportdatasets#setupdatairis=datasets.load_iris()X=iris.datay=iris.target#setupmod

predict_proba predict section cross python scikit-learn logistic-regression cross-validation

python - keras:model.predict和model.predict_proba有什么区别

我发现model.predict和model.predict_proba都给出了相同的2D矩阵，表示每一行的每个类别的概率。这两个函数有什么区别？最佳答案预测predict(self,x,batch_size=32,verbose=0)为输入样本生成输出预测，以批处理方式处理样本。参数x:theinputdata,asaNumpyarray.batch_size:integer.verbose:verbositymode,0or1.返回ANumpyarrayofpredictions.predict_probapredict_p

predict model code strong python machine-learning deep-learning keras

python - 请求例如 : Recurrent neural network for predicting next value in a sequence

谁能给我一个(pybrain)python中递归神经网络的实际示例，以预测序列的下一个值？(我已经阅读了pybrain文档，我认为没有明确的例子。)我还发现了这个question.但是我看不到它在更一般的情况下是如何工作的。因此，我想问这里是否有人可以提出一个如何使用循环神经网络预测pybrain中序列的下一个值的清晰示例。举个例子。例如，我们有一个[1,7]范围内的数字序列。Firstrun(Sofirstexample):124623451356714712356Secondrun(Sosecondexample):125624451256714612336Thirdrun(Sot

predicting Recurrent pybrain code section python machine-learning neural-network time-series

6 7 8910 11