SKlearn

python - ImportError : No module named sklearn. 预处理

我按照这些instructions在Ubuntu上成功安装了scikit-learn.但是，当我运行使用它的程序时出现此错误:Traceback(mostrecentcalllast):File"begueradj.py",line10,infromsklearn.preprocessingimportnormalizeImportError:Nomodulenamedsklearn.preprocessing我该如何解决这个问题？最佳答案您链接到的教程中给出的说明对于Ubuntu14.04已过时。Ubuntu14.04包名为p

python - 具有一个(或多个)参数的 Python 多输出回归或分类器

我使用Python的Scikit-learn库编写了一个简单的线性回归和决策树分类器代码来预测结果。它运行良好。我的问题是，有没有一种方法可以反向执行此操作，以根据推算结果(准确度最高的参数)预测参数值的最佳组合。或者我可以这样问，是否有分类、回归或其他类型的算法(决策树、SVM、KNN、逻辑回归、线性回归、多项式回归...)可以基于一个结果预测多个结果(或更多)参数？我尝试通过放置多变量结果来做到这一点，但它显示错误:ValueError:Expected2Darray,got1Darrayinstead:array=[101905182268646624465].Reshapeyo

具有一 python 39 sklearn variables machine-learning scikit-learn

python - 使用来自 sklearn.feature_extraction.text.TfidfVectorizer 的 TfidfVectorizer 计算 IDF

我认为函数TfidfVectorizer没有正确计算IDF因子。例如，从tf-idffeatureweightsusingsklearn.feature_extraction.text.TfidfVectorizer复制代码:fromsklearn.feature_extraction.textimportTfidfVectorizercorpus=["Thisisverystrange","Thisisverynice"]vectorizer=TfidfVectorizer(use_idf=True,#utilizaoidfcomopeso,fazendotf*idfnorm=Non

TfidfVectorizer feature_extraction code idf python scikit-learn

python - Sklearn : Alternative Dim Reduction? 中的 PCA 内存错误

我试图在Sklearn中使用PCA来减少一个非常大的矩阵的维数，但它会产生内存错误(所需的RAM超过128GB)。我已经设置了copy=False并且我正在使用计算成本较低的随机PCA。有解决办法吗？如果不是，我可以使用哪些其他需要更少内存的暗淡减少技术。谢谢。更新:我尝试PCA的矩阵是一组特征向量。它来自通过预训练的CNN传递一组训练图像。矩阵是[300000,51200]。尝试的PCA组件:100到500。我想降低它的维度，以便我可以使用这些功能来训练ML算法，例如XGBoost。谢谢。最佳答案最后，我使用了Truncate

Alternative Reduction section features train_features python multidimensional-array scikit-learn pca

python - 使用 sklearn 和线性回归时出错 : shapes (1, 16) 和 (1,1) 未对齐 : 16 (dim 1) ! = 1 (dim 0)

我想学习机器学习，偶然发现了youtubesiraj和他的Udacity视频，想尝试学习一些东西。他的引用视频:https://www.youtube.com/watch?v=vOppzHpvTiQ&index=1&list=PL2-dafEMk2A7YdKv4XfKpfbTH5z6rEEj3在他的视频中，他导入并读取了一个txt文件，但是当我尝试重新创建txt文件时，它无法正确读取。相反，我尝试使用相同的数据创建一个pandas数据框并对其执行线性回归/预测，但随后出现以下错误。发现样本数量不一致的输入变量:[1,16]和一些关于传递一维数组的内容，我需要reshape它们。然后当我

时出 dim code LinearRegression reshape python machine-learning syntax scikit-learn

python - 使用 sklearn StandardScaler 缩放的数据平均值不为零

我有以下代码importpandasaspdfromsklearn.preprocessingimportStandardScalerimportnumpyasnpdf.columns=['sepal_len','sepal_wid','petal_len','petal_wid','class']df.dropna(how="all",inplace=True)#dropstheemptylineatfile-endX=df.ix[:,0:4].valuesy=df.ix[:,4].values接下来我缩放数据并获取平均值:X_std=StandardScaler().fit_tra

StandardScaler sklearn section code python pandas numpy scikit-learn

python - Sklearn 自定义转换器 : difference between using FunctionTransformer and subclassing TransformerMixin

为了进行适当的CV，建议使用管道，以便可以将相同的转换应用于CV中的每个折叠。我可以通过使用sklearn.preprocessing.FunctionTrasformer或通过subclassingsklearn.base.TransformerMixin来定义自定义转换。推荐的方法是哪一种？为什么？最佳答案这完全取决于您，两者或多或少会达到相同的结果，只是您编写代码的方式不同。例如，在使用sklearn.preprocessing.FunctionTransformer时，您可以简单地定义要使用的函数并像这样直接调用它(co

自定 FunctionTransformer code TransformerMixin section python machine-learning scikit-learn cross-validation

python - ImportError : No module named sklearn. 数据集

操作系统:macos优胜美地python:2.7.6--64位安装:numpy、scipy、matplotlib、Nose我收到以下错误。>>>fromsklearn.datasetsimportload_irisTraceback(mostrecentcalllast):File"",line1,inImportError:Nomodulenamedsklearn.datasets$pipinstall--user--install-option="--prefix="-Uscikit-learnRequirementalreadyup-to-date:scikit-learnin/

ImportError sklearn section PYTHONPATH install python scipy scikit-learn

python - sklearn : How to reset a Regressor or classifier object in sknn

我定义了一个回归量如下:nn1=Regressor(layers=[Layer("Rectifier",units=150),Layer("Rectifier",units=100),Layer("Linear")],regularize="L2",#dropout_rate=0.25,learning_rate=0.01,valid_size=0.1,learning_rule="adagrad",verbose=False,weight_decay=0.00030,n_stable=10,f_stable=0.00010,n_iter=200)我在k折交叉验证中使用这个回归器。为了

classifier Regressor section 34 sklearn python machine-learning scikit-learn theano

python - 如何惩罚假阴性而不是假阳性

从业务角度来看，误报导致的成本(实际成本)是误报的十倍左右。鉴于我的标准二元分类模型(logit、随机森林等)，我如何将其合并到我的模型中？我是否必须更改(权重)损失函数以支持“首选”错误(FP)？如果可以，该怎么做？最佳答案有几种选择:正如评论中所建议的，class_weight应该将损失函数提升到首选类。各种估算器都支持此选项，包括sklearn.linear_model.LogisticRegression,sklearn.svm.SVC,sklearn.ensemble.RandomForestClassifier，和别

阴性 python code sklearn noreferrer machine-learning scikit-learn

5 6 789 10 11