jjzjj

StatsModels

全部标签

python - python statsmodels.tsa.seasonal 中的值错误

我有这个带有日期时间索引的数据框:ts_log:dateprice_per_unit2013-04-0412.7623692013-04-0512.7771202013-04-0612.7731462013-04-0712.7807742013-04-0812.786835我有这段代码用于分解fromstatsmodels.tsa.seasonalimportseasonal_decomposedecomposition=seasonal_decompose(ts_log)trend=decomposition.trendseasonal=decomposition.seasonalr

python - 使用带有 statsmodels 的 OLS 模型预测值

我使用OLS(多元线性回归)计算了一个模型。我将我的数据划分为训练和测试(各一半),然后我想预测第二部分标签的值。model=OLS(labels[:half],data[:half])predictions=model.predict(data[half:])问题是我得到了错误:文件“/usr/local/lib/python2.7/dist-packages/statsmodels-0.5.0-py2.7-linux-i686.egg/statsmodels/regression/linear_model.py”,第281行,预测返回np.dot(exog,参数)ValueErro

python - 如何在 python 中静音 statsmodels.fit()

当我想在python中拟合一些模型时,我经常在statsmodels中使用fit()方法。在某些情况下,我编写了一个用于自动拟合的脚本:importstatsmodels.formula.apiassmfimportpandasaspddf=pd.read_csv('mydata.csv')#containscolumnxandyfitted=smf.poisson('y~x',df).fit()我的问题是如何使fit()方法静音。在我的环境中,它输出一些有关适合标准输出的信息,例如:Optimizationterminatedsuccessfully.Currentfunctionv

python - 将泊松分布拟合到 statsmodels 中的数据

我正在尝试使用statsmodels将泊松分布拟合到我的数据中,但我对得到的结果以及如何使用该库感到困惑。我的真实数据将是一系列数字,我认为我应该能够将其描述为具有泊松分布和一些异常值,因此最终我想对数据进行稳健拟合。但是出于测试目的,我只是使用scipy.stats.poisson创建了一个数据集samp=scipy.stats.poisson.rvs(4,size=200)因此,为了使用statsmodels来适应这个,我认为我只需要有一个恒定的“endog”res=sm.Poisson(samp,np.ones_like(samp)).fit()打印res.summary()Po

python - statsmodels 线性回归 - patsy 公式以包含模型中的所有预测变量

假设我有一个数据框(我们称它为DF),其中y是因变量,x1,x2,x3是我的独立变量变量。在R中,我可以使用以下代码拟合线性模型,.将在模型中包含我的所有自变量:#Rcodeforfittinglinearmodelresult=lm(y~.,data=DF)如果不明确地将我所有的自变量添加到公式中,我无法弄清楚如何使用patsy公式对statsmodels执行此操作。patsy是否具有与R的.等效的功能?我没有运气在patsy文档中找到它。 最佳答案 我也没有在patsy文档中找到等效的.。但它缺乏简洁性,它可以通过在Python

python - matplotlib 的 plt.acorr 中自相关图的错误?

我正在用python绘制自相关。我用了三种方法来做:1.pandas,2.matplotlib,3.statsmodels。我发现我从matplotlib得到的图表与其他两个不一致。代码是:fromstatsmodels.graphics.tsaplotsimport*#printoutdataprintmydata.values#1.pandasp=autocorrelation_plot(mydata)plt.title('mydata')#2.matplotlibfig=plt.figure()plt.acorr(mydata,maxlags=150)plt.title('myd

python - 分解趋势、季节和残差时间序列元素

我有一个包含几个时间序列的DataFrame:dividamovav12varvarmovav12Date2004-010NaNNaNNaN2004-020NaNNaNNaN2004-030NaNNaNNaN2004-0434NaNinfNaN2004-0530NaN-0.117647NaN2004-0644NaN0.466667NaN2004-0735NaN-0.204545NaN2004-0831NaN-0.114286NaN2004-0930NaN-0.032258NaN2004-1024NaN-0.200000NaN2004-1141NaN0.708333NaN2004-122

python - 分解趋势、季节和残差时间序列元素

我有一个包含几个时间序列的DataFrame:dividamovav12varvarmovav12Date2004-010NaNNaNNaN2004-020NaNNaNNaN2004-030NaNNaNNaN2004-0434NaNinfNaN2004-0530NaN-0.117647NaN2004-0644NaN0.466667NaN2004-0735NaN-0.204545NaN2004-0831NaN-0.114286NaN2004-0930NaN-0.032258NaN2004-1024NaN-0.200000NaN2004-1141NaN0.708333NaN2004-122

python - 建立多元回归模型抛出错误 : `Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).`

我有pandas数据框,其中包含一些分类预测变量(即变量),如0和1,以及一些数字变量。当我将它安装到像这样的stasmodel时:est=sm.OLS(y,X).fit()它抛出:Pandasdatacasttonumpydtypeofobject.Checkinputdatawithnp.asarray(data).我使用df.convert_objects(convert_numeric=True)转换了DataFrame的所有数据类型在此之后,所有数据帧变量的数据类型都显示为int32或int64。但是最后还是显示dtype:object,像这样:4516int324523in

python - 建立多元回归模型抛出错误 : `Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).`

我有pandas数据框,其中包含一些分类预测变量(即变量),如0和1,以及一些数字变量。当我将它安装到像这样的stasmodel时:est=sm.OLS(y,X).fit()它抛出:Pandasdatacasttonumpydtypeofobject.Checkinputdatawithnp.asarray(data).我使用df.convert_objects(convert_numeric=True)转换了DataFrame的所有数据类型在此之后,所有数据帧变量的数据类型都显示为int32或int64。但是最后还是显示dtype:object,像这样:4516int324523in