jjzjj

StatsModels

全部标签

python - 使用 'statsmodels' 指定将哪个类别视为基础

据了解,当我将模型中的类别变量传递给statsmodelsfit时,将为类别自动生成虚拟变量。例如,如果我有一个变量“Location”,其值为“IndianOcean”、“Thailand”、“China”和“Mars”,我将在我的模型中获得以下形式的变量Location[T.Thailand]其中一个值未表示。默认情况下,排除变量似乎是最不常见的变量。有没有一种方法可以指定(最好是在模型规范中)将哪个值视为“基值”并排除在外? 最佳答案 您可以将referencearg传递给Treatmentcontrast,使用如下语法"y~

Python:来自statsmodels的逻辑回归模型的l2-Penalty?

有没有办法通过参数或其他方式在statsmodel中为逻辑回归模型设置l2-Penalty?我刚刚在文档中找到了l1-Penalty,但没有找到l2-Penalty。 最佳答案 statsmodels.discrete中的模型,如Logit、Poisson和MNLogit,目前只有L1惩罚。然而,用于GLM和其他一些模型的弹性网络最近已合并到statsmodelsmaster中。具有二元响应的族二项式GLM与discrete.Logit的模型相同,尽管实现方式不同。在Isridgebinomialregressionavailabl

python - Statsmodels 0.6.1版本不包含tsa?

我正在尝试使用statsmodels(sm)让HP过滤器工作。文档here暗示0.6.1模块sm.tsa已经存在,但我收到以下错误:>>>importstatsmodelsassm>>>sm.__version__'0.6.1'>>>sm.tsa.filters.hp_filter.hpfilter()Traceback(mostrecentcalllast):File"",line1,inAttributeError:'module'objecthasnoattribute'tsa'>>>sm.tsaTraceback(mostrecentcalllast):File"",line1

Python - StatsModels,OLS 置信区间

在Statsmodels中,我可以使用importstatsmodels.apiassmX=np.array([22000,13400,47600,7400,12000,32000,28000,31000,69000,48600])y=np.array([0.62,0.24,0.89,0.11,0.18,0.75,0.54,0.61,0.92,0.88])X2=sm.add_constant(X)est=sm.OLS(y,X2)est2=est.fit()然后使用打印一个漂亮的摘要print(est2.summary())并使用提取诸如p值之类的东西est2.pvalues可在此页面上

python - 如何从 statsmodels.api 中提取回归系数?

result=sm.OLS(gold_lookback,silver_lookback).fit()得到结果后,如何得到系数和常数?换句话说,如果y=ax+c如何获取值a和c? 最佳答案 您可以使用拟合模型的params属性来获取系数。例如下面的代码:importstatsmodels.apiassmimportnumpyasnpnp.random.seed(1)X=sm.add_constant(np.arange(100))y=np.dot(X,[1,2])+np.random.normal(size=100)result=sm

python - 时间序列分析 - 不均匀间隔的措施 - Pandas + statsmodels

我有两个numpy数组light_points和time_points,想对这些数据使用一些时间序列分析方法。然后我尝试了这个:importstatsmodels.apiassmimportpandasaspdtdf=pd.DataFrame({'time':time_points[:]})rdf=pd.DataFrame({'light':light_points[:]})rdf.index=pd.DatetimeIndex(freq='w',start=0,periods=len(rdf.light))#rdf.index=pd.DatetimeIndex(tdf['time'])

python - Statsmodels:计算拟合值和 R 平方

我正在按如下方式运行回归(df是一个pandas数据框):importstatsmodels.apiassmest=sm.OLS(df['p'],df[['e','varA','meanM','varM','covAM']]).fit()est.summary()除其他外,这给了我0.942的R平方。所以我想绘制原始y-values和拟合值。为此,我对原始值进行了排序:orig=df['p'].valuesfitted=est.fittedvalues.valuesargs=np.argsort(orig)importmatplotlib.pyplotaspltplt.plot(ori

python - Statsmodels ARIMA - 使用 predict() 和 forecast() 的不同结果

我使用(Statsmodels)ARIMA来预测一系列的值:plt.plot(ind,final_results.predict(start=0,end=26))plt.plot(ind,forecast.values)plt.show()我以为我会从这两种方法中得到相同的结果,但我却得到了这个:我想知道是使用predict()还是forecast()。 最佳答案 从图表上看,您似乎是在使用forecast()进行样本外预测,而在使用predict进行样本内预测。基于ARIMA方程的性质,对于较长的预测周期,样本外预测往往会收敛到样

python - Statsmodels 中是否实现了 LASSO 回归?

我很想在statsmodels中使用线性LASSO回归,以便能够使用“公式”符号来编写模型,这将在处理许多分类变量及其交互时节省我相当多的编码时间。但是,它似乎还没有在统计模型中实现? 最佳答案 Lasso确实在statsmodels中实现。文档在下面的url中给出:http://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.fit_regularized.html准确的说,statsmodel中的实现同时具有L1和L2正则化,它们

python - 使用 statsmodels 进行 Holt-Winters 时间序列预测

我尝试使用holt-winters模型进行预测,如下所示,但我一直得到的预测与我的预期不一致。我还展示了情节的可视化Train=Airline[:130]Test=Airline[129:]fromstatsmodels.tsa.holtwintersimportHolty_hat_avg=Test.copy()fit1=Holt(np.asarray(Train['Passengers'])).fit()y_hat_avg['Holt_Winter']=fit1.predict(start=1,end=15)plt.figure(figsize=(16,8))plt.plot(Tra