StatsModels

python - 使用 'statsmodels' 指定将哪个类别视为基础

据了解，当我将模型中的类别变量传递给statsmodelsfit时，将为类别自动生成虚拟变量。例如，如果我有一个变量“Location”，其值为“IndianOcean”、“Thailand”、“China”和“Mars”，我将在我的模型中获得以下形式的变量Location[T.Thailand]其中一个值未表示。默认情况下，排除变量似乎是最不常见的变量。有没有一种方法可以指定(最好是在模型规范中)将哪个值视为“基值”并排除在外？最佳答案您可以将referencearg传递给Treatmentcontrast，使用如下语法"y~

Python:来自statsmodels的逻辑回归模型的l2-Penalty？

有没有办法通过参数或其他方式在statsmodel中为逻辑回归模型设置l2-Penalty？我刚刚在文档中找到了l1-Penalty，但没有找到l2-Penalty。最佳答案 statsmodels.discrete中的模型，如Logit、Poisson和MNLogit，目前只有L1惩罚。然而，用于GLM和其他一些模型的弹性网络最近已合并到statsmodelsmaster中。具有二元响应的族二项式GLM与discrete.Logit的模型相同，尽管实现方式不同。在Isridgebinomialregressionavailabl

statsmodels l2-Penalty section Penalty python pandas

python - Statsmodels 0.6.1版本不包含tsa？

我正在尝试使用statsmodels(sm)让HP过滤器工作。文档here暗示0.6.1模块sm.tsa已经存在，但我收到以下错误:>>>importstatsmodelsassm>>>sm.__version__'0.6.1'>>>sm.tsa.filters.hp_filter.hpfilter()Traceback(mostrecentcalllast):File"",line1,inAttributeError:'module'objecthasnoattribute'tsa'>>>sm.tsaTraceback(mostrecentcalllast):File"",line1

Statsmodels python code section

Python - StatsModels，OLS 置信区间

在Statsmodels中，我可以使用importstatsmodels.apiassmX=np.array([22000,13400,47600,7400,12000,32000,28000,31000,69000,48600])y=np.array([0.62,0.24,0.89,0.11,0.18,0.75,0.54,0.61,0.92,0.88])X2=sm.add_constant(X)est=sm.OLS(y,X2)est2=est.fit()然后使用打印一个漂亮的摘要print(est2.summary())并使用提取诸如p值之类的东西est2.pvalues可在此页面上

置信 StatsModels section python

python - 如何从 statsmodels.api 中提取回归系数？

result=sm.OLS(gold_lookback,silver_lookback).fit()得到结果后，如何得到系数和常数？换句话说，如果y=ax+c如何获取值a和c？最佳答案您可以使用拟合模型的params属性来获取系数。例如下面的代码:importstatsmodels.apiassmimportnumpyasnpnp.random.seed(1)X=sm.add_constant(np.arange(100))y=np.dot(X,[1,2])+np.random.normal(size=100)result=sm

statsmodels python code section result pandas linear-regression

python - 时间序列分析 - 不均匀间隔的措施 - Pandas + statsmodels

我有两个numpy数组light_points和time_points，想对这些数据使用一些时间序列分析方法。然后我尝试了这个:importstatsmodels.apiassmimportpandasaspdtdf=pd.DataFrame({'time':time_points[:]})rdf=pd.DataFrame({'light':light_points[:]})rdf.index=pd.DatetimeIndex(freq='w',start=0,periods=len(rdf.light))#rdf.index=pd.DatetimeIndex(tdf['time'])

不均 statsmodels code seasonal 39 python pandas machine-learning time-series

python - Statsmodels:计算拟合值和 R 平方

我正在按如下方式运行回归(df是一个pandas数据框):importstatsmodels.apiassmest=sm.OLS(df['p'],df[['e','varA','meanM','varM','covAM']]).fit()est.summary()除其他外，这给了我0.942的R平方。所以我想绘制原始y-values和拟合值。为此，我对原始值进行了排序:orig=df['p'].valuesfitted=est.fittedvalues.valuesargs=np.argsort(orig)importmatplotlib.pyplotaspltplt.plot(ori

Statsmodels python code section pre numpy

python - Statsmodels ARIMA - 使用 predict() 和 forecast() 的不同结果

我使用(Statsmodels)ARIMA来预测一系列的值:plt.plot(ind,final_results.predict(start=0,end=26))plt.plot(ind,forecast.values)plt.show()我以为我会从这两种方法中得到相同的结果，但我却得到了这个:我想知道是使用predict()还是forecast()。最佳答案从图表上看，您似乎是在使用forecast()进行样本外预测，而在使用predict进行样本内预测。基于ARIMA方程的性质，对于较长的预测周期，样本外预测往往会收敛到样

Statsmodels forecast code model predict python arima

python - Statsmodels 中是否实现了 LASSO 回归？

我很想在statsmodels中使用线性LASSO回归，以便能够使用“公式”符号来编写模型，这将在处理许多分类变量及其交互时节省我相当多的编码时间。但是，它似乎还没有在统计模型中实现？最佳答案 Lasso确实在statsmodels中实现。文档在下面的url中给出:http://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.fit_regularized.html准确的说，statsmodel中的实现同时具有L1和L2正则化，它们

Statsmodels python section fit_regularized regression lasso-regression

python - 使用 statsmodels 进行 Holt-Winters 时间序列预测

我尝试使用holt-winters模型进行预测，如下所示，但我一直得到的预测与我的预期不一致。我还展示了情节的可视化Train=Airline[:130]Test=Airline[129:]fromstatsmodels.tsa.holtwintersimportHolty_hat_avg=Test.copy()fit1=Holt(np.asarray(Train['Passengers'])).fit()y_hat_avg['Holt_Winter']=fit1.predict(start=1,end=15)plt.figure(figsize=(16,8))plt.plot(Tra

Holt-Winters statsmodels 39 index section python time-series forecasting holtwinters

5 6 789 10 11