jjzjj

StatsModels

全部标签

python - Python statsmodels OLS 和 R 的 lm 的区别

我不确定为什么我得到的简单OLS的结果略有不同,这取决于我是否通过panda'sexperimentalrpyinterface在R中进行回归或者我是否使用statsmodels在Python中。importpandasfromrpy2.robjectsimportrfromfunctoolsimportpartialloadcsv=partial(pandas.DataFrame.from_csv,index_col="seqn",parse_dates=False)demoq=loadcsv("csv/DEMO.csv")rxq=loadcsv("csv/quest/RXQ_RX.

python - Python statsmodels OLS 和 R 的 lm 的区别

我不确定为什么我得到的简单OLS的结果略有不同,这取决于我是否通过panda'sexperimentalrpyinterface在R中进行回归或者我是否使用statsmodels在Python中。importpandasfromrpy2.robjectsimportrfromfunctoolsimportpartialloadcsv=partial(pandas.DataFrame.from_csv,index_col="seqn",parse_dates=False)demoq=loadcsv("csv/DEMO.csv")rxq=loadcsv("csv/quest/RXQ_RX.

python - Python中LOWESS的置信区间

如何在Python中计算LOWESS回归的置信区间?我想将这些作为阴影区域添加到使用以下代码创建的LOESS图中(statsmodels以外的其他包也可以)。importnumpyasnpimportpylabaspltimportstatsmodels.apiassmx=np.linspace(0,2*np.pi,100)y=np.sin(x)+np.random.random(100)*0.2lowess=sm.nonparametric.lowess(y,x,frac=0.1)plt.plot(x,y,'+')plt.plot(lowess[:,0],lowess[:,1])pl

python - Python中LOWESS的置信区间

如何在Python中计算LOWESS回归的置信区间?我想将这些作为阴影区域添加到使用以下代码创建的LOESS图中(statsmodels以外的其他包也可以)。importnumpyasnpimportpylabaspltimportstatsmodels.apiassmx=np.linspace(0,2*np.pi,100)y=np.sin(x)+np.random.random(100)*0.2lowess=sm.nonparametric.lowess(y,x,frac=0.1)plt.plot(x,y,'+')plt.plot(lowess[:,0],lowess[:,1])pl

python - 最高后密度区和中央可信区

给定一些参数Θ的后验p(Θ|D),可以define以下:最高后密度区域:HighestPosteriorDensityRegion是Θ最可能值的集合,总共构成100(1-α)%的后部质量。换句话说,对于给定的α,我们寻找满足以下条件的p*:然后得到HighestPosteriorDensityRegion作为集合:中央可信区:使用与上述相同的符号,可信区域(或区间)定义为:根据分布,可能有许多这样的间隔。中央可信区间定义为每条尾部上都有(1-α)/2质量的可信区间。计算:对于一般分布,给定分布中的样本,是否有任何内置函数可以在Python或PyMC中获得上述两个量?对于常见的参数分布(

python - 最高后密度区和中央可信区

给定一些参数Θ的后验p(Θ|D),可以define以下:最高后密度区域:HighestPosteriorDensityRegion是Θ最可能值的集合,总共构成100(1-α)%的后部质量。换句话说,对于给定的α,我们寻找满足以下条件的p*:然后得到HighestPosteriorDensityRegion作为集合:中央可信区:使用与上述相同的符号,可信区域(或区间)定义为:根据分布,可能有许多这样的间隔。中央可信区间定义为每条尾部上都有(1-α)/2质量的可信区间。计算:对于一般分布,给定分布中的样本,是否有任何内置函数可以在Python或PyMC中获得上述两个量?对于常见的参数分布(

python - Pandas 滚动回归 : alternatives to looping

在已弃用的stats/ols模块中,我很好地利用了pandas的MovingOLS类(来源here)。不幸的是,它被pandas0.20彻底破坏了。在我看来,如何以有效方式运行滚动OLS回归的问题已被多次提出(例如here),但措辞有点宽泛,没有很好的答案。这是我的问题:如何最好地模仿pandas的MovingOLS的基本框架?这个类最吸引人的特性是能够将多个方法/属性视为单独的时间序列——即系数、r平方、t统计量等,而无需重新运行回归。例如,您可以创建类似model=pd.MovingOLS(y,x)的内容,然后调用.t_stat、.rmse、.std_err等。相反,在下面的示例中

python - Pandas 滚动回归 : alternatives to looping

在已弃用的stats/ols模块中,我很好地利用了pandas的MovingOLS类(来源here)。不幸的是,它被pandas0.20彻底破坏了。在我看来,如何以有效方式运行滚动OLS回归的问题已被多次提出(例如here),但措辞有点宽泛,没有很好的答案。这是我的问题:如何最好地模仿pandas的MovingOLS的基本框架?这个类最吸引人的特性是能够将多个方法/属性视为单独的时间序列——即系数、r平方、t统计量等,而无需重新运行回归。例如,您可以创建类似model=pd.MovingOLS(y,x)的内容,然后调用.t_stat、.rmse、.std_err等。相反,在下面的示例中

python - 我在哪里可以找到 scipy 中的 mad(平均绝对偏差)?

似乎scipy曾经提供了一个函数mad来计算一组数字的平均绝对偏差:http://projects.scipy.org/scipy/browser/trunk/scipy/stats/models/utils.py?rev=3473但是,我在当前版本的scipy中找不到它。当然可以只从存储库中复制旧代码,但我更喜欢使用scipy的版本。我在哪里可以找到它,或者它已被替换或删除? 最佳答案 [编辑]因为这一直被低估:我知道median绝对偏差是一个更常用的统计数据,但提问者要求mean绝对偏差,方法如下:fromnumpyimport

python - 我在哪里可以找到 scipy 中的 mad(平均绝对偏差)?

似乎scipy曾经提供了一个函数mad来计算一组数字的平均绝对偏差:http://projects.scipy.org/scipy/browser/trunk/scipy/stats/models/utils.py?rev=3473但是,我在当前版本的scipy中找不到它。当然可以只从存储库中复制旧代码,但我更喜欢使用scipy的版本。我在哪里可以找到它,或者它已被替换或删除? 最佳答案 [编辑]因为这一直被低估:我知道median绝对偏差是一个更常用的统计数据,但提问者要求mean绝对偏差,方法如下:fromnumpyimport