jjzjj

Regression

全部标签

论文笔记:SUPERVISED CONTRASTIVE REGRESSION

2022arxiv的论文,没有中,但一作是P大图班本MIT博,可信度应该还是可以的0摘要深度回归模型通常以端到端的方式进行学习,不明确尝试学习具有回归意识的表示。它们的表示往往是分散的,未能捕捉回归任务的连续性质。在本文中,我们提出了“监督对比回归”(SupervisedContrastiveRegression,SupCR)的框架该框架通过将样本与目标距离进行对比来学习具有回归意识的表示。SupCR与现有的回归模型是正交的,并且可以与这些模型结合使用以提高性能。在涵盖计算机视觉、人机交互和医疗保健领域的五个真实世界回归数据集上进行的大量实验表明,使用SupCR可以达到最先进的性能,并且始终在

python - 如何在 Tensorflow 中计算 R^2

我正在尝试在Tensorflow中进行回归。我不确定我是否正确计算了R^2,因为Tensorflow给我的答案与sklearn.metrics.r2_score不同有人可以看看我下面的代码,让我知道我是否实现了图中的方程式正确。谢谢total_error=tf.square(tf.sub(y,tf.reduce_mean(y)))unexplained_error=tf.square(tf.sub(y,prediction))R_squared=tf.reduce_mean(tf.sub(tf.div(unexplained_error,total_error),1.0))R=tf.m

Python 自然平滑样条

我正在尝试找到一个python包,它可以提供一个选项来适应自然平滑样条与用户可选择的平滑因子。有实现吗?如果没有,您将如何利用现有的资源自行实现?我所说的自然样条是指应该有一个条件,即端点处拟合函数的二阶导数为零(线性)。平滑样条是指样条不应“插值”(通过所有数据点)。我想自己决定正确的平滑因子lambda(请参阅Wikipediapage了解平滑样条曲线)。我发现了什么scipy.interpolate.CubicSpline[link]:进行自然(三次)样条拟合。做插值,没有办法平滑数据。scipy.interpolate.UnivariateSpline[link]:使用用户可选

python Pandas : how to run multiple univariate regression by group

假设我有一个DataFrame,其中有一列y变量和许多列x变量。我希望能够运行y与x1、y与x2的多个单变量回归,...,等等,并将预测存储回DataFrame。我还需要通过组变量来执行此操作。importstatsmodels.apiassmimportpandasaspddf=pd.DataFrame({'y':np.random.randn(20),'x1':np.random.randn(20),'x2':np.random.randn(20),'grp':['a','b']*10})defols_res(x,y):returnsm.OLS(y,x).fit().predict

python - scipy linregress 函数错误的标准错误返回?

我有一个奇怪的情况,scipy.stats.linregress似乎返回了一个不正确的标准错误:fromscipyimportstatsx=[5.05,6.75,3.21,2.66]y=[1.65,26.5,-5.93,7.96]gradient,intercept,r_value,p_value,std_err=stats.linregress(x,y)>>>gradient5.3935773611970186>>>intercept-16.281127993087829>>>r_value0.72443514211849758>>>r_value**20.5248062751362

python - 多输出回归模型始终为 Tensorflow 中的批处理返回相同的值

我有一个多层感知器用于预测14个连续值的多输出回归问题。以下是相同的代码片段:#Parameterslearning_rate=0.001training_epochs=1000batch_size=500#NetworkParametersn_hidden_1=32n_hidden_2=200n_hidden_3=200n_hidden_4=256n_input=14n_classes=14#tfGraphinputx=tf.placeholder("float",[None,n_input],name="x")y=tf.placeholder("float",[None,n_cla

python - 通过 MultiOutputRegressor 进行网格搜索?

让我们考虑一个多元回归问题(2个响应变量:纬度和经度)。目前,支持向量回归sklearn.svm.SVR等一些机器学习模型实现目前不提供对多元回归的原始支持。为此,可以使用sklearn.multioutput.MultiOutputRegressor。示例:fromsklearn.multioutputimportMultiOutputRegressorsvr_multi=MultiOutputRegressor(SVR(),n_jobs=-1)#Fitthealgorithmonthedatasvr_multi.fit(X_train,y_train)y_pred=svr_mult

python Pandas : how to turn a DataFrame with "factors" into a design matrix for linear regression?

如果没记错的话,在R中有一种称为因子的数据类型,当在DataFrame中使用时,它可以自动解压缩到回归设计矩阵的必要列中。例如,包含True/False/Maybe值的因子将转换为:100010or001为了使用较低级别的回归代码。有没有办法使用pandas库实现类似的东西?我看到Pandas中有一些回归支持,但由于我有自己定制的回归例程,我真的很感兴趣从异构数据构build计矩阵(2dnumpy数组或矩阵),支持映射来回映射numpy对象的列和派生它的PandasDataFrame。更新:这是一个数据矩阵的示例,其中包含我正在考虑的那种异构数据(该示例来自Pandas手册):>>>d

python - Pandas 数据框的线性回归

我在pandas中有一个数据框,我正在使用它来生成散点图,并且想为该图包含一条回归线。现在我正在尝试使用polyfit来做到这一点。这是我的代码:importpandasaspdimportmatplotlibimportmatplotlib.pyplotaspltfromnumpyimport*table1=pd.DataFrame.from_csv('upregulated_genes.txt',sep='\t',header=0,index_col=0)table2=pd.DataFrame.from_csv('misson_genes.txt',sep='\t',header=

python - 具有分类输入的回归树或随机森林回归器

我一直在尝试在回归树(或随机森林回归器)中使用分类输入,但sklearn不断返回错误并要求输入数字。importsklearnasskMODEL=sk.ensemble.RandomForestRegressor(n_estimators=100)MODEL.fit([('a',1,2),('b',2,3),('a',3,2),('b',1,3)],[1,2.5,3,4])#doesnotworkMODEL.fit([(1,1,2),(2,2,3),(1,3,2),(2,1,3)],[1,2.5,3,4])#worksMODEL=sk.tree.DecisionTreeRegresso