jjzjj

python - Pandas :生成并绘制平均值

我有一个像这样的Pandas数据框:In[61]:df=DataFrame(np.random.rand(3,4),index=['art','mcf','mesa'],columns=['pol1','pol2','pol3','pol4'])In[62]:dfOut[62]:pol1pol2pol3pol4art0.6615920.4792020.7004510.345085mcf0.2355170.6659810.7787740.610344mesa0.8383960.0356480.4240470.866920我想生成一行,其中包含基准中策略的平均值,然后绘制它。目前,我这样做

python - 错误的 numpy 平均值?

我通常使用大型模拟。有时,我需要计算一组粒子的质心。我注意到在很多情况下,numpy.mean()返回的平均值是错误的。我可以弄清楚这是由于累加器饱和造成的。为了避免这个问题,我可以将所有粒子的总和拆分为一小组粒子,但这很不舒服。有人知道如何以优雅的方式解决这个问题吗?为了激起您的好奇心,以下示例产生了与我在模拟中观察到的类似的结果:importnumpyasnpa=np.ones((1024,1024),dtype=np.float32)*30504.00005如果您检查最大值和最小值,您会得到:a.max()30504.0a.min()30504.0然而,平均值是:a.mean()

python - pandas groupby 计数、总和和平均值

我在Pandas中有以下DF:+---------+--------+--------------------+|keyword|weight|otherkeywords|+---------+--------+--------------------+|dog|0.12|[cat,horse,pig]||cat|0.5|[dog,pig,camel]||horse|0.07|[dog,camel,cat]||dog|0.1|[cat,horse]||dog|0.2|[cat,horse,pig]||horse|0.3|[camel]|+---------+--------+-----

Python:具有均值和标准差的随机数生成器

我需要知道如何在python中生成1000个介于500和600之间且均值=550且标准差=30的随机数。importpylabimportrandomxrandn=pylab.zeros(1000,float)forjinrange(500,601):xrandn[j]=pylab.randn()??????? 最佳答案 您正在寻找stats.truncnorm:importscipy.statsasstatsa,b=500,600mu,sigma=550,30dist=stats.truncnorm((a-mu)/sigma,(b

python - 创建一个具有预先确定的均值和标准差的数组

我正在尝试使用Numpy创建一个具有预定均值和标准差值的数组。该数组需要其中的随机数。到目前为止,我可以生成一个数组并计算均值和标准差。但无法让数组受值控制:importnumpyasnpx=np.random.randn(1000)print("Average:")mean=x.mean()print(mean)print("Standarddeviation:")std=x.std()print(std)如何通过均值和标准差来控制数组的值? 最佳答案 使用numpy.random.normal.如果你的意思是my_mean而你的

python - 在 numpy 数组中查找平均值最高的行

给定以下数组:complete_matrix=numpy.array([[0,1,2,4],[1,0,3,5],[2,3,0,6],[4,5,6,0]])我想确定平均值最高的行,不包括对角线零。因此,在这种情况下,我可以将complete_matrix[:,3]识别为具有最高平均值的行。 最佳答案 请注意,零的存在不会影响哪一行的平均值最高,因为所有行都具有相同数量的元素。因此,我们只是取每一行的平均值,然后求最大元素的索引。#Takethemeanalongthe1stindex,iecollapseintoaNx1arrayof

python - numpy 二维数组的 block 均值

我想在NumPy中找到二维数组的block均值。为简单起见,让我们假设数组如下:array([[0,1,2,3,4,5,6,7,8,9,10,11],[12,13,14,15,16,17,18,19,20,21,22,23]])我想把这个数组分成3个大小为2x4的block,然后求所有三个block的平均值(这样平均值的形状就是2x4。第一个block由前4列组成,下一个接下来的4列等等。所以我的block是:array([[0,1,2,3],[12,13,14,15]])array([[4,5,6,7],[16,17,18,19]])array([[8,9,10,11],[20,21

python - 是否有计算对数正态均值和方差的 Python 方法?

我想了解是否有内置的python函数来计算对数正态均值和方差。我只需要此信息,然后将其输入scipy.stats.lognorm以获得覆盖在直方图上的绘图。简单地使用numpy.mean和numpy.std似乎不是正确的想法,因为对数正态均值和方差是特定的并且与numpy完全不同方法。在Matlab中,他们有一个名为lognstat的方便函数,它返回对数正态分布的均值和方差,我似乎无法在Python中找到类似的方法。编写解决方法很容易,但我想知道库中是否存在这种方法。谢谢。 最佳答案 不管它值多少钱,matlab中的所有lognst

python - numpy 数组的平均值返回 NaN

我有一个包含超过330,000行的np.array。我只是尝试取它的平均值,它返回NaN。即使我尝试过滤掉数组中任何可能的NaN值(无论如何都不应该有),average也会返回NaN。我在做一些完全古怪的事情吗?我的代码在这里:average(ngma_heat_daily)Out[70]:nanaverage(ngma_heat_daily[ngma_heat_daily!=nan])Out[71]:nan 最佳答案 试试这个:>>>np.nanmean(ngma_heat_daily)此函数在取平均值之前从数组中删除NaN值。编

python - 在 Python 中计算图像数据集 channel 明智均值和标准差的最快方法

我有一个内存无法容纳的巨大图像数据集。我想计算均值和标准差,从磁盘加载图像。我目前正在尝试使用在wikipedia上找到的算法.#foranewvaluenewValue,computethenewcount,newmean,thenewM2.#meanaccumulatesthemeanoftheentiredataset#M2aggregatesthesquareddistancefromthemean#countaggregatestheamountofsamplesseensofardefupdate(existingAggregate,newValue):(count,mea