jjzjj

python - 箱线图按 python pandas 中的列分层

我想为以下pandas数据框绘制一个箱线图:>p1.head(10)N0_YLDFMAT01.2913.6712.3210.6726.2411.2935.3421.2946.3541.6755.3591.6769.3221.5276.3231.5283.3313.5294.5644.52我希望箱线图属于“N0_YLDF”列,但它们应该按“MAT”进行分层。当我使用foll时。命令:p1.boxplot(column='N0_YLDF',by='MAT')它使用所有唯一的MAT值,在完整的p1数据帧中数量约为15,000。这会导致难以理解的箱线图。有什么方法可以对MAT值进行分层,以便为

python - ValueError : num must be 1 <= num <= 2, 不是 3

我有以下使用pivot_table生成的dataframe:我正在使用以下代码来箱线图多列:fig=plt.figure()foriinrange(0,25):ax=plt.subplot(1,2,i+1)toPlot1.boxplot(column='Score',by=toPlot1.columns[i+1],ax=ax)fig.suptitle('testtitle',fontsize=20)plt.show()我期待如下输出:但是这段代码给我以下错误:----------------------------------------------------------------

python - 使用 seaborn/matplotlib boxplot 时的刻度频率

我正在用seaborn绘制一系列箱线图sns.boxplot(full_array)其中full_array包含200个数组。因此,我在x轴上有200个箱线图和刻度,范围从0到200。xticks彼此太靠近,我只想显示其中的一些,例如,每20个左右标记一个xticks。我尝试了几种提到的解决方案here但它们没有用。每次我对xticks进行采样时,我都会得到错误的刻度标签,因为它们从0到N以单位间距编号。例如,使用行ax.xaxis.set_major_locator(ticker.MultipleLocator(20))我每20次得到一个带标签的xtick,但标签是1、2、3、4而不

python - 在 seaborn 中绘制多个箱线图

我想在pandas中使用seaborn绘制箱线图,因为它是一种更好的数据可视化方式,但我不太熟悉它。我有三个不同指标的数据框,我想比较不同的指标。我将遍历文件路径以访问它们。forpathinpaths:df=pd.read_csv(path)每个指标的dfs都是独立的,看起来像这样(其中....表示填充的数据值)。1,2,3,4,5是列名,表示不同的试验:123450..............1..............2..............3..............4..............我想并排放置试验1、2、3、4、5和3个指标中的每一个的所有图,其中三个

python - 在 python 的箱形图中显示均值?

我是Matplotlib的新手,在学习如何在python中绘制箱形图时,我想知道是否有一种方法可以在箱形图中显示均值?下面是我的代码..frompylabimport*importmatplotlib.pyplotaspltdata1=np.random.rand(100,1)data2=np.random.rand(100,1)data_to_plot=[data1,data2]#Createafigureinstancefig=plt.figure(1,figsize=(9,6))#Createanaxesinstanceaxes=fig.add_subplot(111)#Crea

python - pandas DataFrame 多列的并排箱线图

一年的样本数据:importpandasaspdimportnumpy.randomasrndimportseabornassnsn=365df=pd.DataFrame(data={"A":rnd.randn(n),"B":rnd.randn(n)+1},index=pd.date_range(start="2017-01-01",periods=n,freq="D"))我想按月份并排绘制这些数据的箱线图(即,每月两个箱子,一个用于A,一个用于B)。对于单列sns.boxplot(df.index.month,df["A"])工作正常。但是,sns.boxplot(df.index.

python - Pandas 中的加权箱线图

对于下面的数据框(df),ColAColA_weightsColBColB_weights00.03867110731.8595991120.399745736210.595991210.2997458572.859599135.040000128833.39599141.04000010647.8595991我想画一个加权箱线图,其中每个箱子的权重分别由ColA_weights和ColB_weights给出,我只是这样做df.boxplot(fontsize=12,notch=0,whis=1.5,vert=1,widths=0.2)不过好像没有规定要包含权重。有什么解决办法吗?谢谢

python - matplotlib 中具有可变长度数据的箱线图

我在一个文本文件中收集了一些数据,想创建一个箱线图。但是这个数据文件包含可变长度的行,例如。1.2,2.3,3.0,4.51.1,2.2,2.9等长我可以做PW=numpy.loadtxt("./learning.dat")matplotlib.boxplot(PW.T);如何处理可变长度数据线? 最佳答案 只需使用数组或列表的列表。boxplot将采用任何类型的序列(好吧,任何具有__len__的序列,无论如何。它不适用于生成器等)。例如:importmatplotlib.pyplotaspltx=[[1.2,2.3,3.0,4.

python - 是否可以在给定百分位数而不是原始输入的情况下绘制 matplotlib 箱线图?

据我所知,boxplot()方法需要一系列原始值(数字)作为输入,然后从中计算百分位数以绘制箱线图。我想要一种方法,通过它我可以传入百分位数并获得相应的boxplot。例如:假设我已经运行了多个基准测试,并且我对每个基准测试都测量了延迟(浮点值)。现在另外,我已经预先计算了这些值的百分位数。因此,对于每个基准,我都有第25、50、75个百分位数以及最小值和最大值。现在有了这些数据,我想绘制基准的箱线图。 最佳答案 截至2020年,有一种比已接受答案中的方法更好的方法。matplotlib.axes.Axes类提供了一个bxp方法,可

python - 没有为 pandas boxplot (groupby) 设置标题

当绘制按另一列分组的pandas箱线图时,pandas会自动为绘图添加标题,显示“箱线图按...分组”。有没有办法删除它?我尝试使用suptitle('')根据Pandas:boxplotofonecolumnbasedonanothercolumn但这似乎行不通。我正在使用最新的pandas(0.13.1)版本。 最佳答案 确保你调用的suptitle('')在右图中。In[23]:axes=df.boxplot(by='g')In[24]:fig=axes[0][0].get_figure()In[25]:fig.suptitl