jjzjj

底带大熊猫数据框架的最佳方法

Q1我想从Name属性concat数据框。这样做的最好方法是什么?concat['Title'][concat['Title']=='Mlle']='Miss'concat['Title'][concat['Title']=='Ms']='Miss'concat['Title'][concat['Title']=='Mme']='Mrs'concat['Title'][concat['Title']=='Dona'or'Lady'or'Countess'or'Capt'or'Col'or'Don'or'Dr'or'Major'or'Rev'or'Sir'or'Jonkheer']='Rare'

在列的颜色上读取带有大熊猫的excel

我有一个XLSX文件,带有各种着色的列。我只想使用Pandas在Python中阅读此Excel的白色柱,但我没有Hot的线索可以做到这一点。我能够将完整的Excel读取到数据框中,但随后我错过了有关列的颜色的信息,我不知道要删除哪些列,哪些列没有。看答案(披露:我是我要建议的图书馆的作者之一)和样式框架(包裹熊猫)您可以在不丢失样式数据的情况下将Excel文件读取到数据框架中。考虑以下表:以及以下代码:fromstyleframeimportStyleFrame,utils#fromStyleFrameimportStyleFrame,utils(ifusingversion

如何从大熊猫数据框架中检索列值并检查条件

dataframe列类包括2个值0和1.我要计算班级0的存在多少行,以及1类行1行。我编写了这样的代码genuine_count=0fraud_count=0ifcredit_card_df['Class']==1:fraud_count+=1else:genuine_count+=1print"Genuinetransactions"+genuine_countprint"Fraudtransactions"+fraud_count我有这个错误ValueErrorTraceback(mostrecentcalllast)in()1genuine_count=02fraud_count=0--

基于大熊猫组的多个盒子图

这是我的数据帧的样子:yearitem_idsales_quantity2014110201414.........2015172015110.........201421201428.........20152172015230.........2014392014318.........对于每个item_id,我想绘制一个箱形图,显示每年的分布。这是我尝试的:data=pd.DataFrame.from_csv('electronics.csv')grouped=data.groupby(['year'])ncols=4nrows=int(np.ceil(grouped.ngroups/n

避免循环播放大熊猫数据框架,跟踪剩余库存

我目前循环浏览包含订单的熊猫数据框架,以便我可以从库存中删除有序的项目,并跟踪可能无法填写的订单(这是预订系统的一部分)。我很想避免循环,并以一种更加蓬松的/熊猫风格的方式进行此操作,但没有想出任何让我达到我喜欢的粒度水平的事情。任何想法都将不胜感激!这是一个简化的版本。输入的示例看起来像这样:importpandasaspdimportrandomdefget_inventory():df_inv=pd.DataFrame([{'sku':'A1','remaining':1000},{'sku':'A2','remaining':600},{'sku':'A3','remaining':1

从大熊猫的每日数据框架获取每月观察数据

我想从大熊猫的每日数据中获取每月观察数据。这意味着,我想在一个月的每5天(2011-01-05;2011-02-05;2011-03-05...2011-12-05)或最近的交易日获取数据日期(例如,如果不存在03-05,它将搜索2011-03-06)。我怎样才能做到这一点?数据帧看起来像:DateClose2011-01-01100.992011-01-02100.65......2011-12-3176.08看答案以下答案将解决您的问题,但有一个警告,应该至少有一个每月的数据!df['Date']=pd.to_datetime(df['Date'])df['day']=df.Date.dt

要从大熊猫数据框架中获取单词列表,其中每列都是单词列表

因此,我基本上有熊猫的数据框架:说说1.oshinoshin1oshin22.oshin3oshin2oshin4我想以这样的方式获得计数器(基本上我的输出)应该是:oshin:1oshin1:1oshin2:2oshin3:1oshin4:1这样我就可以将输出导出到CSV文件,因为它将非常长。我该如何在熊猫中做到这一点?或者,对于事实上,我该如何为熊猫中的任何专栏做到这一点。看答案我认为您需要首先创建lists在每一列中apply和split,然后通过values和平坦numpy.ravel。转换成list并申请Counter,最后转换为dict:print(df)col0oshinoshi