如何仅计算熊猫数据帧中的特定值

Question

我有以下熊猫数据帧；

a=[[‘01’，‘12345’，‘null’]，[‘02’，‘78910’，‘9870’]，['01’，'23456'，‘null']，[’01’，'98765'，‘8760’]]df_a=pd.DataFrame（a，columns=['id'，'order'，'location']）

我需要获取每个ID出现的NULL值（NULL是一个字符串）的数量，因此结果如下所示：；

id为null_count01    02

我可以使用groupby获得基本计数：

new_df=df_a.groupby（['id'，'位置']）['id'].count（）

但结果返回的不仅仅是NULL值；

id位置01  8760        1空值202  9870        1

斯科特·波士顿 · Accepted Answer · 2017-11-02 21:00:03 Z

6

因为在源数据帧中，null是字符串“null”，请使用：

df_a.groupby（'id'）['位置'].apply（lambda x:（x=='null'）.sum（））\.reset_index（名称=“完整计数”）

输出：

id为null_count0  01          21  02          0

或

df_a.query（'location==“null”'）.groupby（'id'）['location'].size（）\.reset_index（名称='null_count'）

输出：

id为null_count0  01           2

回答2017年11月2日20:53

15.2万15枚金徽章152枚银徽章198枚青铜徽章

添加评论 |

贝尼 · Accepted Answer · 2017年11月2日21:03:43Z

5

基于您自己的代码，添加.loc位置注意，这是多索引切片。。

df_a.groupby（['id'，'location']）['id'].count（）.loc[：，'null']输出[932]：身份证件01    2名称：id，数据类型：int64

回答2017年11月2日20:52

贝尼

32.2万22枚金徽章173枚银徽章246枚青铜徽章

添加评论 |

MaxU-乌克兰展台 · Accepted Answer · 2017-11-02 21:02:22Z

4

在[16]中：df_a.set_index（'id'）['位置'].eq（'null'）.sum（level=0）输出[16]：身份证件01    2.002    0.0名称：location，数据类型：float64

回答2017年11月2日21:02

21万36枚金徽章398枚银徽章426枚青铜徽章

添加评论 |

3个答案三