Найдите имя столбца в DF Pandas, который содержит самый длинный список

Question

Найдите имя столбца в DF Pandas, который содержит самый длинный список

Имея Pandas DataFrame со списками, хранящимися в нескольких столбцах, существует ли простой способ найти имя столбца, который содержит самый длинный список для каждой строки?

Например, с этими данными:

                          positive                 negative          neutral
1   [marvel, moral, bold, destiny]                       []   [view, should]
2                      [beautiful]      [complicated, need]               []
3                      [celebrate]   [crippling, addiction]            [big]

Я хочу идентифицировать "положительный" как столбец с самым длинным списком для строки 1 и "отрицательный" для строк 2 и 3.

Я думал, что мог бы использовать str.len() рассчитать длину списка и idmax() чтобы получить имена столбцов, но не могу понять, как их объединить.

9

python python-3.x pandas

Источник

user2950747 22 авг '17 в 21:24

3 ответа

Решение

>>> df.apply(lambda row: row.apply(len).argmax(), axis=1)
0    positive
1    negative
2    negative
dtype: object

5

Источник

user2411802 22 авг '17 в 21:25

Или вы можете попробовать это...

df=df.reset_index()
DF=pd.melt(df,id_vars=['index'])
DF['Length']=DF['value'].apply(lambda x : len(x))
DF.sort_values(['index','Length']).drop_duplicates(subset=['index'],keep='last')

2

Источник

user7964527 22 авг '17 в 21:41

Другие вопросы по тегам python python-3.x pandas

user5741205 22 авг '17 в 21:34 2017-08-22 21:34 · Accepted Answer · 2017-08-22 21:34

IIUC:

In [227]: df.applymap(len).idxmax(axis=1)
Out[227]:
0    positive
1    negative
2    negative
dtype: object

15

Источник

user5741205 22 авг '17 в 21:34