Вычтите последовательные столбцы в кадре данных Pandas или Pyspark

Question

Вычтите последовательные столбцы в кадре данных Pandas или Pyspark

Я хотел бы выполнить следующую операцию в фрейме данных pandas или pyspark, но я все еще не нашел решения.

Я хочу вычесть значения из последовательных столбцов в кадре данных.

Операцию, которую я описываю, можно увидеть на изображении ниже.

Имейте в виду, что у выходного информационного кадра не будет никаких значений в первом столбце, поскольку первый столбец во входной таблице не может быть вычтен из предыдущего, поскольку он не существует.

4

python pandas pyspark multiple-columns subtract

Источник

user3519060 12 июл '16 в 06:26

2 ответа

Решение

df = pd.DataFrame(np.random.rand(3, 4), ['row1', 'row2', 'row3'], ['A', 'B', 'C', 'D'])
df.T.diff().T

1

Источник

user2336654 12 июл '16 в 06:35

Другие вопросы по тегам python pandas pyspark multiple-columns subtract

user704848 12 июл '16 в 08:10 2016-07-12 08:10 · Accepted Answer · 2016-07-12 08:10

diff имеет axis параметр, так что вы можете просто сделать это за один шаг:

In [63]:
df = pd.DataFrame(np.random.rand(3, 4), ['row1', 'row2', 'row3'], ['A', 'B', 'C', 'D'])
df

Out[63]:
             A         B         C         D
row1  0.146855  0.250781  0.766990  0.756016
row2  0.528201  0.446637  0.576045  0.576907
row3  0.308577  0.592271  0.553752  0.512420

In [64]:
df.diff(axis=1)

Out[64]:
       A         B         C         D
row1 NaN  0.103926  0.516209 -0.010975
row2 NaN -0.081564  0.129408  0.000862
row3 NaN  0.283694 -0.038520 -0.041331