xarray эквивалент панды вычитать / добавить

Я ищу краткий способ сделать арифметику для одного измерения DataArray, а затем вернуть результат в виде нового DataArray (как измененные, так и неизмененные части). В пандах я бы сделал это с помощью df.subtract(), но я не нашел способа сделать это с помощью xarray.

Вот как я бы вычел значение 2 из измерения х в пандах:

data = np.arange(0,6).reshape(2,3)
xc = np.arange(0, data.shape[0])
yc = np.arange(0, data.shape[1])

df1 = pd.DataFrame(data, index=xc, columns=yc)
df2 = df1.subtract(2, axis='columns') 

Для xarray, хотя я не знаю:

da1 = xr.DataArray(data, coords={'x': xc, 'y': yc}, dims=['x' , 'y'])
da2 = ?

2 ответа

В xarray вы можете вычесть из строк или столбцов массива, используя широковещательную рассылку по имени измерения.

Например:

>>> foo = xarray.DataArray([[1, 2, 3], [4, 5, 6]], dims=['x', 'y'])

>>> bar = xarray.DataArray([1, 4], dims='x')

# subtract along 'x'
>>> foo - bar
<xarray.DataArray (x: 2, y: 3)>
array([[0, 1, 2],
       [0, 1, 2]])
Dimensions without coordinates: x, y

>>> baz = xarray.DataArray([1, 2, 3], dims='y')

# subtract along 'y'
>>> foo - baz
<xarray.DataArray (x: 2, y: 3)>
array([[0, 0, 0],
       [3, 3, 3]])
Dimensions without coordinates: x, y

Это работает аналогично axis='columns' против axis='index' опции, которые предоставляет pandas, за исключением того, что на нужное измерение ссылается имя.

Когда вы делаете:

df1 = pd.DataFrame(data, index=xc, columns=yc)
df2 = df1.subtract(2, axis='columns')

Вы действительно просто вычитаете 2 из всего набора данных...

Вот ваш вывод сверху:

In [15]: df1
Out[15]: 
   0  1  2
0  0  1  2
1  3  4  5

In [16]: df2
Out[16]: 
   0  1  2
0 -2 -1  0
1  1  2  3

Что эквивалентно:

df3 = df1.subtract(2)

In [20]: df3

Out[20]: 
   0  1  2
0 -2 -1  0
1  1  2  3

И эквивалентно:

df4 = df1 -2

In [22]: df4

Out[22]: 
   0  1  2
0 -2 -1  0
1  1  2  3

Поэтому для массива данных xarray:

da1 = xr.DataArray(data, coords={'x': xc, 'y': yc}, dims=['x' , 'y'])

da2 = da1-2

In [24]: da1

Out[24]: 
<xarray.DataArray (x: 2, y: 3)>
array([[0, 1, 2],
       [3, 4, 5]])
Coordinates:
  * y        (y) int64 0 1 2
  * x        (x) int64 0 1

In [25]: da2

Out[25]: 
<xarray.DataArray (x: 2, y: 3)>
array([[-2, -1,  0],
       [ 1,  2,  3]])
Coordinates:
  * y        (y) int64 0 1 2
  * x        (x) int64 0 1

Теперь, если вы хотите вычесть из определенного столбца, это другая проблема, которая, я думаю, потребует индексации назначений.

Другие вопросы по тегам