xarray эквивалент панды вычитать / добавить
Я ищу краткий способ сделать арифметику для одного измерения DataArray, а затем вернуть результат в виде нового DataArray (как измененные, так и неизмененные части). В пандах я бы сделал это с помощью df.subtract(), но я не нашел способа сделать это с помощью xarray.
Вот как я бы вычел значение 2 из измерения х в пандах:
data = np.arange(0,6).reshape(2,3)
xc = np.arange(0, data.shape[0])
yc = np.arange(0, data.shape[1])
df1 = pd.DataFrame(data, index=xc, columns=yc)
df2 = df1.subtract(2, axis='columns')
Для xarray, хотя я не знаю:
da1 = xr.DataArray(data, coords={'x': xc, 'y': yc}, dims=['x' , 'y'])
da2 = ?
2 ответа
В xarray вы можете вычесть из строк или столбцов массива, используя широковещательную рассылку по имени измерения.
Например:
>>> foo = xarray.DataArray([[1, 2, 3], [4, 5, 6]], dims=['x', 'y'])
>>> bar = xarray.DataArray([1, 4], dims='x')
# subtract along 'x'
>>> foo - bar
<xarray.DataArray (x: 2, y: 3)>
array([[0, 1, 2],
[0, 1, 2]])
Dimensions without coordinates: x, y
>>> baz = xarray.DataArray([1, 2, 3], dims='y')
# subtract along 'y'
>>> foo - baz
<xarray.DataArray (x: 2, y: 3)>
array([[0, 0, 0],
[3, 3, 3]])
Dimensions without coordinates: x, y
Это работает аналогично axis='columns'
против axis='index'
опции, которые предоставляет pandas, за исключением того, что на нужное измерение ссылается имя.
Когда вы делаете:
df1 = pd.DataFrame(data, index=xc, columns=yc)
df2 = df1.subtract(2, axis='columns')
Вы действительно просто вычитаете 2 из всего набора данных...
Вот ваш вывод сверху:
In [15]: df1
Out[15]:
0 1 2
0 0 1 2
1 3 4 5
In [16]: df2
Out[16]:
0 1 2
0 -2 -1 0
1 1 2 3
Что эквивалентно:
df3 = df1.subtract(2)
In [20]: df3
Out[20]:
0 1 2
0 -2 -1 0
1 1 2 3
И эквивалентно:
df4 = df1 -2
In [22]: df4
Out[22]:
0 1 2
0 -2 -1 0
1 1 2 3
Поэтому для массива данных xarray:
da1 = xr.DataArray(data, coords={'x': xc, 'y': yc}, dims=['x' , 'y'])
da2 = da1-2
In [24]: da1
Out[24]:
<xarray.DataArray (x: 2, y: 3)>
array([[0, 1, 2],
[3, 4, 5]])
Coordinates:
* y (y) int64 0 1 2
* x (x) int64 0 1
In [25]: da2
Out[25]:
<xarray.DataArray (x: 2, y: 3)>
array([[-2, -1, 0],
[ 1, 2, 3]])
Coordinates:
* y (y) int64 0 1 2
* x (x) int64 0 1
Теперь, если вы хотите вычесть из определенного столбца, это другая проблема, которая, я думаю, потребует индексации назначений.