Класс набора данных Geoviews занимает слишком много времени для сетки xarray среднего размера
Я пытаюсь построить сетку xarray, используя класс Geoviews Dataset. Данные имеют форму: (12,1300,1936) с координатами (месяцы, долгота, широта).
Создание экземпляра занимает слишком много времени (почти 7 часов в компьютере i5 32 ГБ Ram). Построение меньшего набора данных работает (занимает несколько секунд).
Это строковое представление xarray (с именем xmam):
<xarray.DataArray (MeanTemp Month:: 12, Latitude: 1300, Longitude: 1936)>
array([[[ nan, nan, ..., nan, nan],
[ 14., 14., ..., nan, nan],
...,
[ nan, nan, ..., nan, nan],
[ nan, nan, ..., nan, nan]],
[[ nan, nan, ..., nan, nan],
[ 16., 16., ..., nan, nan],
...,
[ nan, nan, ..., nan, nan],
[ nan, nan, ..., nan, nan]],
...,
[[ nan, nan, ..., nan, nan],
[ 17., 17., ..., nan, nan],
...,
[ nan, nan, ..., nan, nan],
[ nan, nan, ..., nan, nan]],
[[ nan, nan, ..., nan, nan],
[ 14., 14., ..., nan, nan],
...,
[ nan, nan, ..., nan, nan],
[ nan, nan, ..., nan, nan]]], dtype=float32)
Coordinates:
* MeanTemp Month: (MeanTemp Month:) |S9 'January' 'February' ... 'December'
* Latitude (Latitude) float64 25.57 25.56 25.55 ... 14.76 14.75 14.74
* Longitude (Longitude) float64 -103.6 -103.6 -103.6 ... -87.49 -87.48
Вот как я создаю экземпляр набора данных Geoviews
gvds = gv.Dataset(xmam,kdims=['Latitude', 'Longitude'],vdims=['MeanTemp Month:'],dynamic=True)
Я пробовал с и без
dynamic
параметр, дающий аналогичные результаты.
Как вы думаете, это проблема?
Обратите внимание, что Datashader
не имеет никакой роли, потому что я просто создаю объект, даже не строю его!
1 ответ
Проблема была в двух:
- Как xarray (xa) был построен. Это
dims
Аргумент сделать ссылку на имя координат.coords
параметр (если это словарь) должен иметь то же имя, что иdim
,
Рассмотрим следующий пример: Предполагая, data
это numy narray с формой (12 100 100)
coords_months = range(12)
coords_lon = np.linspace(-103,87,100)
coords_lat = np.linspace(14,25,100)
dims = ['months','longitude', 'latitude']
coords = {'months':coords_months,'latitude':coords_lat,'longitude':coords_lon }
xdata = xa.DataArray(data,coords=coords,dims=dims,name='MeanTemperature')
- Как упоминал philippjfr, объявление конструктора DataSet Geoviews (gv) было неверным.
Вместо этого я использовал это:
gvds = gv.Dataset(xdata)
Построение заняло немного времени (2 минуты). Однако я мог бы использовать метод regrid, определенный в:
from holoviews.operation.datashader import regrid
image = gvds.to(gv.Image,['Longitude','Latitude'],dynamic=True)
regrid(image)
который работал отлично.
Другой связанный вопрос здесь