Класс набора данных Geoviews занимает слишком много времени для сетки xarray среднего размера

Я пытаюсь построить сетку xarray, используя класс Geoviews Dataset. Данные имеют форму: (12,1300,1936) с координатами (месяцы, долгота, широта).

Создание экземпляра занимает слишком много времени (почти 7 часов в компьютере i5 32 ГБ Ram). Построение меньшего набора данных работает (занимает несколько секунд).

Это строковое представление xarray (с именем xmam):

<xarray.DataArray (MeanTemp Month:: 12, Latitude: 1300, Longitude: 1936)>
array([[[ nan,  nan, ...,  nan,  nan],
        [ 14.,  14., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       [[ nan,  nan, ...,  nan,  nan],
        [ 16.,  16., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       ..., 
       [[ nan,  nan, ...,  nan,  nan],
        [ 17.,  17., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]],

       [[ nan,  nan, ...,  nan,  nan],
        [ 14.,  14., ...,  nan,  nan],
        ..., 
        [ nan,  nan, ...,  nan,  nan],
        [ nan,  nan, ...,  nan,  nan]]], dtype=float32)
Coordinates:
  * MeanTemp Month:  (MeanTemp Month:) |S9 'January' 'February' ... 'December'
  * Latitude         (Latitude) float64 25.57 25.56 25.55 ... 14.76 14.75 14.74
  * Longitude        (Longitude) float64 -103.6 -103.6 -103.6 ... -87.49 -87.48

Вот как я создаю экземпляр набора данных Geoviews

gvds = gv.Dataset(xmam,kdims=['Latitude', 'Longitude'],vdims=['MeanTemp Month:'],dynamic=True)

Я пробовал с и без dynamic параметр, дающий аналогичные результаты.

Как вы думаете, это проблема?

Обратите внимание, что Datashader не имеет никакой роли, потому что я просто создаю объект, даже не строю его!

1 ответ

Проблема была в двух:

  1. Как xarray (xa) был построен. Это dims Аргумент сделать ссылку на имя координат. coords параметр (если это словарь) должен иметь то же имя, что и dim,

Рассмотрим следующий пример: Предполагая, data это numy narray с формой (12 100 100)

coords_months = range(12)
coords_lon = np.linspace(-103,87,100)
coords_lat = np.linspace(14,25,100)
dims = ['months','longitude', 'latitude']
coords = {'months':coords_months,'latitude':coords_lat,'longitude':coords_lon }
xdata = xa.DataArray(data,coords=coords,dims=dims,name='MeanTemperature')
  1. Как упоминал philippjfr, объявление конструктора DataSet Geoviews (gv) было неверным.

Вместо этого я использовал это:

gvds = gv.Dataset(xdata)

Построение заняло немного времени (2 минуты). Однако я мог бы использовать метод regrid, определенный в:

from holoviews.operation.datashader import regrid
image = gvds.to(gv.Image,['Longitude','Latitude'],dynamic=True)
regrid(image)

который работал отлично.

Другой связанный вопрос здесь

Другие вопросы по тегам