Python: список объектов memmap становится типом 'None' внутри параллели joblib
Я делаю следующее:
- У меня есть список тензорных слоев DNN.
nn.append(tf.layers.dense(...))
- Каждый из приведенного выше списка добавляется в список объектов np.memmap.
nnList[i] = nn
- Я могу получить доступ к списку memmap и получить тензоры. Но когда попытаться получить доступ к тензорам внутри
joblib.parallel
возвращает объект типа "Нет". Тем не менее, длина списка memmap правильна внутриjoblib.parallel
,
Я приложил пример кода ниже.
import os
import tempfile
import numpy as np
import tensorflow as tf
from joblib import Parallel, delayed, load, dump
tmpFolder = tempfile.mkdtemp()
__nnFile = os.path.join(tmpFolder, 'nn.mmap')
nnList = np.memmap(__nnFile, dtype=object, mode='w+', shape=(5))
def main():
for i in range(5):
nn = []
input = tf.placeholder(dtype=tf.float32, shape=(1, 8))
nn.append(tf.layers.dense(inputs=input, units=8, activation=tf.sigmoid,
trainable=False))
nn.append(tf.layers.dense(inputs=nn[0], units=2, activation=tf.sigmoid,
trainable=False))
nnList[i] = nn
print('nnList: ' + str(len(nnList)))
for i in range(5):
nn = nnList[i]
print(nn)
print(nn[-1])
print('--------------------------- ' + str(i))
with Parallel(n_jobs = -1) as parallel:
parallel(delayed(func1)(i) for i in range(5))
def func1(i):
print('nnList: ' + str(len(nnList)))
for x in range(5):
nn = nnList[x]
print(nn)
print('--------------------------- ' + str(x))
if __name__ == '__main__':
main()
Приведенный выше код дает этот вывод. Обратите внимание на длину массивов и то, как становятся тензоры None
,
nnList: 5
[<tf.Tensor 'dense/Sigmoid:0' shape=(1, 8) dtype=float32>, <tf.Tensor 'dense_1/Sigmoid:0' shape=(1, 2) dtype=float32>]
Tensor("dense_1/Sigmoid:0", shape=(1, 2), dtype=float32)
--------------------------- 0
[<tf.Tensor 'dense_2/Sigmoid:0' shape=(1, 8) dtype=float32>, <tf.Tensor 'dense_3/Sigmoid:0' shape=(1, 2) dtype=float32>]
Tensor("dense_3/Sigmoid:0", shape=(1, 2), dtype=float32)
--------------------------- 1
[<tf.Tensor 'dense_4/Sigmoid:0' shape=(1, 8) dtype=float32>, <tf.Tensor 'dense_5/Sigmoid:0' shape=(1, 2) dtype=float32>]
Tensor("dense_5/Sigmoid:0", shape=(1, 2), dtype=float32)
--------------------------- 2
[<tf.Tensor 'dense_6/Sigmoid:0' shape=(1, 8) dtype=float32>, <tf.Tensor 'dense_7/Sigmoid:0' shape=(1, 2) dtype=float32>]
Tensor("dense_7/Sigmoid:0", shape=(1, 2), dtype=float32)
--------------------------- 3
[<tf.Tensor 'dense_8/Sigmoid:0' shape=(1, 8) dtype=float32>, <tf.Tensor 'dense_9/Sigmoid:0' shape=(1, 2) dtype=float32>]
Tensor("dense_9/Sigmoid:0", shape=(1, 2), dtype=float32)
--------------------------- 4
nnList: 5
None
--------------------------- 0
None
--------------------------- 1
None
--------------------------- 2
None
--------------------------- 3
None
--------------------------- 4
Как я могу получить доступ к тензорам внутри joblib.parallel
? Пожалуйста помоги.
1 ответ
Нашел проблему тогда. Надеюсь, это поможет кому-то в будущем.
None
Проблема не имела ничего общего с тензорами. Я использовал joblib.Parallel
функционировать неправильно.
Нужно передать переменную delayed
быть доступным для разветвленных процессов (как я упустил это из виду в документации!). Правильный путь:
with Parallel(n_jobs = -1) as parallel:
parallel(delayed(func1)(i, WHATEVER_VARIABLE_I_WANT) for i in range(5))