Почему моя обучающая функция выдает ошибку имени "Распад имени не определен"?
Итак, я новичок в НЛП, и я пытаюсь обучить текстовый классификатор с помощью spacy_transformers. было показано, что этот код работает, но он вызывает ошибки на моем компьютере. В качестве примечания, может ли это быть вызвано жиром, из-за которого я запускаю его на процессоре?
def train_classifier(n_epoch:int=5,
train_data:list=None,
val_text:tuple=None,
val_label:list=None,
batch_size:int=32,
lr:float=1e-3):
train_stats = []
dropout = decaying(0.2, 0.1, 0.3) # Gradually decrease dropout rate from 0.2 to 0.1
# Cyclic triangular rate (https://arxiv.org/abs/1506.01186)
learn_rates = cyclic_triangular_rate(
lr / 3, lr * 3, 2 * len(train_data) // batch_size
)
for epoch in range(n_epoch):
random.shuffle(train_data)
batches = minibatch(train_data, size=batch_size)
losses = {}
for batch in batches:
optimizer.trf_lr = next(learn_rates)
texts, cats = zip(*batch)
nlp.update(
texts,
cats,
drop = next(dropout),
sgd = optimizer,
losses=losses)
а затем, когда я передаю функцию
train_classifier(n_epoch=10, train_data=train_data, val_text=val_text, val_label=val_label, batch_size=32, lr=2e-6)
я получаю следующую ошибку
<ipython-input-55-5bb071ef310c> in train_classifier(n_epoch, train_data, val_text, val_label, batch_size, lr)
6 lr:float=1e-3):
7 train_stats = []
----> 8 dropout = decaying(0.2, 0.1, 0.3) # Gradually decrease dropout rate from 0.2 to 0.1
9 # Cyclic triangular rate (https://arxiv.org/abs/1506.01186)
10 learn_rates = cyclic_triangular_rate(
NameError: name 'decaying' is not defined
1 ответ
Решение
Я совсем не знаком с spacy, но после нескольких поисков в Google похоже, что эта функция может зависеть от функции spacy util.decaying. Без загруженной в память функции распада этоtrain_classifier
функция вызовет NameError
. Код дляdecaying
функция выглядит следующим образом, и ее можно найти здесь.
def decaying(start, stop, decay):
"""Yield an infinite series of linearly decaying values."""
curr = float(start)
while True:
yield max(curr, stop)
curr -= decay