Код Automl SDK с местоположением файла из bigquery, но с проблемой при прогнозировании
Я создавал модель с использованием модуля GCP automl sdk в платформе AI (используя таблицу bigquery в качестве входных данных для обучения и прогнозирования) и прогнозирования с использованием batch_prediction. Проблема в том, что код работает нормально, но выходная таблица прогнозов пуста, а таблица ошибок содержит все серии из кадра данных прогноза и дополнительный столбец, в котором указан код ошибки 3, а ошибка: «Временной ряд не имеет значений для прогнозирования. Временной ряд был исключен из прогнозов ".
Код, который я использовал для обучения модели:
job = aiplatform.AutoMLForecastingTrainingJob(
display_name='train-sdk-automl_tst1',
optimization_objective='minimize-mae',
column_transformations=[
{"timestamp": {"column_name": "Date"}},
{"numeric": {"column_name": "Price"}},
{"numeric": {"column_name": "Grammage"}},
{"numeric": {"column_name": "apparentTemperatureMax"}},
{"numeric": {"column_name": "apparentTemperatureMin"}},
{"numeric": {"column_name": "Consumer_promo"}},
{"numeric": {"column_name": "Promo_Value"}},
{"numeric": {"column_name": "Trade_Promotion"}},
{"numeric": {"column_name": "Holiday"}},
{"numeric": {"column_name": "Sales"}},
]
)
# This will take around an hour to run
my_model = job.run(
dataset=ds,
target_column='Sales',
time_column='Date',
time_series_identifier_column='SKU',
available_at_forecast_columns=['Date', 'Price','Grammage'
,'apparentTemperatureMax','apparentTemperatureMin','Consumer_promo',
"Promo_Value","Trade_Promotion","Holiday"],
unavailable_at_forecast_columns=['Sales'],
forecast_horizon=21.0,
data_granularity_unit='week',
data_granularity_count=1,
weight_column=None,
budget_milli_node_hours=1000,
model_display_name='sdk_tsting_bq-forecast-model',
predefined_split_column_name=None
)
Код для прогнозов:
BATCH_PREDICT_SOURCE = 'bq://acn-intelligent-supply-chain.scoa_ml_forecast_tool.test_data_sdk1'
BATCH_PREDICT_DESTINATION_PREFIX = 'bq://acn-intelligent-supply-chain.scoa_ml_forecast_tool'
my_model.batch_predict(
bigquery_source=BATCH_PREDICT_SOURCE,
instances_format='bigquery',
bigquery_destination_prefix = BATCH_PREDICT_DESTINATION_PREFIX,
predictions_format='bigquery',
job_display_name='predict_sdk_tst')
Пожалуйста, подскажите, что здесь может быть не так.
1 ответ
Я считаю, что таблица BQ, используемая для пакетного прогнозирования, должна иметь значения NULL в целевом столбце (например, «Продажи»). Попробуйте, если вы еще этого не сделали, и посмотрите, поможет ли это.