Создать новый столбец в новой таблице с помощью Revoscalepy
Я работаю над набором данных, в котором мне нужно создать новый столбец на основе существующего столбца, короче говоря, я преобразовываю переменные, используя rx_data_step.
Я следую за приведенными ниже документами Microsoft.
https://docs.microsoft.com/en-us/machine-learning-server/python-reference/revoscalepy/rx-data-step.
В документации Microsoft я пытаюсь создать новые столбцы с помощью файла.xdf, я хочу добиться того же, но с объектом data_source.
conn_str="Driver=SQL
Server;Server=xxxx;Database=yyyyy;Trusted_Connection=True"
##Input data source object
data_source = RxSqlServerData(sql_query = select * from
DummyTable,connection_string=conn_str)
Output Table
sqlOutScoreDS2 = RxSqlServerData(table =
"NewTable",connection_string=conn_str)
# Function to label whether the age in month is over 120 months.
month_limit = 120
new_col_name = "Over10Yr"
def transformFunc(data, cutoff, new_col_name):
ret = data
ret[new_col_name] = data.apply(lambda row: True if row.Age > cutoff
else
False, axis=1)
return ret
rx_data_step(input_data=data_source, transform_function=transformFunc,
transform_objects={"cutoff": month_limit,
"new_col_name": new_col_name},output_file=sqlOutScoreDS2)