как фильтровать/запрашивать данные из функции Python SASPY to_df
Я работаю над Python над некоторыми данными, полученными с сервера SAS. В настоящее время я использую функцию SASPY to_df(), чтобы перенести ее из SAS в локальные панды.
Я хотел бы знать, возможно ли фильтровать/запрашивать передаваемые данные, чтобы я мог избежать ненужного и ускорить загрузку.
Я ничего не нашел в документации по saspy, она предлагает только возможность использования «**kwargs», но я не мог понять, как это сделать.
Спасибо.
1 ответ
Вам необходимо определить объект sasdata, используя параметр набора данных WHERE=, чтобы ограничить извлекаемые наблюдения.
https://sassoftware.github.io/saspy/api.html#saspy.sasdata.SASdata
Затем, когда вы используете метод to_df(), будут переданы только выбранные данные.
Вы также можете использовать параметр набора данных KEEP= или DROP=, чтобы ограничить количество передаваемых переменных. Помните, что для ссылки на любые переменные в опции WHERE= они должны быть сохранены.
Похоже, что «**kwargs» касается изменения способа подключения к серверу SAS, так что это не важно для того, что вы хотите.