Автоматизировать экспорт опроса IBM SPSS Data Collection?
Мне очень жаль неопределенный вопрос, но я надеюсь, что эксперт SPSS сможет помочь мне здесь. У нас есть несколько опросов, которые проводятся через SPSS, из которых мы извлекаем данные для внутреннего отчета. В настоящее время этот процесс очень громоздкий и требует перехода на страницу администрирования сервера интервьюера SPSS Data Collection и ручного экспорта данных из двух разных проектов (что занимает несколько часов!). Затем мы берем эти данные, массируем их и загружаем в другую базу данных, которая управляет внутренним отчетом.
Мой вопрос: кто-нибудь знает, как автоматизировать этот процесс? Есть ли база данных SQL Server за данными SPSS? Где файл.mdd входит, чтобы играть? Может ли моя команда (которая хорошо разбирается в извлечении данных из различных источников) подключиться к базе данных SQL Server за SPSS, чтобы получить наши данные? Или нам нужен какой-то скрипт на Python и плагин?
Если мне не хватает информации, которая будет полезна при ответе на вопрос, пожалуйста, дайте мне знать. Я счастлив предоставить это; Я просто не знаю, что предоставить.
Спасибо.
3 ответа
Это не так просто, как работать напрямую с любой базой данных, содержащей данные, но вы можете сделать что-то с экспортированным набором данных:
Для вас может быть или не быть способа написать и запустить скрипт экспорта из вашей панели администратора или чего-то еще. Если нет, вы можете написать простой скрипт на Python, используя Selenium WebDriver, который входит в вашу панель администратора и экспортирует все данные в файл данных *.sav.
Затем вы можете использовать расширения Python SPSS для написания ваших скриптов анализа. Обратите внимание, что эти сценарии должны выполняться на компьютере, на котором установлена копия SPSS.
Если у вас есть данные и результаты анализа, доступные для Python, вы сможете легко записать их в свою другую базу данных.
Как упоминали другие участники, есть несколько способов добиться этого. Самое простое, что я могу предложить, - это использовать DMS (скрипт управления данными) и планировщик Windows. В идеале вы должны следовать нижеуказанным шагам.
Предварительные условия: 1. У вас должен быть доступ к серверу, на котором выполняется IBM Data collection 2. Базовые знания планировщика задач Windows 3. Знание сценариев DMS
Подход: 1. Создайте новый сценарий DMS из шаблона 2. Если вы хотите выполнять только извлечение / преобразование данных, вам нужен только источник входных и выходных данных 3. Во входном источнике данных создайте / создайте строку подключения, указывающую на ваш опрос на сервере сбора данных IBM. Используйте источник данных как SQL 4. В запросе select: используйте "Select * from VDATA", если вы хотите экспортировать все переменные. 5. Установите строку подключения к выходным данным, выбрав формат выходных данных как SPSS (если вы хотите экспортировать его). в SPSS) 6. Запустите скрипт вручную и посмотрите, соответствует ли экспорт SPSS 7. Создайте командный файл с помощью текстового редактора (сохраните с расширением.bat). Добавить ниже строки
cd "C:\Program Files\IBM\SPSS\DataCollection\6\DDL\Scripts\Data Management\DMS" вызов DMSRun YOURDMSFILENAME.dms
Затем добавьте строку, чтобы скопировать (используя XCOPY) данные / файлы, извлеченные в то место, где вы хотите продолжить их обработку.
- Сохраните файл и откройте планировщик Windows, чтобы запланировать выполнение этого пакетного файла для извлечения данных.
Если вы хотите выполнить дальнейшую обработку, вы создаете файл mrs или dms и добавляете его в пакетный файл.
Надеюсь это поможет!
Существует несколько способов облегчить эту задачу и даже полностью ее автоматизировать. Однако, если вы не являетесь экспертом по сбору данных IBM SPSS и не имеете доступа к кому-либо, кто имеет или имеет время стать им, я бы посоветовал связаться с некоторыми консультантами, которые предлагают услуги на платформе. Внутренне у IBM нет большого количества квалифицированных ресурсов SPSS, поэтому они в значительной степени полагаются на внешних партнеров для предоставления услуг во многих своих продуктах. В частности, это относится к IBM SPSS Data Collection, но в значительной степени относится и к SPSS Statistics.
Как отмечали предыдущие участники, существует подход, использующий Python для очистки данных, слияния и других преобразований, а затем загрузки этих результатов в базу данных отчетов. По причинам обслуживания я бы, вероятно, не предложил такой подход. Хотя вы, скорее всего, сможете автоматизировать экспорт данных из SPSS Data Collection в сохраненный файл с простым синтаксисом SPSS (и дополнительным компонентом данных SPSS), он чрезвычайно подвержен ошибкам при обновлении SPSS Statistics или SPSS Data Collection.,
С точки зрения передового опыта, вы должны использовать модуль SPSS Data Collection Data Management. Он очень гибкий и вряд ли требует какого-либо обслуживания обновлений, потому что вы работаете в одной и той же структуре модели данных (например, метаданные опроса, версии опроса, метки и т. Д. Обрабатываются неявно) вплоть до загрузки преобразованных данных в базу данных отчетов.
В идеале подход должен заключаться в том, чтобы создать упомянутый сценарий SPSS Data Collection Data Management и запускать его в конце каждого завершенного интервью. Таким образом, ваши отчеты будут близки к реальному времени (вы можете сделать его фактическим в реальном времени, запустив сценарий DM во время интервью, используя события сценария интервью - просто к сведению).
Все сценарии на платформе сбора данных SPSS, включая сценарии управления данными, очень похожи на VB, поэтому для большинства людей, знающих VB, очень легко начать работу, и это очень хорошо задокументировано в DDL SPSS Data Collection. Там вы также сможете найти примеры извлечения данных опроса из опросов SPSS Data Collection (а также чтения и записи данных в / из других баз данных, файлов и т. Д.). Есть также много примеров манипулирования данными и их преобразования.
Наконец, чтобы ответить на ваши конкретные вопросы:
- Да, за сбором данных SPSS всегда стоит MS SQL Server -
без исключений. Однако, вообще говоря, модель данных - это способ
сложно считывать данные прямо с него. Если вы посмотрите на это, вы быстро поймете это. - Файл MDD (сокращение от Meta Data Document) содержит все метаданные опроса, включая спецификации источника данных, историю версий и т. Д. Без него вы не сможете ничего сделать из данных опроса в базе данных, что является основной причиной, по которой я рекомендую оставаться на платформе сбора данных SPSS для максимально возможной части обработки ваших данных. Тем не менее, это действительно просто читаемый XML-файл.
Обратите внимание, что для модуля управления данными для сбора данных SPSS требуется отдельная лицензия, и если необходимые сценарии являются большими или сложными, вам, вероятно, также понадобится базовый специалист, если это не то, что вы уже используете для разработки вопросников и обработки опросов.
Надеюсь, это поможет.