Вопрос о взятии образца и сохранении данных из файлов U2 с заголовками
Относительный новичок в использовании Uniquery. Я нашел некоторую полезную документацию и ответы от предыдущих пользователей, размещающих здесь и на других сайтах. Я пытаюсь документировать то, что у нас есть в наших файлах U2, так как мы изучаем варианты переноса исторических данных в хранилище данных, работающее на SQL.
Я был в состоянии перечислить, как файлы структурированы с LIST DICT <<FILENAME>>
, а также сохранить эти результаты в файл, который я затем могу просматривать в Excel.
Как только я нашел эти основные данные, я захотел взять некоторые данные из каждого из этих файлов. Если я использую, LIST <<FILENAME>> ALL TO DELIM "|" /TSTSAMPLE.TXT SAMPLE 300
Я могу получить этот образец. Однако мне было интересно, есть ли способ создать файл с разделителями табуляции вместо использования трубы в качестве разделителя?
Другой вопрос, который у меня возник, был, если бы кто-нибудь знал, как получить заголовки, которые идут с сохраняемыми данными?
Я видел несколько предложений по использованию XML, LIST <<FILENAME>> ALL TOXML
, который работает, но не похоже, что пустые элементы помещаются в сохраненный файл.
Дополнительно использовали, UDT.OPTIONS 91 ON
, чтобы получить любые даты в удобочитаемом формате для сохраненного файла.
Спасибо всем профессионалам U2, которые могут предложить предложения.
1 ответ
Вы определенно на правильном пути. UDT.OPTIONS 91 ON необходим для полей даты и денег. Что касается конкретного вопроса экспорта с разделителями табуляции, я нигде не видел его документированного, но это работает для меня:
LIST <<FILENAME>> ALL TO DELIM 9 /TSTSAMPLE.TXT SAMPLE 300
Очевидно, 9 представляет CHAR(9) для таб. Я не уверен, работают ли другие символы так же - я всегда использую 9 или "|". Я не использую ВСЕ, потому что у меня есть словари, которые беспорядочные, но полезные для вас, если у вас все в порядке.
Для заголовков это сложная вещь в целом. Я тоже попытался решить эту проблему и в итоге создал заголовок с разделителями табуляции для использования в каждом файле. Вы можете начать с XML-дампа и внести некоторые изменения в ваш любимый редактор, чтобы не пришлось делать все это с нуля.
Другая вещь, которая является очень сложной, - это а) идентификация полей MV и затем б) принятие решения о том, кто контролирует, а какой зависит. У меня есть программа, которая делает это путем подсчета меток MV в образце данных и пытается выстроить в ряд те поля, которые имеют одинаковое количество во всех записях. Если вы хотите это сделать, я могу опубликовать на github или где-то еще. Это сложно, и если ваши данные не являются абсолютно чистыми, то не на 100% правильными.