Вопрос о взятии образца и сохранении данных из файлов U2 с заголовками

Question

Вопрос о взятии образца и сохранении данных из файлов U2 с заголовками

Относительный новичок в использовании Uniquery. Я нашел некоторую полезную документацию и ответы от предыдущих пользователей, размещающих здесь и на других сайтах. Я пытаюсь документировать то, что у нас есть в наших файлах U2, так как мы изучаем варианты переноса исторических данных в хранилище данных, работающее на SQL.

Я был в состоянии перечислить, как файлы структурированы с LIST DICT <<FILENAME>>, а также сохранить эти результаты в файл, который я затем могу просматривать в Excel.

Как только я нашел эти основные данные, я захотел взять некоторые данные из каждого из этих файлов. Если я использую, LIST <<FILENAME>> ALL TO DELIM "|" /TSTSAMPLE.TXT SAMPLE 300Я могу получить этот образец. Однако мне было интересно, есть ли способ создать файл с разделителями табуляции вместо использования трубы в качестве разделителя?

Другой вопрос, который у меня возник, был, если бы кто-нибудь знал, как получить заголовки, которые идут с сохраняемыми данными?

Я видел несколько предложений по использованию XML, LIST <<FILENAME>> ALL TOXML, который работает, но не похоже, что пустые элементы помещаются в сохраненный файл.

Дополнительно использовали, UDT.OPTIONS 91 ON, чтобы получить любые даты в удобочитаемом формате для сохраненного файла.

Спасибо всем профессионалам U2, которые могут предложить предложения.

1

unidata u2 uniquery

Источник

user10514763 16 окт '18 в 19:30

1 ответ

Решение

Другие вопросы по тегам unidata u2 uniquery

user988525 18 окт '18 в 06:58 2018-10-18 06:58 · Accepted Answer · 2018-10-18 06:58

Вы определенно на правильном пути. UDT.OPTIONS 91 ON необходим для полей даты и денег. Что касается конкретного вопроса экспорта с разделителями табуляции, я нигде не видел его документированного, но это работает для меня:

LIST <<FILENAME>> ALL TO DELIM 9 /TSTSAMPLE.TXT SAMPLE 300

Очевидно, 9 представляет CHAR(9) для таб. Я не уверен, работают ли другие символы так же - я всегда использую 9 или "|". Я не использую ВСЕ, потому что у меня есть словари, которые беспорядочные, но полезные для вас, если у вас все в порядке.

Для заголовков это сложная вещь в целом. Я тоже попытался решить эту проблему и в итоге создал заголовок с разделителями табуляции для использования в каждом файле. Вы можете начать с XML-дампа и внести некоторые изменения в ваш любимый редактор, чтобы не пришлось делать все это с нуля.

Другая вещь, которая является очень сложной, - это а) идентификация полей MV и затем б) принятие решения о том, кто контролирует, а какой зависит. У меня есть программа, которая делает это путем подсчета меток MV в образце данных и пытается выстроить в ряд те поля, которые имеют одинаковое количество во всех записях. Если вы хотите это сделать, я могу опубликовать на github или где-то еще. Это сложно, и если ваши данные не являются абсолютно чистыми, то не на 100% правильными.