Снимите предварительную проверку таблицы на листе Excel перед сохранением в виде текстового файла с разделителями табуляции
Часто я получаю данные в виде "красивых таблиц" на многих листах в книге Excel. Под "симпатичным" я подразумеваю, что в верхней и нижней части каждого листа есть пояснительный текст, заголовки имеют объединенные ячейки, между заголовком и первой строкой данных есть пустые строки, между столбцами данных есть пустые столбцы и т. Д.
Есть ли лучшая практика для сокращения ручного труда здесь?
Одним из подходов может быть исправление всех этих таблиц в Excel. Другой способ - сохранить "как есть" в текстовом формате с разделителями табуляции, вручную выбрать и импортировать строки данных, удалить пустые столбцы и вручную ввести информацию заголовка. Я склонен делать позже, но даже это довольно ручное.
Что делают профессионалы? Когда я делаю это таким образом, я чувствую себя парнем, который не знает о том, что нужно делать.
FWIW, я использую Python, Stata и R для большинства вещей, но я открыт для любого инструмента, который упрощает этот процесс. Спасибо!
1 ответ
Честно говоря, степень автоматизации, которую я использую в процессе очистки данных, зависит от того, сколько раз мне придется это делать. Для меня я думаю, что изменение файлов в Excel с помощью макроса.
Если ваши файлы всегда имеют одинаковый формат (для конкретной задачи), вы можете просто записать макрос шагов, которые вы делаете, чтобы очистить их, и сохранить их в своей личной книге.
Если они немного отличаются, но имеют разные вариации на тему, вы можете модифицировать записанную марку (в идеале выделив такие функции, как DeleteTopRows
а также DeleteEmptyColumns
который будет принимать различные параметры в зависимости от входного файла)
Я думаю, что Excel VBA - самое простое место для работы такого типа, потому что приложение Excel может помочь с множеством встроенных функций. Например, в вашем листе выше Range("10:11").Delete
удалит их.