Применение функции к списку путей к файлам и запись вывода csv в соответствующие пути
Как применить функцию к списку созданных мной путей к файлам и записать вывод csv по тому же пути?
прочитать файл в подпапке -> выполнить функцию -> записать файл в подпапку -> перейти в следующую подпапку
#opened xml by filename
with open(r'XML_opsReport 100001.xml', encoding = "utf8") as fd:
Odict_parsedFromFilePath = xmltodict.parse(fd.read())
#func called in func below
def activity_to_df_one_day (list_activity_this_day):
ib_list = [pd.DataFrame(list_activity_this_day[i], columns=list_activity_this_day[i].keys()).drop("@uom") for i in range(len(list_activity_this_day))]
return pd.concat(ib_list)
#Processes parsed xml and writes csv
def activity_to_df_all_days (Odict_parsedFromFilePath, subdir): #writes csv from parsed xml after some processing
nodes_reports = Odict_parsedFromFilePath['opsReports']['opsReport']
list_activity = []
for i in range(len(nodes_reports)):
try:
df = activity_to_df_one_day(nodes_reports[i]['activity'])
list_activity.append(df)
except KeyError:
continue
opsReport = pd.concat(list_activity)
opsReport['dTimStart'] = pd.to_datetime(opsReport['dTimStart'], infer_datetime_format =True)
opsReport.sort_values('dTimStart', axis=0, ascending=True, inplace=True, kind='quicksort', na_position='last')
opsReport.to_csv("subdir\opsReport.csv") #write to the subdir
def scanfolder(): #fetches list of file-paths with desired starting name.
list_files = []
for path, dirs, files in os.walk(r'C:\..\xml_objects'): #directory containing several subfolders
for f in files:
if f.startswith('XML_opsReport'):
list_files.append(os.path.join(path, f))
return list_files
filepaths = scanfolder() #list of file-paths
Каждая функция работает хорошо, обработка XML хороша, поэтому я не разделяю структуру xml. Есть более 100 путей filepaths
, каждый отдельный подкаталог. Я хочу иметь возможность применять вышеуказанный поток и в будущем, где я могу получить пути к файлам и выполнять желаемые действия. Важно записать файл csv в его подкаталог.
2 ответа
Чтобы получить каталог, в котором находится файл, вы можете использовать:
import os
for root, dirs, files, in os.walk(some_dir):
for f in files:
print(root)
output_file = os.path.join(root, "output_file.csv")
print(output_file)
Это то, что вы ищете?
Выход:
somedir
somedir\output_file.csv
См. Также Python 3 - дерево каталогов путешествий с ограниченной глубиной рекурсии и поиск текущего каталога и каталога файла.
Смог решить с os.path.join
,
exceptions_path_list =[]
for i in filepaths:
try:
with open(i, encoding = "utf8") as fd:
doc = xmltodict.parse(fd.read())
activity_to_df_all_days (doc, i)
except ValueError:
exceptions_path_list.append(os.path.dirname(i))
continue
def activity_to_df_all_days (Odict_parsedFromFilePath, filepath):
...
...
...
opsReport.to_csv(os.path.join(os.path.dirname(filepath), "opsReport.csv"))