преобразование данных txt (из файла журнала) в json с помощью Python?

У меня есть файл журнала в формате, показанном ниже:

      parsed: {'priority': '14', 'timestamp': '2021-04-13 13:42:07', 'hostname': 'invi-dev-gw2', 'rootname': 'root', 'pid': '27889', 'message': 'Session STARTED - Client[ID:8242, Physical: 111.119.187.47, Virtual: 10.1.0.66] <--> Service[Name:Attendance1, ID:704, Physical: 192.168.3.18, Virtual: 10.1.0.67]'}
parsed: {'priority': '15', 'timestamp': '2021-04-13 13:42:07', 'hostname': 'invi-dev-gw3', 'rootname': 'root', 'pid': '27890', 'message': 'Session STOPPED - Client[ID:8242, Physical: 111.119.187.47, Virtual: 10.1.0.66] <--> Service[Name:Attendance1, ID:704, Physical: 192.168.3.18, Virtual: 10.1.0.67]'}

В основном текстовый файл состоит из двух данных. Следующим шагом будет преобразование текстовых данных в JSON с помощью Python. Пока у меня есть скрипт python для преобразования JSON, как показано ниже:

      # Python program to convert text 
# file to JSON 
import json 


# the file to be converted to 
# json format 
filename = 'output.txt'

# dictionary where the lines from 
# text will be stored 
dict1 = {} 

# creating dictionary 
with open(filename) as fh: 

    for line in fh: 

        # reads each line and trims of extra the spaces 
        # and gives only the valid words 
        command, description = line.strip().split(None, 1) 

        dict1[command] = description.strip() 

# creating json file 
# the JSON file is named as test1 
out_file = open("test.json", "w") 
json.dump(dict1, out_file, indent = 4, sort_keys = False) 
out_file.close() 

Теперь файл JSON создан, но он показал только одни данные (на выходе должно быть 2 данных), как показано ниже:

          "parsed:": "{'priority': '15', 
                 'timestamp': '2021-04-13 13:42:07',
                  'hostname': 'invi-dev-gw3',
                  'rootname': 'root', 
                  'pid': '27890', 
                  'message': 'Session STOPPED - Client[ID:8242, Physical: 111.119.187.47, Virtual: 10.1.0.66] <--> Service[Name:Attendance1, ID:704, Physical: 192.168.3.18, Virtual: 10.1.0.67]'
}"

Я не знаю, почему он не печатает все данные. Он должен показать другие данные в файле JSON, но показать только один. Кто-нибудь может мне с этим помочь?

1 ответ

Решение

Где у вас есть dict1[command] = description.strip() вы действительно хотите чего-то большего: dict1[command].append(description.strip()) (так dict1очень хочется быть списком). Есть еще одна морщинка, которую вы, вероятно, хотели бы использовать. json.loads() но ваши входные данные используют одинарные кавычки, поэтому давайте проанализируем их с помощью ast

Я бы попробовал что-то вроде:

      import ast
import collections
import json

data_in = [
    "parsed: {'priority': '14', 'timestamp': '2021-04-13 13:42:07', 'hostname': 'invi-dev-gw2', 'rootname': 'root', 'pid': '27889', 'message': 'Session STARTED - Client[ID:8242, Physical: 111.119.187.47, Virtual: 10.1.0.66] <--> Service[Name:Attendance1, ID:704, Physical: 192.168.3.18, Virtual: 10.1.0.67]'}",
    "parsed: {'priority': '15', 'timestamp': '2021-04-13 13:42:07', 'hostname': 'invi-dev-gw3', 'rootname': 'root', 'pid': '27890', 'message': 'Session STOPPED - Client[ID:8242, Physical: 111.119.187.47, Virtual: 10.1.0.66] <--> Service[Name:Attendance1, ID:704, Physical: 192.168.3.18, Virtual: 10.1.0.67]'}"
]

data_out = collections.defaultdict(list)
for row in data_in:
    command, command_text = [value.strip() for value in row.split(":", 1)]
    data_out[command].append(ast.literal_eval(command_text))

print(json.dumps(data_out, indent=2))
Другие вопросы по тегам