Понимание вывода Python cProfile

Мои скрипты на Python анализируют файлы последовательно, делают простую очистку данных и записывают в новый CSV-файл. я использую csv, выполнение сценария занимает очень много времени.

cProfile вывод выглядит следующим образом:

Я много гуглил, прежде чем опубликовать вопрос здесь.

ссылка на изображение изображение ссылка

Добавляем сюда код, функция которого вызывается

def db_insert(coCode, bse):
start = time()
q = []
print os.path.join(FILE_PATH, str(bse)+"_clean.csv");
f1 = open(os.path.join(FILE_PATH, str(bse)+"_clean.csv"))
reader = csv.reader(f1)
reader.next()
end = time()
# print end-start
for idx,row in enumerate(reader):
    ohlc = {}
    date = datetime.strptime( row[0], '%Y-%m-%d')
    date = row[0]
    row  = row[1:6]
    (op, high, low, close, volume) = row
    ohlc[date] = {}
    ohlc[date]['open'] = op
    ohlc[date]['high'] = high
    ohlc[date]['low'] = low
    ohlc[date]['close'] = close
    ohlc[date]['volume'] = volume
    q.append(ohlc)
end1 = time()
# print end1-end

db.quotes.insert({'bse':str(bse), 'quotes':q})
# print time()-end1
f1.close()
q = []
print os.path.join(FILE_PATH, str(coCode)+".csv");
f2 = open(os.path.join(FILE_PATH, str(bse)+"_clean.csv"))
reader = csv.reader(f2)
reader.next()
for idx,row in enumerate(reader):
    ohlc = {}
    date = datetime.strptime( row[0], '%Y-%m-%d')
    date = row[0]
    try:
        extra = row[7]+row[8]+row[9]
    except:
        try:
            extra = row[7]
        except:
            extra = ''
    row  = row[1:6]
    (op, high, low, close, volume) = row
    ohlc[date] = {}
    ohlc[date]['open'] = op
    ohlc[date]['high'] = high
    ohlc[date]['low'] = low
    ohlc[date]['close'] = close
    ohlc[date]['volume'] = volume
    ohlc[date]['extra'] = extra
    q.append(ohlc)
db.quotes_unadjusted.insert({'bse':str(bse), 'quotes':q})
f2.close()

1 ответ

Я нашел это объяснение в ответе Джона Мачина.

ncalls имеет отношение только к той степени, в которой сравнение чисел с другими значениями, такими как число символов / полей / строк в файле, может выделить аномалии; Tottime и Cumtime это то, что действительно имеет значение. cumtime - это время, потраченное на функцию / метод, включая время, потраченное на функции / методы, которые она вызывает; totaltime - это время, потраченное на функцию / метод, исключая время, потраченное на функции / методы, которые она вызывает.

Другие вопросы по тегам