Есть ли какое-то ограничение на количество выводимых данных, которые Python 3.4 позволяет использовать метод write() одновременно?

Я поместил конечные методы print () рядом со строками метода write () в конце моего кода, чтобы проверить, почему мои выходные файлы были неполными. Но вывод print () - это все, что я ожидаю; в то время как вывод write () отключен на непонятную величину (только 150 из 200 "вещей"). Эталонное изображение вывода: IDLE против внешнего выходного файла

К вашему сведению: Win 7 64 // Python 3.4.2

Мои модули берут файл титров SRT ('test.srt') и возвращают объект списка, который я создаю из него; в частности, один с 220 записями списка в форме: [[(index), [time], string]]

times = open('times.txt', 'w')

### A portion of Riobard's SRT Parser: srt.py
import re

def tc2ms(tc):
    ''' convert timecode to millisecond '''

    sign    = 1
    if tc[0] in "+-":
        sign    = -1 if tc[0] == "-" else 1
        tc  = tc[1:]

    TIMECODE_RE     = re.compile('(?:(?:(?:(\d?\d):)?(\d?\d):)?(\d?\d))?(?:[,.](\d?\d?\d))?')
    match   = TIMECODE_RE.match(tc)
    try: 
        assert match is not None
    except AssertionError:
        print(tc)
    hh,mm,ss,ms = map(lambda x: 0 if x==None else int(x), match.groups())
    return ((hh*3600 + mm*60 + ss) * 1000 + ms) * sign

# my code
with open('test.srt') as f:
    file = f.read()

srt = []

for line in file:
    splitter = file.split("\n\n")

# SRT splitter
i = 0
j = len(splitter)
for items in splitter:
    while i <= j - 2:
        split_point_1 = splitter[i].index("\n")
        split_point_2 = splitter[i].index("\n", split_point_1 + 1)
        index = splitter[i][:split_point_1]
        time = [splitter[i][split_point_1:split_point_2]]
        time = time[0][1:]
        string = splitter[i][split_point_2:]
        string = string[1:]
        list = [[(index), [time], string]]
        srt += list
        i += 1

# time info outputter
i = 0
j = 1
for line in srt:
    if i != len(srt) - 1:
        indexer = srt[i][1][0].index(" --> ")
        timein = srt[i][1][0][:indexer]
        timeout = srt[i][1][0][-indexer:]
        line_time = (tc2ms(timeout) - tc2ms(timein))/1000
        space_time = ((tc2ms((srt[j][1][0][:indexer]))) - (tc2ms(srt[i][1][0][-indexer:])))/1000
        out1 = "The space between Line " + str(i) + " and Line " + str(j) + " lasts " + str(space_time) + " seconds." + "\n"
        out2 = "Line " + str(i) + ": " + str(srt[i][2]) + "\n\n"
        times.write(out1)
        times.write(out2)
        print(out1, end="")
        print(out2)
        i += 1
        j += 1
    else:
        indexer = srt[i][1][0].index(" --> ")
        timein = srt[i][1][0][:indexer]
        timeout = srt[i][1][0][-indexer:]
        line_time = (tc2ms(timeout) - tc2ms(timein))/1000
        outend = "Line " + str(i) + ": " + str(srt[i][2]) + "\n<End of File>"
        times.write(outend)
        print(outend)

Мои два выходных файла метода write (), соответственно, распечатывают только ~150 или ~200 элементов из 220 вещей, которые он иначе правильно выводит на экран.

1 ответ

Решение

Вы хотите закрыть свой times файл, когда закончил писать; операционные системы используют буферы записи для ускорения файлового ввода-вывода, собирая большие блоки данных для записи на диск за один раз; закрытие файла очищает этот буфер:

times.close()

Попробуйте открыть файл в with блок:

with open('times.txt', 'w') as times:
    # all code that needs to write to times
Другие вопросы по тегам