Улучшение скорости в tesseract для многих изображений
У вас есть идеи, как улучшить скорость тессеракта для многих изображений? У меня есть 2 примера. Сначала я конвертирую изображение в текст, содержащий около 200 слов. Это займет 1 секунду. Во-вторых, у меня есть цикл из 100 изображений, которые содержат 2 слова, и это занимает 16 секунд. Как улучшить время для второго случая?
Код 1:
import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image.jpg'
multi = Image.open(patch)
result = pytesseract.image_to_string(multi)
Код 2:
import pytesseract
from PIL import Image
patch = './pdf_2_jpg/image2.jpg'
single = Image.open(patch)
for x in range(100):
result = pytesseract.image_to_string(single,lang='eng',config='--psm 6')