iOS 11 Vision Framework - извлечение текста из изображения

Question

iOS 11 Vision Framework - извлечение текста из изображения

Я использую Vision Framework для iOS 11 для определения текста на изображении. Тексты обнаруживаются успешно, но как мы можем получить обнаруженный текст.

24

ios swift machine-learning computer-vision ios11 apple-vision

Источник

user3722268 15 июн '17 в 11:25

2 ответа

Другие вопросы по тегам ios swift machine-learning computer-vision ios11 apple-vision

user6599590 15 мар '20 в 15:01 2020-03-15 15:01 · Answer 1 · 2020-03-15 15:01

В Apple Vision вы можете легко извлекать текст из изображения с помощью класса VNRecognizeTextRequest, что позволяет вам делать запрос анализа изображения, который находит и распознает текст в изображении.

VNRecognizeTextRequestработает начиная с iOS 13.0 и macOS 10.15.

Вот фрагмент кода, показывающий, как это сделать:

let requestHandler = VNImageRequestHandler(url: imageURL, options: [:])

let request = VNRecognizeTextRequest { (request, error) in

    guard let observations = request.results as? [VNRecognizedTextObservation] 
    else { return }

    for observation in observations {

        let topCandidate: [VNRecognizedText] = observation.topCandidates(1)

        if let recognizedText: VNRecognizedText = topCandidate.first {
            label.text = recognizedText.string
        }
    }
}

Затем вам нужно присвоить значение для recognitionLevel свойство экземпляра:

// non-realtime asynchronous but accurate text recognition
request.recognitionLevel = VNRequestTextRecognitionLevel.accurate

// nearly realtime but not-accurate text recognition
request.recognitionLevel = VNRequestTextRecognitionLevel.fast

try? requestHandler.perform([request])

user2124535 19 июн '17 в 04:29 2017-06-19 04:29 · Answer 2 · 2017-06-19 04:29

Не совсем обман, но похоже на: Преобразование VNTextObservation Vision в строку

Вам нужно использовать CoreML или другую библиотеку для выполнения OCR (SwiftOCR и т. Д.)

0

Источник

user2124535 19 июн '17 в 04:29

user7791098 16 июн '17 в 02:50 2017-06-16 02:50 · Answer 3 · 2017-06-16 02:50

Это вернет наложенное изображение с прямоугольником на обнаруженный текст

Вот полный проект xcode https://github.com/cyruslok/iOS11-Vision-Framework-Demo

Надеюсь, это полезно

// Text Detect
func textDetect(dectect_image:UIImage, display_image_view:UIImageView)->UIImage{
    let handler:VNImageRequestHandler = VNImageRequestHandler.init(cgImage: (dectect_image.cgImage)!)
    var result_img:UIImage = UIImage.init();

    let request:VNDetectTextRectanglesRequest = VNDetectTextRectanglesRequest.init(completionHandler: { (request, error) in
        if( (error) != nil){
            print("Got Error In Run Text Dectect Request");

        }else{
            result_img = self.drawRectangleForTextDectect(image: dectect_image,results: request.results as! Array<VNTextObservation>)
        }
    })
    request.reportCharacterBoxes = true
    do {
        try handler.perform([request])
        return result_img;
    } catch {
        return result_img;
    }
}

func drawRectangleForTextDectect(image: UIImage, results:Array<VNTextObservation>) -> UIImage {
    let renderer = UIGraphicsImageRenderer(size: image.size)
    var t:CGAffineTransform = CGAffineTransform.identity;
    t = t.scaledBy( x: image.size.width, y: -image.size.height);
    t = t.translatedBy(x: 0, y: -1 );

    let img = renderer.image { ctx in
        for item in results {
            let TextObservation:VNTextObservation = item
            ctx.cgContext.setFillColor(UIColor.clear.cgColor)
            ctx.cgContext.setStrokeColor(UIColor.green.cgColor)
            ctx.cgContext.setLineWidth(1)
            ctx.cgContext.addRect(item.boundingBox.applying(t))
            ctx.cgContext.drawPath(using: .fillStroke)

            for item_2 in TextObservation.characterBoxes!{
                let RectangleObservation:VNRectangleObservation = item_2
                ctx.cgContext.setFillColor(UIColor.clear.cgColor)
                ctx.cgContext.setStrokeColor(UIColor.red.cgColor)
                ctx.cgContext.setLineWidth(1)
                ctx.cgContext.addRect(RectangleObservation.boundingBox.applying(t))
                ctx.cgContext.drawPath(using: .fillStroke)
            }
        }

    }
    return img
}