Comment puis-je mettre en évidence un morceau de text sur une image prise par la vue Appareil photo?

Je travaille sur un projet OCR. Ma première tâche consiste à prendre une image de l'appareil photo de l'iPhone, puis à localiser un mot spécifique sur l'image.

Ci-dessous est un exemple d'image prise par mon appareil, maintenant je veux find la position du mot "PAPETERIE" et le mettre en évidence avec un rectangle jaune sur l'image.

Comment puis je faire ça? Dois-je d'abord utiliser un SDK OCR pour cela (comme ABBYY) ou puis-je le faire autrement?

Capture d'écran de l'image prise par la caméra

Si vous devez get les coordonnées d'un mot spécifique, vous devez d'abord effectuer l'OCR. Gardez à l'esprit que vous aurez probablement quelques difficultés avec cette image paticullar que vous avez attaché à cause de sa partie inférieure. OCR fera un bon travail avec un fond similaire.

Concernant OCR SDK – essayez ABBYY Cloud OCR SDK , c'est un SDR OCR basé sur le cloud récemment lancé par ABBYY. C'est en version bêta, donc pour l'instant c'est totalement gratuit et il y a des échantillons de code iOS prêts à l'emploi.

Il a une fonction d'extraction des coordonnées embeddede au format xml, j'ai rogné la partie inférieure de votre image pour que l'arrière-plan soit clair et envoyé au SDK, voici la réponse que j'ai eu:

<charParams l="35" t="39" r="73" b="83" charConfidence="100">S</charParams> <charParams l="77" t="39" r="117" b="83" charConfidence="100">T</charParams> <charParams l="120" t="40" r="164" b="83" charConfidence="100">A</charParams> <charParams l="165" t="40" r="204" b="83" charConfidence="100">T</charParams> <charParams l="211" t="40" r="225" b="83" charConfidence="100">I</charParams> <charParams l="231" t="40" r="276" b="84" charConfidence="100">O</charParams> <charParams l="285" t="41" r="325" b="84" charConfidence="100">N</charParams> <charParams l="334" t="42" r="370" b="84" charConfidence="100">E</charParams> <charParams l="377" t="42" r="419" b="85" charConfidence="100">R</charParams> <charParams l="428" t="42" r="469" b="84" charConfidence="100">Y</charParams> 

Ces parameters "l", "t", "r", "b" représentent gauche, haut, droite et bas, ils décrivent un rectangle de chaque caractère avec le coin supérieur gauche et le coin inférieur droit. Je crois que c'est exactement ce que vous cherchez.