Definición: ¿Qué significa el reconocimiento óptico de caracteres (OCR)?
El reconocimiento óptico de caracteres (OCR) se refiere tanto a la tecnología como al proceso de leer y convertir caracteres mecanografiados, impresos o escritos a mano en texto codificado por máquina o algo que la computadora pueda manipular. Es un subconjunto del reconocimiento de imágenes y se usa ampliamente como una forma de entrada de datos, siendo la entrada algún tipo de documento impreso o registro de datos, como extractos bancarios, facturas de ventas, pasaportes, currículums y tarjetas de presentación. El documento se escanea o se toma una fotografía y el programa debe reconocer los caracteres y dar una salida en forma de documento de texto.
Techinfo explica el reconocimiento óptico de caracteres (OCR)
El reconocimiento óptico de caracteres es el reconocimiento de caracteres específicos del idioma por una computadora mediante el análisis de una imagen, que ya es legible por computadora. Esto a menudo se hace tomando una imagen del documento primero escaneándolo o tomando una fotografía digital. Esto crea una imagen ráster formada por datos que la computadora entiende, y mediante algoritmos específicamente programados, la mayoría de los cuales se utilizan en el campo de la inteligencia artificial, la computadora reconoce los patrones en la imagen, y en este caso los patrones son caracteres. Luego, el programa crea o genera códigos de caracteres, generalmente ASCII, que son equivalentes a los caracteres reconocidos de la imagen de entrada. La mayoría de los programas de OCR deben estar capacitados para que sean mejores en el reconocimiento de personajes.