La historia del reconocimiento óptico de caracteres (OCR)

A menos que no se haya mantenido al día con nuestro blog, es de esperar que ahora tenga una comprensión clara de qué es la tecnología de reconocimiento óptico de caracteres (OCR) y cómo funciona. Sin embargo, ¿Cuánto sabes de su historia? ¿Puedes adivinar cuánto tiempo ha estado por ahí? ¿Te imaginas que es más antiguo que la World Wide Web? ¿Qué pasa con el PC? A continuación, responderemos a todas tus preguntas.

Sí, ¡la tecnología OCR ha existido más tiempo que la Web y la PC!

Si bien la World Wide Web fue inventada en 1989 —por el informático británico Tim Berners-Lee mientras trabajaba en el CERN— y, según el Museo de Historia de la Computación, el primer PC —el Kenbak-1— fue lanzado en 1971, La tecnología OCR se remonta a principios del siglo XX.

Cómo sentar las bases (1914-1950)

1914: En 1914, el físico Emanuel Goldberg inventó una máquina que podía leer caracteres y convertirlos en código telegráfico. Se considera uno de los primeros ejemplos de tecnología OCR.
1931: Goldberg más tarde desarrolló lo que llamó una “Máquina estadística”, una máquina electromecánica para la búsqueda de archivos de microfilm utilizando un sistema de reconocimiento de código óptico.
década de 1950: David H. Shepard trabajaba como criptoanalista en la Agencia de Seguridad de las Fuerzas Armadas (AFSA) —ahora la Agencia de Seguridad Nacional de Estados Unidos (NSA) — en 1951 cuando desarrolló “Gismo” en su tiempo libre. Construido en un ático con su colega Harvey Cook Jr. , “Gismo” era una máquina que podía leer las 26 letras del alfabeto producidas por una máquina de escribir estándar. En 1952, Shepard estableció su empresa, Intelligent Machines Research Co. (IMR). En el siguiente video, puedes ver un episodio de 1959 del programa de juegos estadounidense, “Tengo un secreto” en el que David H. Shepard apareció con el secreto “Inventé una máquina que lee y escribe”.

Haga clic aquí para aceptar las cookies de marketing y cargar el video.

Comercialización temprana (1950-1960)

1954: La revista estadounidense Reader's Digest se convirtió el primer negocio en instalar un lector OCR en su oficina en 1954. Se utilizaba para convertir los informes de ventas mecanoescritos en tarjetas perforadas. Otros negocios pronto siguieron su ejemplo.
1959: En 1959, IBM desarrolló Máquina OCR IBM 1287, notable por ser el primer escáner vendido comercialmente capaz de leer números escritos a mano.
1960: Ray Kurzweil, que se convertiría en una figura clave en la historia de la tecnología OCR, comenzó a investigar tecnologías de reconocimiento de patrones mientras aún estaba en la escuela secundaria. Ganó el primer premio en la Feria Internacional de Ciencias de 1965 por un software de reconocimiento de patrones que creó que analizaba obras de música clásica y creaba composiciones imitando el estilo de un compositor determinado.

El nacimiento de los productos informáticos de Kurzweil y la digitalización de los recursos bibliotecarios (1970-1980)

1974: En 1974, Ray Kurzweil fundó Kurzweil Computer Products, Inc. y desarrolló el primer sistema de reconocimiento óptico de caracteres omni-fuente, un programa informático capaz de reconocer texto escrito en cualquier fuente normal.
1980: En 1980, Ray Kurzweil vendió Kurzweil Computer Products, Inc. a Xerox, que lo renombró como Scansoft.
1980: Durante la década de 1980, la tecnología OCR se utilizó ampliamente para digitalizar documentos impresos, particularmente en bibliotecas y oficinas. Se utilizaron sistemas OCR para convertir libros, periódicos y documentos de archivo en texto con capacidad de búsqueda. Universidades e instituciones de investigación comenzaron a experimentar con OCR para crear catálogos digitales y archivos con capacidad de búsqueda.

El auge del OCR digital y la computación personal (1990s-2000)

Déla de 1990: Caere Corporation (posteriormente adquirida por ScanSoft, que se fusionó con Nuance), una compañía entonces dirigida por Robert Noyce —conocido por su papel en la fundación de Intel—, presentó OmniPage, uno de los primeros programas de OCR que se ejecuta en computadoras personales, a finales de la década de 1980. Debido al aumento en el uso de PC, este ganó popularidad durante la década de 1990. Durante esta década, las empresas y las organizaciones hicieron una transición cada vez mayor de flujos de trabajo basados en papel a sistemas digitales, lo que impulsó la demanda de soluciones OCR como OmniPage.
1999: ABBYY lanzó FineReader en julio de 1993, un software de OCR de alta precisión para varios idiomas.
Finales de los años 1990s-2000: El OCR se integró en el software del escáner y se convirtió en estándar en el procesamiento de documentos PDF. Cynthia Breazealel trabajo de robótica, aprendizaje automático e interacción hombre-computadora sentó las bases para más aplicaciones OCR intuitivas impulsadas por IA. Isabel Meirelles“La investigación realizada durante la década de 2000 sobre visualización de la información y diseño centrado en el ser humano influyó en la forma en que los resultados de OCR se presentarían a los usuarios y cómo los usuarios interactuarían con los documentos después del reconocimiento.

OCR con IA y soluciones basadas en la nube (2010s-2020)

2015: Incode Technologies es fundada por Ricardo Amper.
2018: En 2018, Google lanzó Teseracto 4.0, un sistema OCR de código abierto. Marcaba un gran salto tecnológico en OCR porque incorporaba reconocimiento de texto basado en aprendizaje profundo usando LSTMs (redes de memoria de largo y corto plazo). La adopción de aprendizaje profundo y redes neuronales en 2018 las tecnologías OCR mejoraron el reconocimiento de texto escrito a mano y diseños complejos.
La década de 2020: OCR está ampliamente integrado en los servicios en la nube (por ejemplo, Google Drive, Microsoft OneDrive) y aplicaciones impulsadas por IA, lo que hace que el reconocimiento de texto en tiempo real sea accesible a través de teléfonos inteligentes y plataformas en línea.

Incode lanza su tecnología OCR patentada

2023: En 2023, Incode Technologies lanzó su propietaria Tecnología OCR para verificación de identidad. Construido a propósito para extraer y procesar datos de más de 4900 tipos de documentos de identidad en todo el mundo con una precisión casi perfecta, sigue asegurando menos discrepancias en los datos, detección de fraude mejorada, y cumplimiento de normas globales.

Más información sobre la tecnología OCR patentada de Incode.

Incode

Incode is a global leader in AI-driven identity and trust, with a mission to power a world of trust at the speed of AI. The platform verifies identity and age, stops fraud, and turns verification into business enablement.

Chapters