La carrera por la supremacía en inteligencia artificial sumó un nuevo hito. La empresa china DeepSeek, conocida por competir directamente con ChatGPT, presentó DeepSeek-OCR, un modelo de reconocimiento óptico de caracteres (OCR) que puede procesar más de 200,000 páginas diarias con una sola GPU, optimizando la conversión de documentos antiguos, fotografías o archivos escaneados en texto digital.
A diferencia de los sistemas tradicionales, DeepSeek-OCR integra dos componentes (DeepEncoder y DeepSeek3B-MoE-A570M) que reducen entre 7 y 20 veces la cantidad de tokens utilizados, lo que permite ahorrar costos y recursos computacionales al manejar archivos históricos o científicos a gran escala. El modelo no solo transcribe texto: también interpreta gráficos, tablas, fórmulas químicas, figuras geométricas y documentos multilingües, preservando el formato y los símbolos con alta precisión. DeepSeek asegura que su tecnología logra índices de compresión visual superiores a la codificación de texto tradicional, revolucionando la forma en que se digitalizan y almacenan grandes volúmenes de información.
Además, la compañía lanzó una versión de código abierto, disponible para investigadores y desarrolladores que busquen replicar, validar o adaptar la arquitectura para casos de uso personalizados. Con DeepSeek-OCR, China refuerza su liderazgo en IA aplicada a la preservación digital y el entrenamiento de modelos, abriendo paso a una nueva era donde una sola imagen podría bastar para comprimir y transferir el conocimiento de miles de páginas.
