Extracción de datos en volumen empresarial

Imagina que te pidan construir una base de datos a partir de más de 100,000 facturas en PDF, cada una con formato diferente y con decenas de partidas, números de serie y detalles fiscales.

Ahora imagina hacer eso sin sacar a los equipos de las operaciones diarias y sin comprometer la precisión regulatoria.

Para OXXO, esto no fue un ejercicio hipotético. Era el siguiente paso lógico en la gestión de activos fijos a escala nacional.

“Manualmente, simplemente no era posible”, dijo Patricia Fabila, responsable de transformación, administración y finanzas en OXXO. “No había forma práctica de extraer esa información sin automatización.”

Cuando la escala exige estructura

Como parte de FEMSA (Fomento Económico Mexicano), un conglomerado multinacional y la mayor embotelladora de Coca-Cola en el mundo, OXXO opera más de 25,000 tiendas de conveniencia en todo México. Cada apertura de tienda y la actualización de equipos genera activos fijos como unidades de refrigeración, estanterías y equipos de punto de venta. Cada activo está respaldado por una factura que debe retenerse para fines contables, regulatorios y de seguros.

Con el tiempo, OXXO utilizó Laserfiche para digitalizar y gestionar de manera centralizada todas sus facturas de activos fijos, estableciendo un sistema de registro confiable. Hoy en día, ese sistema contiene más de 1 millón de documentos y sigue creciendo en aproximadamente 1,500 facturas cada mes. Mientras que esta base acató y cumplió con auditorías, reclamaciones de seguros y requisitos regulatorios, OXXO vio una oportunidad para sacar aún más valor de su información.

“Digitalizamos todas las facturas en Laserfiche”, dijo Fabila. “Lo siguiente que necesitamos era la capacidad de trabajar con la información en esos documentos.”

Esa necesidad se volvió más urgente a medida que OXXO trabajaba para conciliar los registros de activos internos con la información reportada a la autoridad tributaria de México, SAT. Aunque el SAT mantiene su propio registro de las facturas emitidas, OXXO necesitaba confirmar que esos registros coincidían con sus datos internos a lo largo de años de documentación histórica. A esa escala, buscar cada dato uno por uno, en PDFs, ya no era viable.

Convirtiendo facturas en una base de datos con campos inteligentes

OXXO se asoció con Expert Data para ampliar su entorno Laserfiche existente utilizando Smart Fields, una herramienta de extracción de datos impulsada por IA. El objetivo era extraer datos estructurados de las facturas a gran escala y convertir documentos históricos en un conjunto de datos que pudiera ser consultado, validado y analizado.

“OXXO tenía una visión clara de cómo quería utilizar sus datos”, dijo Gasi Fayad, director de Expert Data, proveedor de soluciones Laserfiche. “Smart Fields hizo posible extraer y estructurar información a un nivel que no sería factible manualmente. El resultado es una base de datos que sigue aportando valor con el tiempo.”

Smart Fields utiliza IA para capturar y aplicar automáticamente los metadatos de los documentos, incluso cuando los diseños varían. Esta flexibilidad fue fundamental, ya que OXXO recibe facturas de una amplia variedad de proveedores que utilizan diferentes formatos.

En lugar de limitarse a los metadatos a nivel de factura, OXXO diseñó la solución para capturar detalles a nivel de partida. Muchas facturas contenían decenas o incluso cientos de activos individuales, cada uno de los cuales debía representarse como un registro de datos distinto.

Usando Smart Fields, OXXO logró extraer información estructurada de más de 100,000 facturas históricas. Como cada factura podía generar múltiples partidas, la iniciativa generó millones de filas de datos individuales. Cada uno representa un activo específico con su propio número de serie, valor y referencia a la factura original. OXXO organizó estos datos en una base de datos totalmente consultable con filas y columnas definidas.

Smart Fields capturó y estructuró datos, incluyendo:

  • Números de factura y UUIDs fiscales del SAT (identificadores universalmente únicos)
  • Información sobre proveedores e información fiscal
  • Totales de facturas y valores contables
  • Descripciones individuales de activos y números de serie
  • Valores de partidas vinculadas a cada factura

Una vez estructurada, OXXO podía buscar, filtrar y comparar esta información a lo largo de años de datos históricos.

“Con Smart Fields, pasamos de tener facturas en un repositorio a tener una base de datos real”, dijo Fabila. “Ahora podemos ver exactamente qué se ha comprado, artículo por artículo, con datos que podemos validar y analizar.”

Visión proactiva en una operación nacional

Con Smart Fields implementado, OXXO pasó de buscar documentos a consultar datos. Sus equipos ahora pueden localizar activos por almacén, número de serie o identificador fiscal a través de millones de filas de datos estructurados, en lugar de revisar manualmente grandes conjuntos de facturas. Cuando las autoridades reguladoras solicitan información, OXXO puede responder utilizando un conjunto de datos centralizado que refleje tanto las operaciones históricas como las actuales.

La base de datos también admite validación interna. Los equipos pueden comparar asentamientos contables con datos de facturas y verificar los registros de activos utilizando información detallada por partidas.

Aunque el proyecto no fue diseñado para generar ahorros directos de costes, su valor reside en la preparación y la reducción de riesgos. “Laserfiche nos ayuda a responder más rápido y con más seguridad a los requisitos regulatorios”, dijo Fabila. “Esa tranquilidad es extremadamente valiosa para una organización de nuestro tamaño.”

Ampliando el registro histórico

OXXO, junto con Expert Data, diseñó la iniciativa Smart Fields para crecer con el tiempo. Con un modelo de datos estructurados ya implementado, el equipo está evaluando hasta dónde extender la extracción de datos a través de su archivo histórico.

La organización puede procesar de manera selectiva los años adicionales de facturas a medida que evolucionen las necesidades regulatorias u operativas, fortaleciendo la base de datos con cada expansión.

“Laserfiche juega un papel estratégico en cómo manejamos la información”, dijo Fabila. Nos da seguridad en que podemos acatar los requisitos regulatorios, operar de forma eficiente y tomar decisiones basadas en datos fiables.”