Featured image
Metaserver Azure interface
Body

Actualización de CaptureBites Metaserver: Extracción automatizada de texto con Azure Form Recognizer

CaptureBites Metaserver introduce una potente actualización con su regla "Extraer texto (Reconocedor de formularios Azure)", que permite a los usuarios extraer sin esfuerzo información esencial, incluidos datos de cabecera, valores clave y partidas, de diversos formularios como facturas. A continuación, estos datos se almacenan eficazmente en los campos designados. La belleza de este proceso reside en la utilización de los modelos prediseñados de Azure Form Recognizer, que eliminan la necesidad de una formación o configuración laboriosas.

 

He aquí un desglose de las principales características y ventajas de esta actualización:

  1. Extracción de datos sin fisuras: Los usuarios pueden especificar las páginas de las que desean extraer información. Una vez completada la extracción, pueden aplicarse reglas de Extracción adicionales para refinar, formatear o ajustar los valores antes de enviarlos a la acción siguiente
  2. Soporte multilingüe: El motor Azure Form Recognizer, en particular su modelo de facturas, ofrece compatibilidad con varios idiomas, como inglés, español, alemán, francés, italiano, portugués y neerlandés. Incluso merece la pena experimentar con idiomas no compatibles, ya que se han obtenido resultados satisfactorios con facturas  en checo, por ejemplo.
  3. Tratamiento de las partidas como tablas: Para validar las partidas como tablas con diferentes columnas, los usuarios pueden fusionar todas las partidas en un único campo utilizando una regla. Establecer valor de campo. El campo de partida puede entonces contener todas las partidas en formato CSV, lo que permite una gestión estructurada de los datos.
  4. Planes de servicio de Azure Form Recognizer: Los usuarios deben suscribirse al servicio Azure Form Recognizer. Existen planes de pago para modelos preconstruidos, a partir de 10 dólares por cada 1.000 páginas (Plan S0 para tipos de documentos preconstruidos). También hay un plan gratuito de 1 año (F0) para probar el motor con modelos preconstruidos, que permite hasta 500 páginas al mes de forma gratuita.
  5. Velocidad y procesamiento: La velocidad de procesamiento difiere entre los planes gratuitos y de pago. El plan gratuito tiene limitaciones, ya que sólo permite una llamada cada 2 segundos y sólo lee 2 páginas de la factura. En cambio, el plan de pago (plan S0) ofrece 15 llamadas por segundo, significativamente más rápido y capaz de procesar todas las páginas de la factura.
  6. Información sobre precios: Encontrará información detallada sobre los planes de precios del Reconocedor de formularios Azure en la [Página de precios de Microsoft Azure](https://azure.microsoft.com/en-us/pricing/details/form-recognizer/).
  7. Obtención de claves: Para acceder al servicio Azure Form Recognizer, los usuarios necesitan registrarse para obtener una clave, y las instrucciones para ello se pueden encontrar en la documentación proporcionada.
  8. Documentación técnica: Para obtener información técnica más detallada sobre el motor Azure Form Recognizer de Microsoft, incluido el uso de API, OCR, privacidad de datos y seguridad, puede consultar la documentación de Microsoft Azure Form Recognizer

Cómo implementar Extract Text (Azure Form Recognizer) en CaptureBites Metaserver:

  1. Selección del flujo de trabajo: Los usuarios pueden integrar el flujo de trabajo "CB - INVOICES, FACTURES, RECHNUNGEN", que se instala automáticamente con CaptureBites Metaserver.
  2. Configuración de reglas: Las reglas de Extraer Texto se configuran dentro de la acción Extraer o Separar Documento / Procesar Página de MetaServer. Los usuarios pueden añadir esta regla seleccionando "Extraer -> Texto (Azure Form Recognizer)".
  3. Clave y punto de conexión: Configurar la conexión al recurso Azure Form Recognizer requiere introducir las claves, y el endpoint, y seleccionar la ubicación. Esta información puede obtenerse en Microsoft Azure Dashboard.
  4. Selección de modelos predefinidos: Los usuarios pueden elegir el modelo prediseñado apropiado (por ejemplo, Factura, Recibo, Lectura) en función de sus necesidades. El modelo Factura es especialmente versátil y puede manejar varios campos y tipos de datos.
  5. Versión de API: Los usuarios pueden especificar la versión de API para el Reconocedor de formularios de Azure, con la opción de elegir entre la versión de vista previa o la versión General disponible (GA), según su ubicación de recursos del Reconocedor de formularios de Azure.
  6. Pruebas y confianza: El sistema permite realizar pruebas exhaustivas del proceso de extracción, incluida la verificación de la aplicación del OCR y los niveles de confianza. Los niveles de confianza pueden ajustarse para garantizar una extracción de datos precisa.

Implantación local:

Para los usuarios con necesidades específicas de seguridad y gestión de datos, CaptureBites Metaserver ofrece la opción de ejecutar el motor Azure Form Recognizer on-premise utilizando contenedores a través del motor Docker. Puede encontrar instrucciones detalladas para configurar un contenedor Azure Form Recognizer local aquí.

 

La actualización "Extract Text (Azure Form Recognizer)" de CaptureBites Metaserver permite a las organizaciones extraer y gestionar sin esfuerzo datos críticos de varios formularios, agilizando los procesos y mejorando la precisión y eficiencia de los datos. Con soporte para múltiples idiomas y opciones de precios flexibles, esta actualización es una valiosa adición a cualquier flujo de trabajo de procesamiento de documentos.

 

Para obtener más información técnica sobre el motor de Microsoft Azure Form Recognizer y los detalles de privacidad y seguridad de los datos, consulte la documentación de Microsoft Azure Form Recognizer

 

¿Está listo para simplificar su proceso de extracción de datos? Explore hoy mismo la potencia de la actualización Azure Form Recognizer de CaptureBites MetaServer.