Las redes neuronales son una familia de algoritmos (métodos y software) orientados al aprendizaje autónomo (machine learning). Como tales, las redes neuronales difieren de los sistemas expertos tradicionales en que generan su propio conocimiento sin necesidad de implementar reglas ad hoc para su aprendizaje.

Las redes neuronales se componen, fundamentalmente, de 2 elementos: neuronas (unidades de cálculo) y conexiones entre neuronas. Según el problema a resolver se debe elegir una tipología de neuronas y un diagrama de conexiones. Podemos entender este proceso como el equivalente a elegir, según sus características, al sujeto con más potencial para resolver nuestro problema.

Disponemos ya de nuestro candidato, hemos diseñado sus neuronas y las hemos conectado entre si. El siguiente paso es explotar su potencial, es decir, enseñarle. Para ello tendremos que elegir un método de aprendizaje y de corrección. Esta etapa guarda también cierta similitud con cómo se enseña a un ser cognitivo. En general enseñamos a una red neuronal de forma empírica, mostrando ejemplos, pidiendo su veredicto para estos y mostrándole por último que respuesta consideramos que era correcta para que se corrija a si misma en caso de discrepancia (a diferencia de los sistemas expertos, que deben cargarse de un conocimiento a priori si deseamos que ejecuten acciones o formulen veredictos).

Si durante su aprendizaje enviamos a la red neuronal señales confusas o no la educamos correctamente acerca de cómo enmendar sus errores obtendremos un sujeto dubitativo y tendente al error. Si por el contrario cuando se equivoca le mostramos un modo unívoco de corregir sus errores y mantenemos una mínima consistencia acerca de los veredictos que esperamos de ella obtendremos un sistema robusto, capaz de lidiar con la incertidumbre y certero en sus respuestas.

Por lo tanto, además de considerar qué neuronas emplearemos y cómo las conectaremos debemos considerar cómo instruiremos al sistema. Definiendo estos 3 aspectos obtendremos una red totalmente funcional, capaz de resolver problemas tan variados como:

Especialmente en entornos de alta complejidad la capacidad para desarrollar reglas propias se vuelve indispensable. Repasando la lista de ejemplos anterior podemos imaginar cómo concretar en reglas específicas la aleatoriedad de los obstáculos que un dron puede encontrar en su camino sería inviable. La cantidad de escenarios en que el aparato se puede encontrar, de formas a sortear y de contextos meteorológicos con los que debería lidiar obligarían a tipificar un cuerpo de reglas monstruoso para guiar su movimiento de forma efectiva. Lo mismo sucede cuando nos planteamos transcribir conversaciones de forma automática. La cantidad de entonaciones, timbres, ruidos y cadencias que podemos encontrar es tal que no sería factible construir conscientemente un cuerpo de reglas específicas que rigiese cada situación y aún menos podríamos esperar que el resultado fuese efectivo.

En Serimag Media conocemos las ventajas de este tipo de herramientas y algoritmos. Su implantación en los últimos años en distintos procesos de la plataforma de Tratamiento Automático de Documentos ( TAAD ) ha permitido disparar las tasas de automatización, fiabilidad y acierto de nuestros procesos productivos.

Un caso claro es la localización de datos relevantes en tributos. Se trata de un caso en que en condiciones óptimas de digitalización los sistemas expertos tradicionales son capaces de arrojar resultados razonables a costa de ciertos inconvenientes. Por ejemplo:

Redes Neuronales

En este caso se desea capturar el NIF del declarante. Un sistema experto tradicional podría buscar la palabra “NIF” y desplazarse hasta unas coordenadas determinadas donde potencialmente encontraría el dato deseado.

En este otro caso se desea encontrar el ejercicio del tributo. Otra forma de abordar el problema para un sistema experto convencional sería buscar una determinada caja visualmente muy característica (en este caso enmarcada por un recuadro azul) y una vez localizada caja desplazarse a otra ubicación a partir de esta para encontrar el ejercicio:

Redes Neuronales

Estos métodos, aunque efectivos en teoría entran en conflicto con la política actual de digitalización, donde impera la descentralización y por tanto el control de la calidad de la misma supone un inconveniente. Los métodos expertos dependen fuertemente de esa homogeneización. Si la calidad baja o resulta heterogénea la palabra “NIF” del primer ejemplo podría resultar ilegible poniendo en peligro la captura del dato correspondiente. Del mismo modo, en el segundo ejemplo, la caja que se utiliza como ancla para la captura podría tener sombras, rotaciones, reescalados o brillos que dificultarían su localización y por tanto la del dato que depende de ella.

Las redes neuronales, por contra, al aprender con documentación real, con sus imperfecciones y desviaciones, se adaptan al escenario de digitalización del cliente y reaccionan de forma mucho más satisfactoria y robusta pese a las perturbaciones que el escaneado pueda generar. Las redes neuronales pueden aprender a localizar el dato sin depender de otra captura, región o caja en concreto. En lugar de eso analizan el aspecto de toda la página y determinan autónomamente que elementos son más relevantes para deducir la ubicación del dato a capturar. Gracias a ello la misma red neuronal es capaz de trabajar con varios tipos de páginas y la misma red neuronal aplica unas estrategias u otras en función de la página a la que se enfrente, de nuevo, sin que se le tenga que explicitar que tipo de página es. Todo ello redunda finalmente en sistemas flexibles, de alta fiabilidad y en una mayor ventaja competitiva para el cliente.

Debemos tener en cuenta también que la documentación que estamos tratando en muchos casos no la genera el cliente sino terceras partes no involucradas en la operación a evaluar. Esto hace que la probabilidad de que aparezcan cambios en la misma se dispare y que el control sobre la aparición de estas variaciones requiera todavía de mayor esfuerzo de monitorización del proceso. Frente a una variación de este tipo un sistema experto requeriría de un analista que revisase los puntos de anclaje definidos y las palabras clave para capturar de nuevo el dato. En TAAD basta con reentrenar el sistema con nuevos ejemplos procesados manualmente para que dichas reglas se autogeneren haciendo las actualizaciones mucho más sencillas y eficientes.

En Serimag Media hemos adquirido el know-how necesario para la implementación de técnicas basadas en machine learning con las que poder satisfacer todas las expectativas y necesidades de nuestros clientes: eficiencia en el desarrollo, precisión y adaptabilidad a las particularidades de cada proceso.

Autor: Daniel Garrido, Project Manager en Serimag

www.serimag.com