El evento bianual ICDAR sobre el análisis y reconocimiento de documentos llega a su 14ª edición, reuniendo a la comunidad científica para presentar avances en metodologías y tecnologías, con el Deep Learning asentándose como una de las más importantes.

Del 9 al 15 de noviembre ha tenido lugar ICDAR 2017, la 14ª edición del Congreso Internacional sobre Análisis y Reconocimiento de Documentos. Un evento asociado a IAPR (International Association of Pattern Recognition) que representa a la comunidad investigadora de esta área. El congreso sigue asentándose como referencia mundial, junto con ICPR y DAS como congresos gerneralistas sobre tratamiento documental. Su objetivo sigue siendo el de analizar el estado del arte en el procesado documental, el planteamiento de retos a futuro y la cohesión de la misma comunidad investigadora.

Serimag no ha querido perderse esta nueva oportunidad de conocer toda la investigación y desarrollo en primera persona y de la mano de quienes son referencia en estos campos. Nuestro compromiso con el I+D nos lleva a participar de un mundo en el que los avances se producen a pasos agigantados.

Nuestro distintivo durante ICDAR 2017
Nuestro distintivo durante ICDAR 2017

El evento tuvo lugar en el Tessa Hall, en Kyoto, con una asistencia de alrededor de 500 participantes de todo el mundo. A nuestra llegada, una perfecta organización de voluntarios formada por profesores y estudiantes nos recibió para entregarnos nuestra identificación, material para no perdernos nada del evento… y una camiseta que en japonés rezaba “No character, no life”. ¡Brillante!

Cada día se pudo disfrutar de una keynote a manos de investigadores muy reputados en su campo. En la primera de ellas, el profesor Rangachar Kasturi de la University of South Florida revisó la evolución que ha sufrido en las últimas décadas el reconocimiento de gráficos mostrando finalmente el estado del arte presente. En la segunda, el profesor Andreas Dengel del German Research Center for Artificial Intelligence (DFKI) profundizó en en análisis referencial entre papers dotándolo de una mayor inteligencia emocional. Y para la tercera, el profesor Xiang Bai de la Huazhong University of Science and Technology, trataba del análisis documental de escenas donde se requiere detectar, reconocer y leer textos en el mundo real.

Keynote del profesor Xiang Bai
Keynote del profesor Xiang Bai, de la Huazhong University of Science and Technology

También hubo más de 50 conferencias tratando temas de actualidad: la clasificación documental, el word spotting, el OCR, la identificación del escritor o firmante, el reconocimiento de escenas, el tratamiento de documentación antigua, el análisis del layout, el reconocimiento de texto manuscrito online y offline, el reconocimiento de gráficos, etc. Además, cabe no olvidarse de los más de 150 pósters que diferentes investigadores presentaron durante las Poster Session. En 3 salas diferentes se podían encontrar excelentes papers y disfrutar de la oportunidad de comentarlos con sus responsables. Por último, destacar la existencia de diferentes competiciones organizadas por ICDAR o por terceros. En definitiva, que tomarte un dulce japonés durante los coffee breaks se agradecía para respirar entre tantísima información concentrada.

Poster Session en una de las salas del ICDAR
Poster Session en una de las salas del ICDAR

Esta edición nos ha abierto el abanico a la hora de definir un “documento”. Antiguamente era un papel con únicamente texto impreso. Luego se añadieron las imágenes y los gráficos. Hoy en día su concepto es mucho más amplio y concierne a todo texto que deba ser recuperado e interpretado y proveniente de diferentes fuentes. Tanto es un documento un papel como un video o una fotografía. De ahí que su uso esté presente en campos como la robótica, la realidad aumentada, la conducción autónoma, la vigilancia, etc.

Y finalmente, si bien en la edición de 2015 en Nancy todavía el Deep Learning era una novedosa herramienta, en esta edición se ha consolidado como método de procesamiento por defecto. Aunque nuestra reflexión es que no deberíamos quedarnos aquí. El Deep Learning nos ha permitido mejorar los registros obtenidos con antiguas metodologías. Pero hay que pensar en nuevos horizontes para usar esta tecnología en lugar de iterarla para obtener mejorías en los procesos actuales. Sin lugar a dudas, veremos en próximos congresos referencias en este campo (como el ICML, International Congress of Machine Learning). Será interesante observar cómo el procesado documental es capaz de aprovechar estos avances.

Para Serimag ha sido una gran experiencia el poder volver a compartir estos avances con los referentes del sector. Nos quedan 2 años por delante para volver a estar presentes en una nueva edición, esta vez en Sídney ¿con nuestro propio paper o conferencia? ¡Conocimientos, experiencia y ganas no nos faltan!