El patito feo convertido en cisne

Según un estudio publicado recientemente por IBM, la generación diaria de datos es monumental. Sus expertos lo cifran en 2,5 quintillones de datos de manera global, lo que da una visión clara sobre la dificultad que entrañaría su procesamiento manual. La irrupción, además, de tecnologías como IoT hace que todos los objetos estén interconectados y que la generación de datos no solo sea abundante, sino también, permanente y continuada.

Por lo tanto, si los humanos generamos datos y los objetos, dispositivos, sensores, geolocalización, redes sociales, compras, accesos a aplicaciones, cámaras de vigilancia, etc.,  generan aún más datos, lo cierto es que apremia la necesidad de convertir todos esos datos en información de manera sencilla y ágil para optimizar la toma de decisiones. Si no, es posible no solo que desperdiciemos el conocimiento que encierra toda esa información en potencia, sino que se pierdan cientos de oportunidades de negocio, algo que, en un entorno tan competitivo como el actual, puede resultar nefasto.

Ahora bien. A decir verdad, creo que en los últimos años hemos asistido a un cambio sobre la percepción del valor de los datos en las organizaciones. En realidad, creo que se ha tomado conciencia sobre la importancia de la información, pero se sigue fallando en la forma en la que se almacena, lo que dificulta su acceso y su utilización. El siguiente paso, por tanto, una vez entendido el valor de los datos, sería comprender que tener algo “escondido“ es como no tener nada. Por lo tanto, centralizar, facilitar y asegurar con los permisos pertinentes, el acceso a toda la información, ayudará a que las organizaciones puedan encontrar lo que necesitan de una manera más sencilla y eficiente y, con ello, exprimir al máximo el potencial de los datos que generan y almacenan.

El valor de las horas muertas

Perder tiempo en buscar la información que necesitas resulta frustrante para todos. Aplicado al ámbito de los negocios este tiempo empleado, además de generar frustración en la plantilla supone un coste elevado para las organizaciones porque una tarea sencilla puede volverse extremadamente complicada cuando se desconoce dónde hay que buscar la información. Esto es bastante habitual si al generar el dato no se almacenó en el repositorio adecuado o no se renombró de manera intuitiva.

Según una encuesta de IDC, los trabajadores dedican 22 horas a la semana a realizar tareas de búsqueda y recopilación de información y a leer y a responder emails. En esta línea cabe señalar también la encuesta publicada en 2018 por Nintex en la que se asegura que el 39% de los empleados encuentran problemas en sus procesos de Gestión Documental. En particular:

  • 49% para localizar documentos
  • 43% en los procesos de aprobación de documentos y documentación compartida
  • 33% con el versionado de documentos.

Si a esto le añadimos el hecho de que, en los últimos años está aumentando el número de empleados que trabaja de forma remota, de equipos que operan repartidos en diferentes territorios en los que la empresa tiene presencia, disponer de una herramienta de búsqueda que permita fomentar la Gestión del Conocimiento es, sencillamente, fundamental.

Un buscador corporativo no es Google

Nada en contra de Google. Ni mucho menos. Sin embargo, cuando una organización quiere acceder a un informe histórico sobre sus ventas, o quiere conocer el estado reputacional de su firma -lo que se dice de ella en las redes sociales- o cuando quiere analizar sobre la marcha los resultados de una campaña de marketing on line, Google difícilmente puede ayudarle.

Los buscadores corporativos son herramientas que facilitan el acceso a todos esos contenidos. Y lo hacen a través de cualquier interfaz ya sea voz, web o app. Permiten  la toma de datos de una manera confiable y segura de cualquier fuente, en cualquier formato y facilitan la búsqueda, el análisis y la visualización en tiempo real. También su explotación. Y me explico.

Generalmente, estos buscadores corporativos han sido el “patito feo“ de los proyectos TI porque cuando hablas de buscador, inconscientemente todos pensamos en Google. Sin embargo, Google no puede centralizar toda la información de tu empresa, enriquecerla con la información pública que ya existe de tu firma en otros canales, agregarla, unificarla y darle sentido en el contexto concreto de tu propia compañía. Un buscador de este tipo no solo localiza y facilita el acceso a información ubicada en una base de datos, sino que identifica información de diferentes fuentes, herogéneas y dispersas, para centralizarla en un único repositorio y facilitar su acceso y su explotación.

Por otra parte, gracias al desarrollo de nuevos algoritmos de Inteligencia Artificial, Machine Learning y Deep Learning, es posible extraer el conocimiento latente en los datos ya almacenados y del know-how de los trabajadores, todo ello soportado por técnicas neurolingüísticas que permitan identificar y abordar las necesidades reales de los usuarios, y facilitar el uso de la plataforma por parte de los trabajadores.

A día de hoy, existen diferentes tecnologías que dan soporte a estas herramintas. Lucene, Solr o Elastic son algunas de las más reconocidas y utilizadas en estos momentos.

En las entrañas del buscador

Sin entrar en detalles técnicos, una arquitectura básica de cualquier buscador de información podría seguir el siguiente esquema:

Primero, hay que extraer la información para hacerla accesible a todos los usuarios, garantizando, SIEMPRE, el cumplimiento de los protocolos de seguridad y permisos establecidos en cada fuente de datos. Esto obliga a replicar cada sistema de seguridad en el propio buscador para que cada usuario acceda solo a la información para la que tenga permiso.

Una vez identificada la información y su fuente, el siguiente paso es el de la indexación. Teniendo en cuenta que cada sistema de información dispone de mecanismos específicos para exportar los datos que contiene hay que configurar un conector para cada uno de ellos con el fin de facilitar la extracción de la información relevante de cada sistema de orígen. Una vez extraída se convierte al formato adecuado para que pueda procesarse y almacenarse en el motor de búsqueda.

Ahora bien. Como las consultas que realizan los usuarios están basadas en texto libre, es necesario que el motor de búsqueda pueda analizar lingüísticamente la información para proporcionar el máximo valor a cada consulta. Así, se realizan configuraciones específicas basadas en el idioma del usuario, se eliminan los términos irrelevantes y se aplican las reglas lingüísticas que extraigan la raiz léxica de las palabras relevantes, de forma que se puedan ampliar los parámetros de la búsqueda. Más tarde se podrán aplicar reglas de sinonimia para que cuando el usuario hace una búsqueda conforme a una palabra se puedan recuperar diferentes documentos o información con el mismo significado.

Recuerda que la seguridad es un tema tangencial en todo el proceso por lo que también en este punto, cuando el usuario realiza una consulta, el motor de búsqueda le devuelve la información agrupada de cada sistema de información, filtrando para cada uno de ellos la información que puede/debe mostrar al usuario en base a los privilegios que posea.

Un aspecto estratégico de cualquier buscador de información es que facilita la retroalimentación del sistema conforme al uso que se haya hecho de la información demandada: elaboración de informes personalizados, dashboards en tiempo real de la utilización de la aplicación, alertas sobre el uso de la plataforma para detectar automaticamente ataques, intentos de accesos sin permiso o usos indebidos…

Es, por tanto, un sistema analítico que aporta métricas sobre la información a la que se accede con mayor y menor frecuencia de manera que la organización podrá priorizar el dato en sus fuentes de orígen, haciendo históricos, por ejemplo, de la información menos vista, con el consiguiente ahorro de almacenamiento que ello implica.

Al final, el objetivo de un sistema de búsqueda de información es dotar al usuario de un punto de acceso único a todos los sistemas -fuentes- de información. O, dicho de otro modo: crear una plataforma que impulse la gestión avanzada del conocimiento para la correcta adquisición, almacenamiento, procesamiento y difusión de la información y el know-how dentro de la organización.

En definitiva, hablamos de una herramienta que impulsa la gestión colaborativa, que evita los silos de información y minimiza el riesgo de pérdida del conocimiento o su escasa reutilización. Fomentar la difusión de la información entre los empleados deriva en una operativa más eficiente, ya que les permite buscar y comparar información que resuelva problemáticas similares, relacionando los datos de una manera ágil y eficaz.

Y, sí. Incrementar la comunicación, fomentar la formación, impulsar la transmisión del conocimiento y racionalizar el uso de otras herramientas de comunicación, ahora sobre-utilizadas, reduce los costes que se derivan de la repetición de actividades.  Por lo tanto, podemos decir que lo que empezó siendo un el patito feo de la tecnología, constituye hoy por hoy, la base de algunos de los proyectos TI de mayor envergadura y recorrido de los últimos tiempos.

 

 

Oliver Sanz

Gerente en VASS

Compartir