Nymiz, anonimización y seguridad del dato personal

La ‘startup’ bilbaína ofrece una solución novedosa basada en inteligencia artificial para la localización y anonimización de datos personales.

Según un informe de febrero de 2021 del Data Privacy Institute (DPI) del ISMS Forum -International Information Security Community (https://www.ismsforum.es/), el 78,26% de los delegados de Protección de Datos de las empresas revisaron su modelo de privacidad ante las multas millonarias impuestas recientemente por la Agencia de Protección de Datos Española a entidades financieras. La AEPD ha sancionado desde finales de 2020 con 6 millones de euros a Caixabank por la cesión de datos personales y al BBVA con cinco millones de euros por el uso de datos personales sin consentimiento.

Las empresas, por tanto, están adquiriendo conciencia de la importancia de proteger los datos personales de sus clientes. Sin embargo, en algunas ocasiones, uno de los principales problemas a los que se enfrentan las compañías de menor tamaño y recursos es el localizar dentro de sus servidores todos los datos que puedan hacer referencia a sus clientes y que no estén ordenados, estructurados o agrupados en bases de datos. Hablamos de documentos Excel, Word o PDF que pueden contener información tan sensible como nombres y apellidos vinculados a números de cuentas corrientes, teléfonos o direcciones.

Para localizar y proteger este tipo de información se puso en marcha la ‘startup’ Nymiz en febrero de 2020, en plena pandemia. Su CEO y fundador, Óscar Villanueva, explica que “hemos desarrollado un ‘software’, inicialmente para empresas, pero también para particulares; que lo que hace es encontrar información personal en datos no estructurados como documentos Word, PDF, TXT, Excel, CSV… lo que no son bases de datos. También puede localizar esta información en bases de datos con datos estructurados y, en breve, también podremos analizar datos semiestructurados”.

A la hora de buscar ese tipo de datos, la solución de Nymiz emplea herramientas de inteligencia artificial como explica Villanueva: “Nuestro ‘software’ encuentra ese dato, hay inteligencia artificial detrás entrenada para encontrar este tipo de información en diferentes contextos e idiomas. Una vez localizada la información lo que hace nuestra solución es anonimizar el dato, es decir, lo borra o lo suprime completamente con una línea negra o con asteriscos. Otra opción es la pseudoanonimización que sustituye el dato por un código aleatorio, un pseudónimo o un token. Esto permite muchas cosas: por una parte, cumplir con la Ley de Protección de Datos ya que estos documentos, una vez anonimizados, no contienen datos personales. De esta manera, la empresa puede hacer analítica de datos y ‘big data’ con la seguridad de que cuando sea atacada por un hacker, los datos que pueda sustraer no contendrán ningún tipo de información personal”.

Además del hecho de anonimizar la información, una de las claves de la solución de Nymiz radica en que la inteligencia artificial es capaz de detectar de forma autónoma si una información concreta de un documento es un dato personal. Para ello utilizan herramientas de Procesamiento de Lenguaje Natural que son capaces de “enfocar esa búsqueda de datos personales como lo haría un ser humano”, según el CEO de Nymiz. “Por ejemplo, cuando el algoritmo detecta que hay dos palabras seguidas en mayúsculas, estima que es posible que se trate de un nombre y un apellido, y anonimiza esa parte. La fiabilidad o el estado del arte en este ámbito no llega al cien por cien, ya que hablamos de tecnologías incipientes. Con todo, el Procesamiento del Lenguaje Natural se viene utilizando desde hace tiempo y está evolucionando, por lo que el porcentaje de fallo cada vez es menor”.

Una de las claves para mejorar estos algoritmos de inteligencia artificial radica en alimentar de datos a estos sistemas y, por tanto, tener acceso a los ‘datasets’. En este sentido, desde Nymiz anuncian que han llegado “a un acuerdo con Osakidetza para la anonimización de informes e historiales clínicos. Se trata de datos que no se pueden conseguir de otra manera y que nos servirán para mejorar mucho el modelo. Nosotros nunca almacenamos ningún dato personal, sino que trabajamos con un flujo de información. Trabajamos con la información, pero no la almacenamos”.

Otro hito de la solución de Nymiz es que está adaptada a diferentes idiomas, en principio castellano e inglés, pero también se emplea con muchos idiomas centroeuropeos: “Funciona muy bien con idiomas con raíces románicas, como el castellano, porque la estructura gramatical es parecida. Es posible que haya que hacer cierto refinamiento en estos idiomas para llegar al nivel del castellano e inglés. También estamos trabajando para ofrecer esta solución en euskera”.

La crisis generada por la pandemia del coronavirus ha tenido dos vertientes en la actividad de la empresa bilbaína. Por una parte, sus clientes iniciales eran todo tipo de empresas, pymes y autónomos; sin embargo, según reconoce Villanueva, “debido a la situación económica, para las pymes, ahora mismo, su prioridad no es cumplir con la Ley de Protección de Datos y anonimizar, sino sobrevivir”. Por otro lado, Nymiz ha nacido en plena pandemia, algo que ha resultado positivo según recalca su fundador: “Dedicándonos al ‘software’, para nosotros ha sido positivo porque desde nuestras casas hemos podido desarrollar el producto, hemos trabajado en remoto, todo ‘online’, y ahora seguimos trabajando igual. Es un paradigma diferente que ha cambiado de un año en adelante. Trabajar de esta manera te permite ser más flexible, tener menos costes y ser más productivos”.

De cara al futuro, esta ‘startup’ que ya forma parte del ecosistema del Basque Cybersecurity Centre impulsado por SPRI, se marca como retos aprovechar todas las oportunidades que van a suponer las ayudas europeas, nacionales y regionales para incentivar medidas para la protección de datos de las empresas y las administraciones. Además, según inciden, “queremos financiarnos cuanto antes para seguir creciendo al ritmo que queremos. Otro reto es ofrecer tecnología puntera y mejoras en nuestros productos para dar satisfacción a las necesidades del cliente que, cada vez, van a ser más mayores”.

El Gobierno vasco impulsa la ciberseguridad en las empresas vascas a través de la generación de un tejido económico sobre a esta materia, articulado en torno al Basque Cibersecurity Center.

Vìa SPRI