No uses la Inteligencia Artificial para trabajar menos, úsala para ganar más

AUTOR: Javier Martín /Futurizable by SNGULAR

Dedica un momento a pensar en Sam Altman o cualquiera de los socios fundadores de OpenAI ¿Crees que trabajan más o menos que cuando pusieron en marcha su empresa enfocada en el desarrollo de la Inteligencia Artificial? lo cierto es que ahora que han dado con la tecla de la tecnología del momento, lo normal es que estén trabajando más que nunca, o al menos lo mismo que antes.

Por esto cuando hablamos del aumento de la productividad provocado por el uso de la Inteligencia Artificial Generativa, especialmente ChatGPT, lo primero en lo que deberíamos pensar es qué vamos a hacer con el tiempo que dejemos de dedicar a las tareas repetitivas que podamos automatizar gracias a esta nueva tecnología. Y a eso es de lo que vamos a hablar en la segunda parte de este artículo, porque en la primera lo que queremos es comentar precisamente cómo lograr ese aumento de la productividad.

Lo que proponemos aquí es un proceso para el aprendizaje en el uso de GPT que se basa en tres fases y una serie de ejercicios a realizar en cada una de las fases, hasta que descubras qué es lo mejor que esta tecnología puede hacer por ti y puedas llegar a automatizar una parte de tu trabajo, para dedicar el tiempo disponible a otras actividades que te permitan obtener un mayor beneficio por tu trabajo.

  • Fase 1: copiloto. Mejora la toma de decisiones y amplifica tu creatividad. Antes de lanzarte a automatizar tareas es muy recomendable que uses ChatGPT como un compañero de viaje, con el que puedes ir compartiendo lo que vas haciendo en tu trabajo, pero en el que aún no delegas responsabilidades, hasta que has podido comprobar que no comete errores en las cosas que le pides y sobre todo que el trabajo que realiza resulta realmente valioso. Aquí es muy importante pensar en cómo esta herramienta puede ayudarnos a potenciar la creatividad y mejorar la calidad del trabajo que ya estamos habituados a hacer en nuestro día a día.
  • Fase 2: entrenador. Mejora tus habilidades. A partir de ahora asume el hábito de recurrir a ChatGPT para que te acompañe en el proceso de aprendizaje de las cosas nuevas que quieras aprender, sin dejar de leer los libros o hacer los cursos que tuvieras pensado, pero recurriendo a esta nueva compañía que puede acelerar y amplificar el proceso de aprendizaje. De hecho, puedes pedir a ChatGPT que te ayude a diseñar el propio proceso de aprendizaje, una vez elegido el tema sobre el que quieres aprender dile que te ayude a trazar un plan al respecto.
  • Fase 3: piloto automático. Aumenta tu productividad. Ahora que ya sabes en qué cosas puede ayudarte, tanto a nivel de trabajo como de aprendizaje, puedes empezar a automatizar determinadas tareas, lo cual te dará tiempo disponible para hacer otras cosas donde puedas aportar un valor añadido mayor. Este punto es muy importante porque uno de los mayores riesgos de esta tecnología es que acabe deteriorando el valor del trabajo humano, por ejemplo si lo usamos para crear contenido basura, como el que muchas veces se escribe para el SEO, pero en este caso elevado a la máxima potencia.

A este respecto de usar GPT como piloto automático se están empezando a dar los primeros pasos para un nuevo vector de escalabilidad de esta tecnología, más allá del de los plugins para ChatGPT que traerán multitud de nuevas utilidades gracias al desarrollo del modelo de negocio de plataforma de Apps, lo que vamos a ver surgir en los próximos meses es el concepto de Agente, que es aquel programa basado en GPT que puede funcionar de manera autónoma en base a unas primeras instrucciones pero donde a continuación el propio robot es capaz de ir dando pasos en determinado proceso sin necesitar de las instrucciones humanas.

Uno de estos primeros Agentes basados en GPT es AutoGPT y a medida que se vayan produciendo novedades en este tema os lo iremos comentando por aquí porque seguro que nos van a sorprender.

Cómo usar la Inteligencia Artificial para ganar más

Si en las últimas décadas los trabajos en el sector tecnológico se convertían en los mejor remunerados, lo que podría ocurrir ahora es que se amplifiquen mucho las posibilidades al respecto de qué tipo de profesionales pueden usar tecnología para mejorar su cualificación y correspondiente remuneración.

Así vemos como personajes muy relevantes de este sector, como Andrej Karpathy, nos hablan de que una vez que están desarrollada las infraestructuras, en este caso los LLM, Grandes Modelos de Lenguaje, como los de OpenAI o Google, lo que va a ser necesario es saber sacarles provecho, obtener todo el jugo de ellos, como ya ha ocurrido anteriormente con la digitalización, que ha permitido el surgimiento de muchos trabajos digitales que hace pocas décadas no existían.

Entonces el reto en estos momentos es convertirse en uno de esos profesionales que son capaces de reinventarse para darle un nuevo impulso a su carrera, lo cual resultará más sencillo para aquellos que ya lo hayan hecho con anterioridad. Algo que también debería ser considerado por cualquier persona que vea que en un mundo que cambia a la velocidad de la luz ya no se puede dar nada por seguro.

  • Aprender: como dijo Ruth Baza, «El día que deje de aprender estaré muerta» y más ahora, aunque no se trate de una cuestión de supervivencia física, sino más bien intelectual o profesional, tenemos delante de nosotros una de las mejores oportunidades de la historia para amplificar la forma en la que aprendemos y poner en práctica de manera inmediata todo lo que aprendemos.
  • Crear: la buena noticia de 2022 con el desarrollo de la Inteligencia Artificial Generativa de imagen, como Dalle, Stable Diffusion y Midjourney, fue que la tecnología no acabó con la creatividad de la gente, al contrario está permitiendo que mucha gente se lance a desarrollar su faceta creativa, como nos han contando por aquí recientemente Javier López y Javier Jiménez.
  • Innovar: no solo los profesionales tenemos una gran oportunidad por delante si empezamos a trabajar cada día con esta tecnología, de hecho las empresas deberían comenzar a plantearse cómo va a cambiar su modelo de negocio y qué pasos deberían empezar a tomar para no quedarse fuera de esta gran revolución. Un tema del que también hemos hablado hace poco con Ángel Alba, al respecto del concepto de innovación aumentada.
  • Emprender: qué bueno es ver el auge que está suponiendo para el emprendimiento tecnológico la posibilidad de acceder a las APIs de tecnologías como GPT, algo que se visualiza muy bien a través de directorios como Futurepedia donde ya se han registrado más de 1.700 proyectos. También es muy interesante fijarse en proyectos concretos como Poe y Luzia que muestran un gran potencial para facilitar el acceso a esta tecnología al gran público.

Monoceros, ejemplo de emprendimiento en Inteligencia Artificial

Y para terminar con este artículo dedicado a buscar oportunidades para ganar más con la Inteligencia Artificial te recomendamos conocer el proyecto Monoceros, liderado por Nieves Ábalos y Carlos Muñoz-Romero, que nos han concedido la entrevista que puedes leer a continuación.

¿Cómo surge la idea de poner en marcha Monoceros y quiénes sois sus promotores?

Los fundadores de Monoceros Labs somos Nieves Ábalos y Carlos Muñoz-Romero, y junto a nuestro equipo trabajamos en proyectos de innovación sobre tecnologías del habla y síntesis de voz en español.

Comenzamos a trabajar juntos hace 10 años en el equipo de Innovación de una empresa de tecnología de BBVA (BEEVA, ahora BBVA Next Technologies) investigando, entre otras cosas, tecnologías del habla y sus aplicaciones en interfaces conversacionales. Decidimos tomar una excedencia a finales de 2017 e iniciar algunos proyectos de emprendimiento durante el primer año, 2018, que coincidió con el lanzamiento de los asistentes de voz en español: Google Assistant y Amazon Alexa.

Fue entonces cuando apostamos por enfocarnos en las tecnologías de voz para nuestro idioma, con la motivación de crear las mejores experiencias conversacionales posibles y derribar las barreras de comunicación con la tecnología. Nos apasionaba la posibilidad de emplear algo tan natural como la voz y el lenguaje hablado.

Además de haber conseguido ser agencia destacada de Amazon Alexa en España, hace algo más de 2 años comenzamos un proyecto de investigación sobre tecnologías de síntesis de voz en español que ha sido apoyado por CDTi a través de un NEOTEC. Esto nos ha llevado a poder crear voces sintéticas TTS (text-to-speech) en español personalizadas, que son más expresivas y naturales de escuchar. Esto nos permite no sólo imitar la voz de una persona en concreto con gran fidelidad, sino también crear voces mediante modelos generativos que no identifican a una persona, dándonos la posibilidad de crear voces de marca y otras identidades de voz para la creación de contenido sonoro. Tener este tipo de voces permite no solo que las empresas y marcas se diferencien, sino también nos permite llevar contenidos de voz donde las personas no podemos hacerlo, ya sea por incapacidad humana, por falta de recursos o por tiempo. Para ello, estamos trabajando en una plataforma online llamada Fonos que facilita la creación de contenido de audio con voces sintéticas personalizadas.

¿Qué tecnologías habéis utilizado para desarrollarlo?

Para el desarrollo de nuestras tecnologías de síntesis de voz, hemos creado nuestra propia adaptación de Autoencoder Variacional (VAE) y GANs. Estas arquitecturas están incluidas en el campo de la Inteligencia Artificial Generativa. Tras contrastar varias alternativas de arquitecturas del estado del arte académico para el español, decidimos apostar por crear nuestro propio modelo generativo que nos ofrece muy buen rendimiento en términos de velocidad y naturalidad. Para esto contamos con el apoyo de un equipo de investigadores de la Universidad Rey Juan Carlos de Madrid. Además, estamos creando nuestro propio procesamiento lingüístico personalizado para español y sus dialectos. Entrenamos nuestros modelos utilizando PyTorch y desplegamos los modelos y nuestro API en el cloud de Amazon Web Services (AWS).

¿Cuál ha sido el mayor reto tecnológico que habéis tenido que resolver?

Entre todos los retos a los que nos estamos enfrentando, el más importante ha sido el de crear nuevas identidades de voz, metiéndonos en las tripas de nuestra arquitectura de redes neuronales. Clonar una voz es ya una realidad, con los retos que ello conlleva: éticos, legales y humanos. En cambio, crear una voz que suene natura, con unas características concretas, y que no identifique a una persona real no estaba tan resuelto. Utilizar un modelo generativo de redes neuronales nos dio la posibilidad de crear estas nuevas voces, que se pueden utilizar para la creación de contenido sonoro o en asistentes virtuales.

Otros retos a los que nos estamos enfrentando son los relativos a la diversidad de acentos del español, otras lenguas cooficiales y ser capaces de expresar mayor rango de emociones y estilos en el habla.

¿Puedes hablarnos de algún caso de éxito del uso de vuestra tecnología?

Tenemos dos casos de éxito innovadores con medios de comunicación: narración de noticias para RTVE y la creación de «Victoria, la voz del fútbol» en colaboración con Prisa Media y Amazon Alexa.

Con «Victoria, la voz del fútbol», creamos la primera voz femenina de marca para una locutora virtual en la radio de Cadena Ser, que también se puede escuchar en Alexa y que ofrece un estilo de narración único al informar sobre los próximos partidos de fútbol de equipos de primera y segunda división, así como la narración de noticias de As.

Además, hemos tenido la oportunidad de colaborar con el área de innovación tecnológica de RTVE para llevar contenido informativo generado automáticamente a formatos de audio y asistentes conversacionales, con la intención de ofrecer noticias en municipios pequeños sin cobertura informativa. A raíz de esta colaboración, estamos trabajando en un proyecto para transmitir los resultados electorales a estos mismos municipios durante las próximas elecciones municipales, utilizando dos voces generadas con IA.

¿Puedes contarnos vuestros planes de futuro para este proyecto?

Nuestros planes de futuro para el proyecto incluyen lanzar la beta abierta de Fonos durante el segundo trimestre del año. Queremos ofrecer a quienes crean contenido la posibilidad de usar voces sintéticas (su propia voz clonada, u otras voces con estilo personalizado) para ayudarles tanto en la creación, como en la edición de contenido sonoro.

También estamos trabajando en una línea de accesibilidad para asegurarnos de que nuestro producto pueda ser utilizado por personas con diferentes necesidades y en diferentes contextos. Podemos crear voces para lectura de páginas web, hasta voces para quienes la están perdiendo y necesitan comunicarse (manteniendo su identidad).

Además, queremos ampliar la diversidad de las voces sintéticas incorporando nuevos estilos, emociones, idiomas y dialectos hasta finales de año. Esto nos permitirá llegar a una base de clientes más amplia y ofrecer experiencias más personalizadas en español.

Por último, estamos explorando nuevos verticales donde las voces sintéticas ayuden a quienes trabajan en la creación de contenido, como en audiolibros, videojuegos, contenido educativo, y asistentes conversacionales. Aquí, hay muchos problemas en los que esta tecnología puede aportar un valor diferencial. El de las voces sintéticas es un mundo lleno de oportunidades.

Cursos GPT Champion by SNGULAR www.eventbrite.com