IA generativa
¿Qué es la IA generativa?
La inteligencia artificial generativa (GenAI) se refiere a una clase de técnicas y modelos de inteligencia artificial que crean contenidos nuevos y originales, a partir de los datos con que los modelos fueron entrenados. El output pueden ser textos, imágenes o videos que reflejan o responden al input. La GenAI, al igual que muchas aplicaciones de la inteligencia artificial, puede abarcar muchas industrias. Muchas de estas aplicaciones son en el área del arte y la creatividad, pues GenAI puede usarse para crear arte, música, videojuegos y poesía a partir de los patrones observados en los datos de entrenamiento. Pero su aprendizaje del lenguaje hace que también sea idónea para facilitar la comunicación, por ejemplo como chatbots o agentes conversacionales que pueden simular la conversación humana, traducir lenguajes, síntesis realista del habla o texto a habla. Estos no son sino unos cuantos ejemplos. Este artículo desarrolla las formas en que la GenAI presenta tanto oportunidades como riesgos en el espacio cívico y para la democracia, y qué pueden hacer las instituciones gubernamentales, organizaciones internacionales, activistas y organizaciones de la sociedad civil para aprovechar las oportunidades y cuidarse de los riesgos.
¿Cómo funciona GenAI?
Al centro de GenAI yacen modelos generativos, que son algoritmos o arquitecturas diseñados para aprender los patrones subyacentes y las estadísticas de los datos de entrenamiento. Estos modelos pueden entonces usar este conocimiento aprendido para producir nuevos outputs que semejan la distribución original de los datos. La idea es captar los patrones subyacentes y las estadísticas de los datos de entrenamiento para que el modelo de IA pueda generar nuevos ejemplos que forman parte de la misma distribución.
Pasos del proceso de GenAIComo vemos en la figura arriba, los modelos de GenAI se desarrollan mediante un proceso en donde una base curada se usa para entrenar redes neuronales con técnicas de aprendizaje automático. Estas redes pueden aprender a identificar patrones en los datos, lo que les permite generar nuevos contenidos o hacer predicciones basadas en la información aprendida. A partir de allí los usuarios pueden ingresar comandos en estos modelos algorítmicos bajo la forma de palabras, números o imágenes, y el modelo produce contenidos que responden sobre la base del input y los patrones aprendidos con los datos de entrenamiento. Como se les entrena con conjuntos de datos cada vez más grandes, los modelos de GenAI alcanzan una gama más amplia de posibles contenidos que pueden generar entre distintos medios, desde audio a imágenes y texto.
Hasta hace poco, la GenAI simplemente imitaba el estilo y la sustancia del input. Por ejemplo, alguien podría ingresar un fragmento de un poema o noticia en un modelo, y éste produciría un poema o noticia completo que sonaba como el contenido original. Un ejemplo de cómo se ve esto en el campo de la lingüística y que usted podría haber visto en su propio correo electrónico, es el lenguaje predictivo del tipo de Google Smart Compose, que completa una oración a partir de la combinación de palabras iniciales que usa y la expectativa probabilística de qué habrá de seguir. Por ejemplo, una máquina que estudia billones de palabras de conjuntos de datos podría generar una expectativa probabilística de una oración que comienza con “por favor ven ___”. En el 95% de los casos, la máquina verá “aquí” como la siguiente palabra, en el 3% a “conmigo” y en el 2% “pronto”. De este modo, al completar oraciones o generar outputs, el algoritmo que aprendió el lenguaje usará la estructura de la oración y la combinación de palabras que había visto antes. Dado que los modelos son probabilísticos, a veces pueden cometer errores que no reflejan las intenciones matizadas del input.
GenAI ahora cuenta con capacidades más expansivas. Pasando más allá del texto, es ahora una herramienta para producir imágenes a partir de textos. Por ejemplo, herramientas tales como DALL-E, Stable Diffusion y MidJourney permiten a un usuario ingresar descripciones de texto a las que el modelo luego usa para producir una imagen correspondiente. Estas imágenes varían en su realismo; por ejemplo, algunas parecen salidas de una escena de ciencia ficción, en tanto que otras parecen una pintura y otras más una fotografía. Vale la pena señalar además que estas herramientas están mejorando constantemente, asegurando así que las fronteras de lo que se puede conseguir con la generación de testo a imagen seguirán expandiéndose.
Recientes modelos han incorporado el aprendizaje automático a partir de patrones de lenguaje, pero también información factual acerca de la política, la sociedad y la economía. Los últimos modelos son también capaces de tomar comandos de input a partir de imágenes y voz, ampliando aún más su versatilidad y utilidad en diversas aplicaciones.
Recientemente, los modelos que miran a los usuarios y simulan la conversación humana —“IA conversacional”— han proliferado y operan más como chatbots, respondiendo a interrogantes generales y preguntas, de modo muy parecido a cómo funciona un motor de búsqueda. Algunos ejemplos incluyen el pedirle al modelo que responsa a cualquiera de estas preguntas:
- Presente una foto de un líder político tocando un ukulele en el estilo de Salvador Dalí.
- Hable acerca de la capital de Kenia, su forma de gobierno, su carácter o acerca de la historia de la descolonización en Asia del Sur.
- Escriba e interprete una canción acerca de la adolescencia que imite una canción de Drake.
En otras palabras, estos modelos más nuevos pueden funcionar como una fusión de búsqueda de Google y un intercambio con una persona conocedora acerca de su área de especialidad. Al igual que a una persona socialmente atenta, a estos modelos se les puede ir enseñando en el transcurso de una conversación. Si usted fuera a hacer una pregunta acerca de los mejores restaurantes en Manila y el chatbot le responde con una lista que incluye algunos restaurantes de Europa Continental, usted podría entonces manifestar su preferencia por los restaurantes filipinos, lo que haría que el chatbot personalice su output a sus preferencias específicas. El modelo aprende a partir de la retroalimentación, pero modelos como ChatGPT señalarán rápidamente que sólo están adiestrados con datos hasta cierta fecha, lo que quiere decir que algunos restaurantes habrán cerrado, y que podrían haber aparecido otros que han sido galardonados. El ejemplo resalta una tensión fundamental entre los modelos o contenidos actualizados, y la capacidad para refinar a los primeros. Si intentamos tener modelos que aprendan la información a medida que ésta va siendo producida, entonces ellos generarán respuestas actualizadas pero no podrán filtrar los outputs de la mala información, los discursos del odio o las teorías de la conspiración.
GenAI involucra varios conceptos claves:
Modelos generativos: los modelos generativos son una clase de modelos de aprendizaje automático diseñados para crear o generar nuevos outputs de datos que semejen un conjunto de datos de entrenamiento dado. Estos modelos aprenden los patrones y estructuras subyacentes a partir de los datos de entrenamiento y usan dicho conocimiento para generar nuevos outputs de datos similares.
ChatGPT: ChatGPT es un modelo transformador generativo preentrenado (GPT) desarrollado por OpenAI. Si bien los investigadores han desarrollado y usado modelos de lenguaje durante décadas, ChatGPT fue el primer modelo de lenguaje que miraba al consumidor. Entrenado para entender y producir textos similares a los humanos en un entorno de diálogo, fue diseñado específicamente para generar respuestas conversacionales y tomar parte en conversaciones interactivas basadas en textos. En cuanto tal es idóneo para crear chatbots, asistentes virtuales y otras aplicaciones conversacionales de IA.
Red neuronal: una red neural es un modelo de computación que busca funcionar como las neuronas interconectadas del cerebro. Forma parte importante del proceso de aprendizaje profundo porque ejecuta un cálculo, y la fuerza de las conexiones (pesos) entre neuronas determina el flujo de información e influye en el output.
Datos de entrenamiento: los datos de entrenamiento son los que se usan para entrenar a los modelos generativos. Son de crucial importancia, puesto que el modelo aprende patrones y estructuras a partir de ellos para crear nuevos contenidos. Por ejemplo, los datos de entrenamiento en el contexto de la generación de textos consistirían en una gran colección de documentos de texto, oraciones o párrafos. Su calidad y diversidad tienen un impacto significativo sobre el desempeño del modelo de GenAI, porque le ayudan a generar contenidos más relevantes.
Alucinación: en el contexto de GenAI, el término “alucinación” se refiere a un fenómeno en el cual el modelo de IA produce outputs que no tienen base en la realidad o en representaciones precisas de los datos ingresados. En otras palabras, la IA genera contenidos que parecieran existir, pero que en realidad han sido íntegramente inventados y no tienen base alguna en los datos reales con los que fue entrenada. Por ejemplo, un modelo de lenguaje podría producir párrafos de texto que parecen coherentes y factuales, pero con un examen más detenido parecería incluir información falsa, hechos que jamás ocurrieron, o conexiones entre conceptos que son lógicamente defectuosas. El problema se debe al ruido de los datos de entrenamiento. Abordar y minimizar las alucinaciones de GenAI es un reto actual de las investigaciones. Los investigadores y desarrolladores se esfuerzan por mejorar la comprensión que los modelos tienen del contexto, la coherencia y la precisión fáctica, para así reducir la probabilidad d generar contenidos que puedan ser considerados alucinatorios.
Prompt: un prompt de GenAI es un input o instrucción específico dado a un modelo de GenAI para que lo guíe en la producción de un output deseado. En la generación de imágenes, un prompt podría involucrar el especificar el estilo, contenido y otros atributos que desea que la imagen generada tenga. La calidad y relevancia del output generado a menudo dependen de la claridad y especificidad del prompt. Uno bien armado puede llevar a contenidos generados más precisos y deseables.
Métrica de evaluación: evaluar la calidad de los outputs de los modelos de GenAI puede ser difícil, pero varias métricas de evaluación han sido preparadas para evaluar diversos aspectos del contenido generado. Métricas tales como Inception Score, Frechet Inception Distance (FID), y Perceptual Path Length (PPL) intentan medir aspectos de la performance del modelo como la diversidad de las respuestas (de modo tal que no todas suenen como copias la una de la otra), la relevancia (que traten del tema) y la coherencia (que se mantengan en el tema) del output.
Ingeniería de instrucciones: la ingeniería de instrucciones es el proceso de diseñar y refinar los prompts o instrucciones dadas a los sistemas de GenAI —como los chatbots, o los modelos de lenguaje como GPT-3.5— para conseguir las respuestas específicas y deseadas. Esto involucra el armado del texto o interrogante del input de tal modo que el modelo genere outputs que se alineen con la intención del usuario o con la tarea deseada. Es útil para optimizar los beneficios de GenAI, pero requiere de una profunda comprensión del comportamiento y las capacidades del modelo, así como de los requerimientos específicos de la aplicación o tarea. Unos prompts bien armados pueden mejorar la experiencia del usuario al asegurar que los modelos brinden respuestas valiosas y precisas.
¿De qué modo es la GenAI relevante en el espacio cívico y para la democracia?
El rápido desarrollo y difusión de las tecnologías de GenAI —en medicina, sostenibilidad ambiental, política y periodismo, entre muchos otros campos— viene creando o habrá de crear enormes oportunidades. Se la viene usando para descubrir medicamentos, el diseño de las moléculas, análisis de imágenes médicas y recomendaciones de tratamiento personalizadas. Se la usa para modelar y simular ecosistemas, predecir cambios ambientales y diseñar estrategias de conservación. Ella ofrece respuestas más accesibles acerca de los procedimientos burocráticos, de modo tal que los ciudadanos entiendan mejor a su gobierno, lo que constituye un cambio fundamental en la forma en que éstos acceden a la información y en cómo es que el gobierno opera. Está apoyando la generación de contenidos escritos tales como artículos, reportes y publicidad.
En todos estos sectores, la GenAI también ha introducido riesgos posibles. Los gobiernos, trabajando con el sector privado y organizaciones de la sociedad civil, están asumiendo distintos enfoques para equilibrar la capitalización de las oportunidades con el cuidarse de otros riegos, reflejando así distintas filosofías acerca de los riesgos y el papel de la innovación en sus respectivas economías, y los distintos precedentes legales y paisajes políticos entre los países. Muchos de los esfuerzos pioneros vienen dándose en los países en donde la IA se usa más, como en los Estados Unidos o en los de la Unión Europea, o en otros de alta tecnología como China. Las conversaciones en torno a la regulación en otros países se han retrasado. En África, por ejemplo, los expertos en la conferencia de Africa Tech Week, en la primavera de 2023, manifestaron su preocupación por el retraso en el acceso de África a la IA, y la necesidad de ponerse al día para cosechar sus beneficios en la economía, la medicina y la sociedad, pero también indicaron los problemas de privacidad y la importancia de tener equipos de investigación en IA diversos, para así cuidarse de los sesgos. Estas conversaciones sugieren que tanto el acceso como la regulación se están desarrollando a distintas tasas en distintos contextos, y que aquellas regiones que actualmente están desarrollando y probando regulaciones podrían ser los modelos a seguir, o al menos brindar las lecciones aprendidas a otros países cuando éstos se regulen.
La Unión Europea se apresuró a regular la IA usando un enfoque escalonado basado en riesgos, que designa como prohibidos a algunos de estos tipos de “usos de alto riesgo” Se considera que son de alto riesgo los sistemas de GenAI que no tienen planes de evaluación y mitigación de riesgos, información clara para los usuarios, explicabilidad, logging en las actividades y otros requisitos más. Según un estudio de la Universidad de Stanford de 2021, la mayoría de los sistemas de GenAI no satisface estos requisitos. Sin embargo, los ejecutivos de 150 compañías europeas respondieron colectivamente en contra de la agresiva regulación, sugiriendo que una reglamentación demasiado estricta de la IA incentivaría a las compañías a establecer su sede fuera de Europa y sofocaría la innovación y el desarrollo económico de la región. Una carta abierta reconoce que cierta regulación podría estar justificada, pero que GenAI será “decisiva” y “poderosa”, y que “Europa no puede darse el lujo de ponerse al margen”.
China ha sido uno de los países más agresivos cuando se trata de la regulación de la IA. La Administración de la Ciberseguridad de China exige que la IA sea transparente, sin sesgos y que no se use para generar desinformación o descontento social. Las normas existentes reglamentan fuertemente los deepfakes: medios sintéticos en que el aspecto de una persona, su rostro y voz inclusive, son reemplazados con el de otra usualmente usando IA. Todo proveedor de servicio que use contenidos generados por GenAI debe asimismo obtener el consentimiento de los sujetos de los deepfakes, etiquetar los outputs, y luego responder a toda desinformación. Sin embargo y como veremos, haber implementado estas regulaciones no quiere decir que los actores estatales no usen ellos mismos la IA con fines maliciosos o en operaciones de influencia.
Los Estados Unidos celebraron una serie de audiencias para entender mejor la tecnología y su impacto en la democracia, pero para septiembre de 2023 aún no contaba con ninguna ley significativa que regulase GenAI. Sin embargo, se han celebrado varias sesiones legislativas para entender mejor la tecnología y prepararse para regularla. La Comisión Federal de Comercio, responsable por la promoción de la protección del consumidor, envió una carta de 20 páginas a OpenAI, el creador de ChatGPT, solicitando respuesta a sus preguntas acerca de la privacidad de los consumidores y la seguridad. El gobierno de los EE.UU. además ha trabajado con las principales empresas de GenAI para establecer salvaguardas de transparencia y seguridad voluntarias a medida que los riesgos y beneficios de la tecnología evolucionan.
António Guterrez, el secretario general de las Naciones Unidas, fue más allá de las iniciativas reguladoras a nivel regional o de los países y propuso la transparencia, la responsabilidad y la supervisión de la IA. En palabras del Sr. Guterrez: “La comunidad internacional cuenta con una larga historia de responder a nuevas tecnologías con el potencial para perturbar nuestras sociedades y economías. Nos hemos reunido en las Naciones Unidas para establecer nuevas normas internacionales, firmar nuevos tratados y establecer nuevas agencias globales. Si bien muchos países han solicitado medidas e iniciativas distintas con respecto a la gobernanza de la IA, esto necesita tener un enfoque universal”. Esta afirmación apunta al hecho que el espacio digital no conoce fronteras, y que las tecnologías de software innovadas en un país inevitablemente habrán de cruzarlas, lo que sugiere que unas normas o restricciones significativas de la GenAI probablemente necesitarán de un enfoque internacional coordinado. Con este fin, algunos investigadores han propuesto una Organización Internacional de Inteligencia Artificial que ayude a certificar el cumplimiento de estándares internacionales sobre la seguridad de la IA, y que también reconozcan la naturaleza inherentemente internacional de su desarrollo y despliegue.
Oportunidades
Mejorar la representaciónUno de los principales retos en democracia y para la sociedad civil es asegurar que las voces de los electores sean escuchadas y representadas, lo que involucra en parte el que los ciudadanos mismos tomen parte en el proceso democrático. La GenAI podría ser útil para dar voz tanto a quienes formulan las políticas como a los ciudadanos, una forma de comunicarse con mayor eficiencia y mejorar así la confianza en las instituciones. Otro camino para mejorar la representación es que la GenAI presente datos que den a los investigadores y a los que diseñan las políticas, una oportunidad para entender diversas cuestiones sociales, económicas y medioambientales, así como la preocupación que los electores tienen con respecto a ellas. Por ejemplo, GenAI podría usarse para sintetizar grandes volúmenes de comentarios entrantes de líneas abiertas o correos electrónicos, y así entender mejor las preocupaciones desde abajo que los ciudadanos tienen con respecto a su democracia. A decir verdad, estas herramientas de análisis de datos necesitan asegurar la privacidad de la información, pero sí pueden proporcionar una visualización de los datos para que los líderes institucionales entiendan qué le interesa a la gente.
Muchas regulaciones y leyes son densas y difíciles de entender para cualquiera fuera del establishment que toma las decisiones. Estos retos a la accesibilidad se hacen aún más grandes para las personas con discapacidades tales como la discapacidad cognitiva. La GenAI puede resumir extensas leyes y traducir densas publicaciones gubernamentales en un formato de fácil lectura, con imágenes y lenguaje simple. Las organizaciones de la sociedad civil pueden también usarla para diseñar campañas en los medios sociales y otros contenidos para que sean más accesibles a quienes tienen alguna discapacidad.
La GenAI puede mejorar la participación cívica generando contenidos personalizados a intereses y preferencias individuales mediante una combinación de análisis de datos y aprendizaje automático. Esto podría involucrar la generación de materiales informativos, resúmenes de noticias o visualizaciones que atraigan a los ciudadanos y les alienten a tomar parte en las discusiones y actividades cívicas. La industria del marketing hace tiempo ha aprovechado el hecho que es más probable que los contenidos específicos a consumidores individuales despierten su consumo o participación, y esta idea vale en la sociedad civil. Cuanto más esté personalizado y focalizado el contenido en una persona específica o en una categoría de persona, tanto más probable es que ella responda. Una vez más, el uso de los datos para ayudar a clasificar las preferencias de los ciudadanos depende inherentemente de los datos de los usuarios. No todas las sociedades suscribirán este uso que se les da. Por ejemplo, la Unión Europea ha mostrado cierto recelo con respecto a la privacidad, y ha sugerido que una sola talla no servirá para todos en términos de este uso particular de la GenAI para la participación cívica.
Habiendo dicho esto, esta herramienta podría ayudar a eliminar la apatía de los votantes, la cual podría conducir a un desencanto y alejamiento de la política. En lugar de comunicaciones repetitivas que urgen a los jóvenes a que voten, la GenAI podría, por ejemplo, producir un contenido inteligente que se sabe resuena entre las jóvenes o los grupos marginados, ayudando así a contrarrestar algunas de las barreras adicionales a la participación que los grupos marginados enfrentan. En un entorno educativo, el contenido personalizado podría usarse para atender a las necesidades de los estudiantes en diferentes regiones y con distintas capacidades de aprendizaje, proporcionándose al mismo tiempo tutores virtuales o herramientas de aprendizaje del lenguaje.
Otra forma en que la GenAI podría hacer posible la participación y deliberación públicas sería mediante chatbots y agentes conversacionales impulsados por GenAI. Estas herramientas pueden facilitar la deliberación pública involucrando a los ciudadanos en el diálogo, abordando sus preocupaciones y ayudándoles a navegar complejas cuestiones cívicas. Estos agentes pueden proporcionar información, responder preguntas y estimular la discusión. Algunos municipios ya han lanzado asistentes virtuales y chatbots propulsados por la IA que automatizan los servicios cívicos y que optimizan procesos tales como las preguntas de los ciudadanos, los pedidos de servicio y las labores administrativas. Esto podría llevar a una mayor eficiencia y capacidad de respuesta en las operaciones del gobierno. La falta de recursos municipales —de personal, por ejemplo— podría significar que los ciudadanos tampoco cuentan con la información que necesitan para ser participantes significativos de su sociedad. Con recursos relativamente limitados se puede entrenar a un chatbot con datos locales, para que brinde la información específica necesaria para cubrir la brecha.
Los chatbots pueden ser entrenados en múltiples lenguajes, lo que hace que la información y los recursos cívicos puedan ser más accesibles a poblaciones diversas. Ellos pueden asistir a las personas con discapacidades generando formatos alternativos para la información, como descripciones de audio o conversiones de texto a habla. La GenAI puede ser entrenada con dialectos y lenguas locales, promoviendo a las culturas indígenas y haciendo que el contenido digital sea más accesible para poblaciones diversas.
Es importante señalar que la aplicación de GenAI debe hacerse prestando sensibilidad a los contextos locales, las consideraciones culturales y de privacidad. Adoptar un enfoque de diseño humano-céntrico a la colaboración entre los investigadores de IA, programadores, grupos de la sociedad civil y comunidades locales podría ayudar a asegurar que estas tecnologías sean adaptadas apropiada y equitativamente para abordar las necesidades y retos específicos de la región.
La GenAI puede también usarse en la analítica predictiva para predecir posibles resultados de decisiones de política. Por ejemplo, los modelos generativos propulsados por la IA pueden analizar los datos locales del suelo y el clima para optimizar el rendimiento de los cultivos y recomendar prácticas agrícolas idóneas para regiones específicas. Se la puede usar para generar simulaciones realistas para predecir posibles impactos y preparar estrategias de respuesta a los desastres para las operaciones de socorro. Puede analizar las condiciones medioambientales y la demanda de energía locales para optimizar el despliegue de fuentes energéticas renovables como la energía solar y eólica, promoviendo así soluciones energéticas sostenibles.
Al analizar los datos históricos y generar simulaciones, los decisores de políticas pueden tomar decisiones más informadas y basadas en las evidencias para la mejora de la sociedad. Estas mismas herramientas pueden ayudar no sólo a quienes formulan las políticas, sino también a las organizaciones de la sociedad civil a generar visualizaciones de datos o resumir información acerca de las preferencias ciudadanas. Esto puede ayudar a producir contenidos más informativos y oportunos acerca de las preferencias ciudadanas y el estado de cuestiones claves, como el número de personas que no tienen casa.
La GenAI se puede usar en formas que conduzcan a un impacto ambiental favorable. Podría, por ejemplo, usársela en campos tales como la arquitectura y el diseño de productos para optimizar los diseños para que sean más eficientes. Se la puede usar para optimizar procesos en la industria energética que puedan mejorar la eficiencia energética. También tiene el potencial para ser usada en logística, en donde GenAI puede optimizar las rutas y cronogramas, reduciendo así el consumo y las emisiones de combustible.
Riesgos para la democracia
Para aprovechar el potencial de GenAI para la democracia y el espacio cívico es necesario contar con un enfoque equilibrado que aborde los problemas éticos, fomente la transparencia, promueva el desarrollo tecnológico inclusivo e involucre a múltiples partes interesadas. La colaboración entre investigadores, decisores de política, la sociedad civil y diseñadores de tecnología puede ayudar a asegurar que GenAI contribuya positivamente a los procesos democráticos y la participación cívica. La capacidad de generar grandes volúmenes de contenido creíble podría crear oportunidades para que los decisores de política y los ciudadanos se conecten mutuamente, pero estas mismas capacidades de los modelos avanzados de GenAI crean también posibles riesgos.
Desinformación en líneaAunque GenAI ha mejorado, los modelos siguen alucinando y producen outputs que suenan convincentes, por ejemplo, hechos o historias que suenan plausibles pero que no son correctos. Si bien hay muchos casos en los cuales estas alucinaciones son benignas —como una pregunta científica acerca de la edad del universo—, hay otros casos en los cuales las consecuencias serían desestabilizadoras política o socialmente.
Dado que la GenAI mira al público, es posible que las personas utilicen estas tecnologías sin entender sus limitaciones. Podrían entonces esparcir desinformación inadvertidamente a partir de una respuesta imprecisa acerca de política o historia, por ejemplo, una afirmación inexacta acerca de un dirigente político que termina encendiendo un entorno político ya de por sí agrio. La propagación de desinformación generada por IA que inunde el ecosistema informativo, tiene el potencial para reducir la confianza en dicho ecosistema como un todo, haciendo así que la gente sea escéptica de los hechos y se conforme con las creencias de sus círculos. La propagación de desinformación podría significar que los miembros de la sociedad crean cosas que no son ciertas acerca de los candidatos políticos, los procedimientos electorales o las guerras.
Los ejemplos de GenAI que genera desinformación incluyen no sólo textos sino también deepfakes. Si bien estos últimos tienen posibles aplicaciones benévolas, como entretenimiento o en los efectos especiales, también pueden ser mal utilizados para crear videos sumamente realistas que difunden información falsa o eventos fabricados, que hacen que para los espectadores sea difícil discernir entre los contenidos reales y falsos, lo que podría a su vez conducir a la propagación de la desinformación y minar la confianza en los medios. En relación con esto se les podría usar en la manipulación política, en donde los videos de políticos o figuras públicas son alterados para hacer que parezcan decir o hacer cosas que podrían difamarles, dañar su reputación o influir en la opinión pública.
La GenAI hace que sea más eficiente generar y amplificar la desinformación, creada intencionalmente con miras a engañar a un lector, porque puede producir información imprecisa aparentemente original y creíble en gran cantidad. Ninguna de las historias o comentarios se repetiría necesariamente, lo que podría llevar a una narrativa al parecer aún más creíble. Las campañas de desinformación extranjeras a menudo han sido identificadas a partir de errores gramaticales o en las grafías, pero la capacidad de usar estas nuevas tecnologías de GenAI quiere decir la creación eficiente de un contenido que suena nativo y que puede engañar a los filtros usuales que una plataforma podría usar para identificar las campañas de desinformación de gran escala. La GenAI podría también hacer que proliferen los bots sociales que son indistinguibles de los humanos, y que pueden microfocalizarse en personas con desinformación personalizada.
Como las tecnologías de GenAI miran al público y son fáciles de usar, se las puede usar para manipular no sólo al público de masas, sino también a distintos niveles de las elites gubernamentales. Se espera que los líderes políticos se comprometan con las preocupaciones de sus electores, tal como queda reflejado en comunicaciones tales como mensajes electrónicos que revelan la opinión y el sentir públicos. ¿Pero qué pasaría si un actor malicioso usase ChatGPT u otro modelo de GenAI para crear grandes volúmenes de contenidos de apoyo y los distribuye entre los líderes políticos como si viniesen de ciudadanos? Esta sería una forma de astroturfing, una práctica engañosa que esconde la fuente de un contenido con miras a crear la percepción de un apoyo de base. Las investigaciones sugieren que los funcionarios electos en los Estados Unidos han sido susceptibles a estos ataques. Los líderes podrían muy bien permitir que este volumen de contenido influya en su agenda política, aprobando leyes o estableciendo burocracias en respuesta a esta aparente oleada de apoyo, que fue en realidad fabricada por la capacidad de generar grandes volúmenes de contenidos que parecen creíbles.
GenAI también despierta preocupaciones por discriminación y sesgos. Si los datos de entrenamiento usados para crear el modelo generativo contienen información sesgada o discriminatoria, el modelo a su vez producirá outputs sesgados u ofensivos. Esto podría perpetuar estereotipos nocivos y contribuir a violaciones de la privacidad de ciertos grupos. De entrenarse a un modelo de GenAI con un conjunto de datos que contiene patrones de lenguaje sesgados, podría producir textos que refuerzan los estereotipos de género. Podría, por ejemplo, asociar ciertas profesiones o roles con un género particular, incluso cuando no hay ninguna conexión inherente. Si un modelo de GenAI es entrenado con un conjunto de datos con una representación racial o étnicamente distorsionada, podría producir imágenes que involuntariamente muestren a ciertos grupos de modo negativo o estereotipado. De ser entrenados con conjuntos de datos sesgados o discriminatorios, estos modelos podrían asimismo producir contenidos que son culturalmente insensibles o que emplean términos peyorativos. La GenAI de texto a imagen desfigura los rasgos de una “mujer negra” en gran cantidad, lo que resulta dañino para los grupos así distorsionados. Esto se debe a la sobrerrepresentación de grupos no negros en los conjuntos de datos de entrenamiento. Una solución sería tener conjuntos de datos más balanceados y diversos en lugar de contar únicamente con datos de lenguaje occidentales y en inglés, que contendrían sesgos occidentales y crearían sesgos por carecer de otras perspectivas y lenguas. Otra sería entrenar al modelo para que los usuarios no puedan “abrirlo” para que vomite contenidos racistas o inapropiados.
Sin embargo, la cuestión del sesgo se extiende más allá de unos datos de entrenamiento que son abiertamente racistas o sexistas. Los modelos de IA extraen conclusiones a partir de puntos de datos, de modo tal que un modelo de IA podría examinar los datos de las contrataciones y ver que el grupo demográfico que más éxito ha tenido en ser contratado en una compañía tecnológica son varones blancos, y concluir así que éstos son los más calificados para trabajar en una compañía de estas, cuando en realidad la razón por la cual son más exitosos podría ser que no enfrentan las mismas barreras estructurales que afectan a otros grupos, como el no poder pagar un título tecnológico, tener que enfrentar el sexismo en los salones, o el racismo del departamento de contrataciones.
La GenAI hace que surjan varias preocupaciones en torno a la privacidad. Una de ellas es que los conjuntos de datos podrían contener información sensible o personal. Ésta podría quedar expuesta o ser mal empleada a menos que haya sido anonimizada o protegida debidamente. Como se espera que los outputs de GenAI sean realistas, los contenidos generados que semejan personas reales podrían usarse para volver a identificar a personas cuyos datos debían ser anonimizados, minando también así las protecciones de privacidad. Es más, durante el proceso de entrenamiento los modelos de GenAI podrían involuntariamente aprender y memorizar partes de sus datos de entrenamiento que incluyen información sensible o privada. Esto podría generar una filtración de datos cuando se generan nuevos contenidos. Los decisores de políticas y las mismas plataformas de GenAI aún no han resuelto el problema de cómo proteger la privacidad en los conjuntos de datos, outputs, o incluso de los mismos prompts, que pueden incluir datos sensibles o reflejar las intenciones de un usuario de modos que podrían resultar dañinos de no ser seguros.
Uno de los principales motivos de preocupación en torno a GenAI es quién posee el copyright de los trabajos que genera. Las leyes de copyright atribuyen la autoría y la propiedad a los creadores humanos. Sin embargo, determinar la autoría, el pilar fundamental del copyright, en el caso de los contenidos generados por IA resulta difícil. No queda claro si el creador debiera ser el programador, el usuario, el sistema de IA mismo, o una combinación de estas partes. Los sistemas de IA aprenden a partir de contenidos con copyright para generar nuevas obras que se parezcan a los materiales protegidos por los derechos de autor. Esto hace que surjan preguntas acerca de si el contenido generado por la IA debiera considerarse algo derivado, y que por ende infringe el derecho del tenedor del copyright original, o si el uso de GenAI debiera ser considerado un uso justo, que permite emplear de modo limitado materiales protegidos por los derechos de autor sin permiso de quien tiene el copyright. Como la tecnología aún es nueva, los marcos legales para juzgar su uso justo contra la violación de los derechos de autor siguen en evolución y podrían verse de distinto modo, dependiendo de la jurisdicción y de su cultura legal. Mientras este corpus legal se desarrolla, debiera equilibrarse la innovación con un justo trato a los creadores, los usuarios y los programadores de los sistemas de IA.
Entrenar a los modelos de GenAI, y el uso y transmisión de datos, utiliza recursos computacionales significativos, a menudo con hardware que consume energía y que puede contribuir a las emisiones de carbono si no funciona con fuentes renovables. Estos impactos pueden mitigarse en parte mediante el uso de energía renovable y optimizando los algoritmos para reducir la demanda de capacidad de procesamiento.
Aunque el acceso a las herramientas de GenAI está difundiéndose más, el surgimiento de esta tecnología corre el riesgo de ampliar la brecha tecnológica entre aquellos que tienen acceso a esta tecnología y quienes no lo tienen. Hay varias razones por las cuales el acceso desigual —y sus consecuencias— podría ser particularmente pertinente en el caso de GenAI:
- La capacidad de procesamiento requerida es enorme, lo que podría llevar al límite a la infraestructura de los países que tienen un inadecuado suministro energético, acceso a internet, almacenaje de datos o informática en la nube.
- Los países de ingresos bajos y medios (LMIC) pueden carecer del conjunto de alto talento técnico necesario para la innovación e implementación de la IA. Un informe sugiere que todo el continente africano tiene 700,000 programadores en comparación con California, que tiene 630,000. Este problema se ve exacerbado por el hecho que una vez calificados, los programadores de los LMIC a menudo parten a otros países en donde pueden ganar más.
- La corriente principal de modelos que miran al consumidor como ChatGPT fueron entrenados con un puñado de lenguajes, entre ellos inglés, español, alemán y chino, lo que quiere decir que las personas que buscan usar GenAI en estas lenguas tienen ventajas de acceso que no tienen los hablantes de suajili, por ejemplo, para no decir nada de los dialectos locales.
- Localizar a GenAI requiere grandes cantidades de datos del contexto particular, y los entornos con bajos recursos a menudo dependen de los modelos diseñados por las más grandes compañías tecnológicas de los Estados Unidos o China.
El resultado final podría ser el desempoderamiento de los grupos marginados, que tienen menos oportunidades y medios para compartir sus historias y perspectivas a través de contenidos generados por la IA. Como dichas tecnologías podrían mejorar las perspectivas económicas de una persona, el acceso desigual a GenAI podría a su vez incrementar la desigualdad económica, pues quienes tienen acceso pueden participar en expresión creativa, generación de contenidos e innovación empresarial de modo más eficiente.
Preguntas
Hágase las siguientes preguntas si está pensando llevar a cabo un proyecto y está considerando si usar GenAI en él:
-
¿Hay casos en que la interacción individual entre personas podría ser más eficaz, más empática e incluso más eficiente que si se usa la IA en las comunicaciones?
-
¿Qué preocupaciones éticas podría generar el uso de GenAI, ya sea de privacidad o por sesgos? ¿Pueden mitigarse?
-
¿Podrían emplearse las fuentes locales de datos y contenido para crear una GenAI localizada?
-
¿Hay medidas legales, reguladoras o de seguridad que le protegerán del mal uso de GenAI, y que protegerán a las poblaciones que podrían ser vulnerables a dicho mal uso?
-
¿Pueden la información sensible o de propiedad privada ser protegidas en el proceso de desarrollo de conjuntos de datos como datos de entrenamiento para los modelos de GenAI?
-
¿De qué modos puede la tecnología de GenAI cubrir la brecha digital e incrementar el acceso digital en una sociedad dependiente de la tecnología (o a medida que las sociedades se hacen más dependientes de ésta)? ¿Cómo podemos mitigar la tendencia de las nuevas tecnologías de GenAI a ampliar la brecha digital?
-
¿Hay formas de conocimientos digitales para los miembros de la sociedad, la sociedad civil o una clase política que puedan mitigar los riesgos de deepfakes o de textos de desinformación generados a gran escala?
-
¿Cómo podría mitigar los impactos medioambientales negativos asociados con el uso de GenAI?
-
¿Podría GenAI usarse para personalizar los enfoques educativos, el acceso al gobierno y la sociedad civil, y las oportunidades para la innovación y el progreso económico?
-
¿Los datos de su modelo fueron entrenados con datos precisos, representativos de todas las identidades, incluyendo grupos marginados? ¿Qué sesgos inherentes podría tener el conjunto de datos?
Estudios de caso
GenAI surgió en la primera mitad de 2023 de un modo mayormente difundido y orientado al consumidor, lo que limitó el número de estudios de casos del mundo real. Esta sección sobre dichos estudios incluye por ello casos en donde las formas de GenAI resultaron problemáticas en términos de engaños o desinformación; formas en que ella podría concebiblemente afectar a todos los sectores, la democracia inclusive, para incrementar las eficiencias y el acceso; y experiencias o discusiones de los tradeoffs entre privacidad e innovación específicos a enfoques nacionales.
Experiencias con la desinformación y la decepciónEn Gabón, un posible deepfake tuvo un papel significativo en la política del país. El presidente supuestamente tuvo un derrame pero no había sido visto en público. El gobierno finalmente emitió un video la víspera del año nuevo de 2018, que buscaba calmar las preocupaciones en torno a su salud, pero los críticos sugirieron que en las imágenes tenía patrones de pestañeo y expresiones faciales no auténticas, y que se trataba de un deepfake. Los rumores de que el video era falso proliferaron, lo que hizo que muchos concluyeran que el presidente no gozaba de buena salud, lo que a su vez llevó a un intento de golpe debido a la creencia en que la capacidad del presidente para resistir al intento de derrocamiento estaría debilitada. El ejemplo muestra las serias ramificaciones que la pérdida de confianza tiene en el entorno informativo.
En marzo de 2023, una imagen hecha con GenAI del papa con una chaqueta puffer de Balenciaga se hizo viral en internet, engañando a los lectores debido al parecido de la imagen con el pontífice. Balenciaga había tenido una violenta reacción varios meses antes debido a una campaña publicitaria que mostraba a niños con arneses y bondage. Que el papa al parecer vistiera con Balenciaga implicaba que él y la Iglesia Católica abrazaban dichas prácticas. El consenso en internet finalmente concluyó que se trataba de un deepfake, tras identificar señales reveladoras como una borrosa taza de café y los problemas de resolución con el párpado del papa. Ello no obstante, el incidente mostró con qué facilidad se pueden generar estas imágenes y engañar a los lectores. También mostró la forma en que las reputaciones pueden quedar manchadas debido a un deepfake.
En septiembre de 2023, la Microsoft Threat Initiative presentó un informe que señalaba numerosos casos de operaciones de influencia en línea. Microsoft identificó antes de las elecciones de 2022, que cuentas de medios sociales afiliadas al Partido Comunista de China (PCC) estaban haciéndose pasar por votantes estadounidenses y respondiendo a comentarios, para así influir en las opiniones a través del diálogo y la persuasión. En 2023, Microsoft observó entonces el uso de imágenes creadas con IA, que mostraban imágenes estadounidenses como la Estatua de la Libertad bajo una luz negativa. Estas imágenes tenían las huellas de la IA, como el número errado de dedos en una mano, mas a pesar de todo eran provocadoras y convincentes. A comienzos de marzo de 2023, Meta halló también al PCCh involucrado en una operación de influencia publicando comentarios críticos de la política exterior estadounidense, a los que Meta logró identificar debido a los tipos de grafías y de errores gramaticales en combinación con la hora del día (horas apropiadas para China antes que para los EE.UU.).
A medida que las herramientas de GenAI mejoran se irán haciendo aún más eficaces para estas campañas de influencia en línea. Por otro lado, las aplicaciones con resultados positivos también se irán haciendo más eficaces. GenAI, por ejemplo, irá cubriendo cada vez más las brechas en los recursos del gobierno. Un estimado de cuatro billones de personas carecen de los servicios básicos de salud, y una limitación significativa es el bajo número de proveedores del cuidado de salud. Si bien GenAI no es un sustituto del acceso directo a un proveedor individual del cuidado de salud, sí puede al menos llenar ciertas brechas en ciertos entornos. Ada Health un chatbot para el cuidado de la salud, funciona con OpenAI y puede comunicarse con las personas con respecto a sus síntomas. ChatGPT ha demostrado su capacidad para pasar los exámenes de calificación médica; si bien no se le debiera usar como un sustituto de un médico, en los entornos limitados en recursos podría al menos brindar una evaluación inicial, ahorrando así costos, tiempo y recursos. En relación con esto, es posible utilizar herramientas análogas en entornos de salud mental. El Foro Económico Mundial reportó en 2021 que un estimado de 100 millones de personas en África tienen depresión clínica, pero que sólo hay 1.4 proveedores de salud por cada 100,000 personas, en comparación con el promedio global de 9 proveedores/100,000 personas. La gente necesitada de cuidado y que no cuenta con mejores opciones confía cada vez más en chatbots de salud mental en tanto se logra implementar un enfoque más completo, porque si bien el nivel del cuidado que pueden brindar es limitado, es mejor que nada. Estos recursos basados en GenAI no están libres de problemas–posibles problemas de privacidad y respuestas subóptimas—, y las sociedades y personas tendrán que establecer si estas herramientas son mejores que las alternativas, pero pueden ser tenidos en cuenta en entornos de recursos limitados.
Otros escenarios futuros involucran el uso de GenAI para incrementar la eficiencia del gobierno en una serie de tareas. Uno de estos escenarios comprende a un burócrata del gobierno formado en economía, y al que se le asigna a trabajar en un programa básico de políticas relacionado con el medio ambiente. Esta persona inicia el programa pero entonces introduce la pregunta en una herramienta de GenAI, la cual ayuda a preparar un borrador de ideas, recuerda a nuestra persona puntos a los que había olvidado, identifica unos marcadores legales internacionales relevantes que son claves, y luego traduce el programa del inglés al francés. Otro escenario involucra a un ciudadano que intenta averiguar en dónde votar, pagar impuestos, aclarar los procedimientos gubernamentales, entender las políticas en el caso de ciudadanos que están intentando decidir entre candidatos, o explicar ciertos conceptos de políticas. Estos escenarios ya son posibles y accesibles a todo nivel dentro de la ciudad, y sólo irán haciéndose más prevalentes a medida que las personas se vayan familiarizando con la tecnología. Es, sin embargo, importante que los usuarios entiendan las limitaciones de la tecnología y cómo usarla de modo apropiado para prevenir situaciones en las cuales estén propagando desinformación, o no logren hallar información precisa.
En un contexto electoral, GenAI puede ayudar a evaluar aspectos de la democracia, como la integridad electoral. Por ejemplo, la tabulación manual de votos toma tiempo y es onerosa. Sin embargo, nuevas herramientas de IA han tenido un papel a la hora de establecer el grado de irregularidades electorales. En Kenia se usaron las redes neuronales para “leer” formularios de papel remitidos a nivel local y enumerar el grado de irregularidades electorales, para luego correlacionarlas con los resultados y juzgar si dichas irregularidades fueron el resultado del fraude o de errores humanos. Estas tecnologías podrían en realidad aliviar parte de la carga laboral de las instituciones electorales. En el futuro, los avances realizados por la GenAI podrán proporcionar una visualización de los datos que aliviará aún más la carga cognitiva de los esfuerzos realizados para adjudicar la integridad electoral.
Países como el Brasil han manifestado su preocupación con el posible mal uso dado a GenAI. Tras la presentación de ChatGPT en noviembre de 2022, el gobierno brasileño recibió un detallado informe escrito por expertos académicos y legales, así como por los jefes de compañías e integrantes de un comité nacional de protección de datos, quienes urgieron que dichas tecnologías fueran reguladas. El informe planteó tres motivos principales de preocupación:
- Que los derechos ciudadanos sean protegidos asegurando que “no haya discriminación y que se corrijan los sesgos directos, indirectos, ilegales o abusivos”, así como que haya claridad y transparencia con respecto a cuándo es que los ciudadanos están interactuando con la IA.
- Que el gobierno categorice los riesgos e informe a los ciudadanos de los posible riesgos. Según este análisis, los sectores de “alto riesgo” incluían a los servicios esenciales, la verificación biométrica y el reclutamiento laboral, en tanto que el “riesgo excesivo” comprendía la explotación de personas vulnerables y el puntaje social (un sistema que sigue el comportamiento individual en pos de su confiabilidad, y que pone en una lista negra a quienes tienen demasiados deméritos o su equivalente), prácticas ambas que debieran examinarse detenidamente.
- Que el gobierno dé medidas de gobernanza y sanciones administrativas, primero estableciendo cómo es que se penalizaría a las empresas que las infringieran, y en segundo lugar recomendando una pena del 2% de la renta para un incumplimiento menor, y el equivalente a 9 millones de USD para daños más serios.
En 2023, al momento de escribir estas líneas, el gobierno estaba debatiendo los siguientes pasos, pero el informe y las deliberaciones son ilustrativas de las preocupaciones y recomendaciones dadas en el Sur Global con respecto a GenAI.
En la India, el gobierno hizo frente a la IA en general, y a GenAI en particular, con una mirada menos escéptica que echa luz sobre las diferencias en cómo es que los gobiernos podrían abordar estas tecnologías, y las bases de dichas diferencias. En 2018, el gobierno indio propuso una Estrategia Nacional para la IA que priorizaba su desarrollo en la agricultura, la educación, el cuidado de la salud, las ciudades y la movilidad inteligentes. En 2020, la Estrategia Nacional de Inteligencia Artificial pidió que todos los sistemas fueran transparentes, responsables y que estuvieran libres de sesgos. En marzo de 2021, el gobierno indio anunció que usaría una regulación de “toque ligero” y que el riego más grande no venía de la IA, sino de no aprovechar las oportunidades que ella presenta. India cuenta con un sector de investigación y desarrollo tecnológicos avanzado que está listo para beneficiarse con la IA. Según el ministro de electrónica y tecnología de la información, promover este sector es “significativo y estratégico”, pero reconoció que se necesitarían algunas políticas y medidas de infraestructura que enfrentaran los sesgos, la discriminación y los problemas éticos.
Referencias
Find below the works cited in this resource.
- Borji, Ali, (2021). Pros and Cons of GAN Evaluation Measures: New Developments.
- Breland, Ali, (2019). The Bizarre and Terrifying Case of the “Deepfake” Video that Helped Bring an African Nation to the Brink, Mother Jones.
- Byman, Dan, et al., (2023). Deepfakes and International Conflict, Brookings Institution.
- Gondwe, Gregory, (2023). CHATGPT and the Global South: how are journalists in sub-Saharan Africa engaging with generative AI?
- Heikkila, Melissa, (2023). How OpenAI is trying to make ChatGPT safer and less biased, MIT Tech Review.
- Hutson, Matthew, (2023). Rules to keep AI in check: Nations carve different paths for tech regulation. Nature.
- Jungherr, Andreas, (2023) “Artificial Intelligence and Democracy: A Conceptual Framework,” Social Media and Society.
- Kreps, Sarah & Jakesch, Maurice, (2023). Can AI communication tools increase legislative responsiveness and trust in democratic institutions? Government Information Quarterly.
- Kreps, Sarah & Kriner, Doug, (2023). The potential impact of emerging technologies on democratic representation: Evidence from a field experiment. New Media and Society.
- Kshetri, Nir, (2023). ChatGPT in Developing Economies. IEEE Xplore.
- Microsoft, Seeing AI in New Languages.
- Phiri M, Munoriyarwa A., (2023). Health Chatbots in Africa: Scoping Review. J Med Internet Res.
- Porsdam Mann, Sebastian, et al., (2023). Generative Ai entails a credit-blame asymmetry. Nature Machine Intelligence.
- Trager, Robert F., et al., (2023). International Governance of Civilian AI: A Jurisdictional Certification Approach.
- Warner, Zach, et al., (2021). Hidden in plain sight? Irregularities on statutory forms and electoral fraud. Electoral Studies.
Recursos adicionales
- Andrej Karpathy, Introduction to Large Language Models.
- Arguedas, A. R., & Simon, F. M., (2023). Automating Democracy: Generative AI, Journalism, and the Future of Democracy. Balliol Interdisciplinary Institute, University of Oxford.
- Bhaskar, Chakravorti, (2023). The AI Regulation Paradox. Foreign Policy.
- Schneier, Bruce & Sanders, Nathan, (2023). Six Ways that AI Could Change Politics. MIT Tech Review.
- Hogg, Luke, (2023). Artificial Intelligence Could Democratize Government.Tech Policy Press.
- Muggah, Robert & Szabó, Ilona, (2023). Artificial Intelligence Will Entrench Global Inequality. Foreign Policy.
- Kreps, Sarah & Kriner, Doug, (2023). How Generative AI Affects Democratic Engagement. Brookings Institution.
- Nvidia, What is Generative AI?