¿Cómo identificar imágenes falsas en la era de la IA?: Guía para usuarios de redes sociales
La inteligencia artificial generativa avanza a pasos acelerados, la carrera por crear el producto que ofrezca los resultados de mayor calidad tiene a empresas invirtiendo, innovando y lanzando novedades casi cada semana. A su vez, avanzan las dudas sobre el impacto de esta tecnología y se disparan las imágenes alteradas digitalmente, las cuales ya llegaron a terrenos políticos.
Algunos casos recientes son observables en Estados Unidos a medida que se acentúa la época electoral. En medio del torbellino judicial que envolvió a Donald Trump durante sus primeros juicios como expresidente, las redes sociales se vieron inundadas de imágenes impactantes: Trump, vestido con un traje de prisionero, siendo arrestado en medio de una multitud. Las fotos parecían tan reales que muchos las creyeron al instante. Pero la sorpresa no terminaba ahí.
Poco después, el mismo Trump compartió orgullosamente una imagen falsa en la que fans de Taylor Swift, la estrella pop de alcance global, le ofrecían su supuesto respaldo para su campaña. La línea entre la realidad y la ficción es peligrosamente borrosa. Así, se dio inicio al primer periodo electoral estadounidense donde la inteligencia artificial generativa empezaba a mostrar su poder... y su peligro.
Donald Trump comparte imágenes manipuladas en las que se atribuye apoyo de Taylor Swift
Hoy en día, confiar en lo que vemos no es una opción, en una era donde las imágenes manipuladas por inteligencia artificial (IA) son tan comunes como los filtros en Instagram, distinguir una fotografía auténtica de una generada por algoritmos se ha vuelto un verdadero desafío. Entre “deepfakes”, avatares ultrarrealistas, Photoshop de calidad y “obras de arte” digitales que rivalizan con la pintura tradicional, la realidad está siendo desdibujada en pixeles. Así que, ¿cómo podemos saber si lo que estamos viendo es real o una ilusión creada por una máquina?
Identificando a la IA: ¿Humano o no?
Según define el New York Times en su glosario de términos “para entender a chatGPT”, la inteligencia artificial generativa es una tecnología que crea contenido, incluyendo texto, imágenes, video y código informático, identificando patrones en grandes cantidades de datos de entrenamiento, y luego generando material original con características similares. Ejemplos incluyen ChatGPT para texto y DALL-E y Midjourney para imágenes.
Estas herramientas permiten la generación de imágenes que son, con el paso del tiempo, cada vez más precisas para simular fotografías realistas. Juguemos un momento, ¿puede reconocer cuál de estas 3 fotos fue generada usando IA?
¿Ya lo descubrió?
Créditos al usuario @javilop en X, quién ha estado recopilando imágenes y noticias relacionadas a la IA. Él destacó estas 3 fotos, ya que, a pesar de la gran diferencia de calidad con imágenes de hace unos meses, las 3 fueron generadas por computadora. No hay ni un solo humano real en estas 3 fotos.
Varios usuarios mencionaron puntos que les guiaron en la respuesta, desde una dificultad de la IA para generar texto o logos en imágenes, sombras, detalles en los micrófonos, y arrugas que lucían sospechosas.
Sin embargo, si usted es de las personas que tuvo problemas reconociendo a ojo cuál imagen contenía un humano real, también existen aliados tecnológicos para esto. Los detectores de imágenes generadas con IA generalmente son herramientas que buscan patrones u anomalías que revelen el porcentaje de posibilidad de que la imagen sea falsa, el usuario simplemente sube la foto que desea consultar a las plataformas. Sin embargo, cabe decir que a medida que la tecnología avanza incluso estos detectores pueden ser engañados.
Detectores de Deepfake y de Inteligencia Artifiical generativa
- Fake Image Detector: Detecta porcentaje de posibilidad de ser generado con IA
- Hive Moderation: Herramienta de moderación de contenido que incluye la detección de imágenes generadas por IA, con análisis en tiempo real.
- AI or not: Detecta porcentaje de posibilidad de ser generado con IA
- Deepware: Detecta Deepfakes e imágenes manipuladas, usando inteligencia artificial para analizar fotos y videos en busca de alteraciones.
- Sensity AI: Ofrece soluciones para detectar imágenes y videos generados con IA, con un enfoque en la detección de deepfakes.
- Illuminarty: Especializada en la detección de arte generado por IA, comparando patrones en imágenes para determinar su origen.
Tenga en cuenta que algunas de estas páginas necesitan un registro de su correo electrónico o de una suscripción paga, aunque la mayoría ofrece la posibilidad de probar sus sistemas sin tener que hacer un pago o agregar una tarjeta.
Además, otra opción para detectar una posible imagen generada con IA tiene que ver con Google, ya que el buscador ofrece la posibilidad de revisar si dicha imagen ya fue posteada anteriormente y de rastrear hasta cierto punto, su origen.
Revise estos detalles para reconocer posibles imágenes con IA
Si bien ya no es tan fácil reconocer imágenes generadas con IA, como lo era hace apenas un tiempo en que los sistemas creaban humanos con caras extrañas, siete dedos por mano y dientes afilados como los de un animal, todavía hay algunos detalles en los que usted se puede fijar. Considere que estos detalles, serán corregidos en los próximos años o mejor dicho, meses.
Fíjese cuidadosamente en manos y rostros, generalmente la IA tiene problemas para hacer rostros consistentes, manos detalladas y detalles específicos. Revise las proporciones de la nariz o la frente, revise las pupilas y verifique un tono de piel uniforme.
Además, revise los detalles en la textura de la ropa, las arrugas naturales de la piel, así como los mechones de pelo, lea con cuidado los textos presentes en la imagen y los logos que puedan aparecer. Tenga en cuenta que muchas veces los colores de la ropa o de la “fotografía” no parecen naturales.
Poco a poco, los vídeos generados con IA se ven más y más realistas. ¿Puede usted todavía notar la diferencia? pic.twitter.com/MRGjxzWY8z
— Carlos Andrés Madrigal ▲ (@charliecamf4) August 20, 2024
¿Por qué hay tantas imágenes generadas digitalmente?
Hace unos años, se podían escuchar críticas a herramientas como Photosho o a los mismos filtros de Snapchat e Instagram, lo cierto es que las imágenes retocadas digitalmente están bastante lejos de ser consideradas una “novedad”, incluso existe gran cantidad de aplicaciones en las tiendas virtuales de aplicaciones móviles que prometen enseñarle versiones de usted mismo con muchas arrugas, como un bebé e inclusive darle opciones de maquillaje completo. Por no mencionar los filtros que ya traen por defecto los editores de imagen de los celulares o los filtros en vídeos cortos en plataformas como Tik Tok.
Buscar realidad en entornos digitales no es una tarea sencilla y la desinformación que este hecho trae se acaba de agravar con la adición a este repertorio de fotos infinitas generadas por nuevas tecnologías, cuya gran diferencia con herramientas de edición de foto es que no requieren grandes conocimientos técnicos para realizar alguna creación, algunas de estas Inteligencias artificiales ya están integradas a redes sociales, como en el caso de X (Antes Twitter) con su “Grok”.
Inteligencia artificial y redes sociales: El ascenso de los influencers digitales
Para enfrentar esta realidad, no basta con cruzar los dedos y esperar que la imagen sea auténtica. Existen métodos y herramientas para detectar si una imagen ha sido manipulada por IA, como ya se ha comentado. Desde el análisis de patrones de píxeles hasta el uso de software especializado que detecta anomalías, hay maneras de protegerse de caer en alguna que otra información falsa. Sin embargo, esto nos obliga a estar siempre en guardia, cuestionando incluso las fotos de nuestros amigos en redes sociales. ¿Será esa sonrisa natural o el resultado de un filtro de belleza con esteroides?
La abundancia de este tipo de imágenes nos lleva a entender de formas alternativas los espacios digitales y pone en discusión la cada vez más urgente, educación digital para desarrollar una mirada crítica que vaya más allá de la superficie.
¿Cómo se crean este tipo de imágenes?
1.Para empezar, seleccione una de las múltiples herramientas existentes de generación de fotos, algunas de las más populares son: Dall-E, Midjourney y fal.ai. Aunque también puede buscar otras opciones en línea, tenga en cuenta que no todas tienen la misma calidad de generación, además de que algunos de estos sistemas también necesitan el pago de una suscripción para generar varias imágenes.
2.Una vez escogida la plataforma, puede optar por registrarse y pagar la suscripción o revisar si se le permite utilizar la herramienta de forma gratuita para generar una imagen de prueba.
3. Escriba su prompt. Entiéndase como la orden detallada que se le dará a la IA. Es un texto que usted escribe en el sistema para convertir sus ideas en imágenes. Entre más claro, preciso y específico sea, mejor. Un prompt de calidad ayuda a generar resultados de calidad o como Miguel Fuentes, especialista en UX (experiencia de usuario) lo definió en el artículo de opinión “Inteligencia artificial y cómo hablarle en tico” publicado en La Nación, “Los prompts son esa charla previa, el contexto que convierte una descripción común en una narrativa viva y llena de matices.”
Ejemplo de prompt: “Crea una imagen de una presentadora de noticias profesional de pie en un estudio moderno y bien iluminado, con una gran pantalla detrás de ella que muestra un gráfico de noticias. La presentadora es una mujer de unos 30 años, con cabello castaño lacio de longitud media, peinado de manera ordenada. Tiene una sonrisa cálida, tono de piel claro y está vestida con un elegante blazer azul marino entallado sobre una blusa blanca. El blazer tiene un sutil patrón de rayas y lo combina con pantalones de vestir negros. Su maquillaje es natural, con labial rosa claro y un maquillaje de ojos mínimo. Sostiene una tableta delgada en una mano y mira a la cámara con confianza. El fondo del estudio presenta tonos suaves de azul y gris con un mapa mundial visible de manera sutil en la pantalla.”
4. Detallamos la cantidad de imágenes a generar y escogemos la que mejor nos parezca. Este fue el resultado de utilizar la web fal.ai seleccionando la opción de “Flux Realism Lora”:
5. En algunos casos algunos usuarios empezaron a crear llamativos vídeos a partir de sus imágenes generadas, el proceso es muy similar al descrito anteriormente.
Superando la teoría del Valle Inquietante: El veloz avance acelerado de la IA
El 5 de enero de 2021 Open AI, (empresa creadora de ChatGPT) anunció el lanzamiento de DALL-E. En ese entonces describieron su herramienta así:
“DALL·E es una versión de 12 mil millones de parámetros de GPT-3, entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares de texto e imagen. Hemos descubierto que tiene un conjunto diverso de capacidades, que incluyen la creación de versiones antropomorfizadas de animales y objetos, la combinación de conceptos no relacionados de maneras plausibles, la representación de texto y la aplicación de transformaciones a imágenes existentes.” (Taducido de la página oficial de Open AI)
En ese entonces, algunas de las imágenes generadas daban una sensación de incomodidad, según National Geographic, en su artículo “Uncanny Valley: qué es la teoría del Valle Inquietante y cómo explica nuestro miedo a los robots” (2023). El avance de la tecnología, sobre todo aquella que replica características humanas, puede generar una sensación poco agradable en el cerebro al ver mezclados elementos poco realistas pero muy reconocibles de los humanos en una imagen o en un robot.
“La teoría del Valle Inquietante se acuñó a Masahiro Mori, un experto en robótica de origen japonés. En un ensayo, el especialista en dicha materia explicaba que los robots son agradables cuando se dotan de cualidades similares a las de los humanos, sin embargo, al alcanzar un gran parecido a nosotros, emerge un miedo natural a ellos”. Describe el artículo.
Para superar este “Valle Inquietante o Uncanny Valley en inglés” estas características falsas debían desaparecer o, en otro caso, no ser perceptible al ojo humano.
El desarrollo veloz de generación de texto, audio, video y fotos busca superar este reconocimiento robótico y confundirse en el ambiente para no generar esta incomodidad o sensación de falsedad. Entre más realistas y capaces sean estos modelos para desarrollar todo tipo de ideas que van desde foto realismo hasta imágenes con la animación del estilo de compañías como Pixar, más será reconocida su calidad. Sin embargo, ¿Cómo esto le afecta a usted como usuario de redes sociales?
Lo que está en juego aquí no es solo la autenticidad de una imagen, sino la confianza en lo que se percibe. Si todo lo que se ve puede ser fabricado con un clic, ¿dónde queda la capacidad de discernir lo real de lo falso? Esta situación plantea una serie de preguntas filosóficas y éticas. ¿Esta dispuesto a renunciar a su percepción de la realidad en nombre del progreso? ¿O debería adaptarse, desarrollando nuevas habilidades y herramientas para navegar en este mar de engaños visuales?
La habilidad de diferenciar entre una imagen real y una creada por IA no es solo técnica, sino también una cuestión de supervivencia en la era digital.