Pages

ImageNet Roulette, IA opinando sobre nuestro rostro


ImageNet es uno de los conjuntos de entrenamiento más importantes e históricamente significativos en inteligencia artificial. En palabras de sus creadores, la idea detrás de ImageNet era "trazar un mapa de todo el mundo de los objetos". Después de su lanzamiento inicial en 2009, ImageNet creció enormemente: el equipo de desarrollo raspó una colección de muchos millones de imágenes de Internet y se convirtió brevemente en el usuario académico más grande del mundo del Turco Mecánico de Amazon, utilizando un ejército de trabajadores poco sistemáticos para clasificar un promedio de 50 imágenes cada minuto en miles de categorías. Cuando se terminó, ImageNet consistía en más de 14 millones de imágenes etiquetadas organizadas en más de veinte mil categorías.

La estructura subyacente de ImageNet se basa en la estructura semántica de Wordnet, una base de datos de clasificaciones de palabras desarrollada en la Universidad de Princeton en la década de 1980.

El conjunto de datos de ImageNet se utiliza normalmente para el reconocimiento de objetos. Pero como parte de la investigación para el próximo proyecto "Excavando la IA" de Trevor Paglen y Kate Crawford, al equipo ineteresaba ver qué pasaría si capacitáramos a un modelo de IA exclusivamente en sus categorías de "Persona". ImageNet contiene 2833 subcategorías en la categoría "Persona". La subcategoría con las imágenes más asociadas es "gal" (con 1664 imágenes) seguida de "abuelo" (1662), "papá" (1643) y "director general" (1614). ImageNet clasifica a las personas en una amplia gama de tipos incluyendo raza, nacionalidad, profesión, estatus económico, comportamiento, carácter e incluso moralidad.

El resultado de ese experimento es ImageNet Roulette.

ImageNet Roulette utiliza un marco de aprendizaje profundo de Caffe de código abierto, entrenado en las imágenes y etiquetas en las categorías de "persona" (que actualmente están "listas para el mantenimiento"). Se eliminaron los nombres propios y las categorías con menos de 100 imágenes.

Cuando un usuario sube una imagen, la aplicación ejecuta primero un detector de caras para localizar cualquier cara. Si encuentra alguno, lo envía al modelo Caffe para su clasificación. La aplicación devuelve las imágenes originales con un cuadro delimitador que muestra la cara detectada y la etiqueta que el clasificador ha asignado a la imagen. Si no se detectan caras, la aplicación envía la escena completa al modelo Caffe y devuelve una imagen con una etiqueta en la esquina superior izquierda.

ImageNet contiene una serie de categorías problemáticas, ofensivas y extrañas, todas ellas extraídas de WordNet. Algunos utilizan terminología misógina o racista. Por lo tanto, los resultados de las devoluciones de la Ruleta de ImageNet también se basarán en esas categorías. Esto es por diseño: queremos arrojar luz sobre lo que sucede cuando los sistemas técnicos son entrenados en datos de entrenamiento problemáticos. Las clasificaciones de la IA de las personas rara vez se hacen visibles para las personas que están siendo clasificadas. ImageNet Roulette ofrece un vistazo a ese proceso - y para mostrar las formas en que las cosas pueden salir mal.

Enlace Web - Fuente

CompuTekni

¡Síguenos en: BuyMeaCoffeeTikTokFollow itMastodonSubstack y accede al mejor contenido tecnológico!

¡Apóyanos con un donativo PayPal ¡Gracias por tu contribución!

No hay comentarios.:

Publicar un comentario