domingo, 4 de mayo de 2025 (Ayer)

Hace ya mucho (en terminos de avances en IA, 1 año o así) recuerdo que iba en el coche conduciendo, quería poner una canción en SPOTIFY pero no recordaba ni el nombre del grupo ni de la canción, ni la letra, así es que cogí el CHATGPT y le expliqué (voz) algo como: «Recuerdame como se llama el grupo ese musical de algo de Siberia o Rusia, que tienen una canción sobre el coche fantástico que cantan dos!«.
El telefono sin dudarlo ni un poco siquiera me respondió «Ah! si, te refieres Estepa Rusa, que tienen una canción homenaje a la serie de televisíon llamada «El coche fantástico» y que ha tenido mucho éxito, etc, etc, etc … .«. La verdad es que la explicación cuadraba bastante con lo poco que recordaba ( muy larga y argumentada ) me la creí enteritica sin pestañear. Y ahí quedó todo.
Mas tarde, ya en casa, me puse a buscarlos con los datos que me había dado la IA y ni rastro, no encontraba absolutamente nada. Ni grupo, ni titulo, ni tema, ni historia ni nada de nada. Me puse a buscar por Youtube hasta que los encontré: Ladilla Rusa, tema: KITT y los coches del pasado.
El muy cabrón se lo había inventado absolutamente todo, el nombre del grupo, el titulo del tema, la letra, el origen del grupo, de la letra, su fama, su repercusión social, su éxito comercial… todo!!

Así descubrí por primera vez lo que era una alucinación de la IA, basicamente, que la máquina se inventa todos los datos y todo lo que dice, pero claro, con coherencia, sin dudas, con argumentos… todo perfectamente creible y todo falso.
Creo que el problema subyace en que una IA es rarísimo (diría que imposible) que te diga «No sé«, siempre va a decirte que sí, que es posible. Esta tarde lo ha vuelto a hacer.
Le he dicho que buscase en el código (varios miles de líneas) donde estaba haciendo mal un cálculo que producía decimales y no debía, y estas son las respuestas:

Obviamente se ha vuelto a equivocar:

Volvía a inventar …

… y ha seguido probando e inventando 2 o 3 veces más hasta que me he cansado y lo he solucionado al viejo estilo CTRL+F.
Pero claro, te deja pensando ¿cuantas veces me habrá colado algo por no tener ni puñetera idea?. Sí, en un código informático, en una función es más complicado colarla, si te lo inventas lo normal es que no funcione, o haga otra cosa y listo, pero y en otros temas…

Había un chistecillo celebre entre abogados yanquis y que viene muy bien para estas situaciones: Nunca preguntes algo de lo que NO sepas la repuesta!! Amén!

viernes, 2 de mayo de 2025 (Antes de antes de ayer)

El otro día os presentaba el sistema de clasificación de vídeos con IA el cual, entre otras cosas, terminaba metiendo la información de los vídeos clasificados en una base de datos Mongodb en local.

Elegí MONGO por ligereza, velocidad y por el propio contexto de uso, desde luego no por la simpatía que le tengo a las queries de JSON que con un par de condiciones que se le pongan tiende a galimatias-insufrible
db.getCollection("identificados").find({ "filename": /_03/, "especies.Buho real": { $exists: true }, saturacion: { $lt: 15 } }, { _id: 0, ruta_completa: { $concat: ["$path", "/", "$filename"] } }).forEach(doc => print("'" + doc.ruta_completa + "'"))
Claro que en este contexto y habiendo llegado a dejar que la IA identifique la fauna y clasifique los vídeos ¿porqué no dejar que la misma IA siga trabajando y se encargue de hacer las búsquedas en MONGO y que sea ella la que se pelee con cadenas interminables de comas, comillas, puntos, llaves abiertas, paréntesis, barras de escape…

¿No sería ideal? Ya tenemos los vídeos clasificados en una base de datos MONGO, con sus rutas, las especies clasificadas y principales caracteristicas técnicas. Ahora solo necesitamos que una IA con acceso a dichos datos pueda atender instrucciones sencillas tipo «Pasame los 2 últimos vídeos que grabé de un Zorro durante el día» y acto seguido obtener una lista archivos.

local vs online, LMSTUDIO/OLLAMA vs GEMINIS

Claro, si se trata de acceder a nuestros datos locales, en nuestro ordenador, cabría pensar que ejecutar una IA local tendría algún tipo ventaja en el acceso a datos locales, archivos, vídeos, bases de datos… pero no, al menos por el momento (no creo que esto tarde mucho en llegar) ejecutar una IA en local tiene unos pocas ventajas, principalmente velocidad (que no potencia), versatilidad a la hora de hacer integraciones con otras aplicaciones y servicios, equipos OFFLINE, poco más.

Sigue leyendo…

domingo, 13 de abril de 2025 (Hace más de 2 semanas)
Ya va tomando forma final mi sistema de identificación y clasificación de vídeos de fauna mediante inteligencia artificial. Entrando en fase de producción.
Un par de años llevo con esto, que se dice rápido. Partiendo de las más absoluta ignorancia en IA (bendito ChatGPT), pero con una idea en la cabeza, imagina: poder poner las cámaras de fototrampeo/webcams en la finca y que te avisen en tiempo real sobre qué – quien – cuando – donde está pasado un animal, persona, pájaro, perro… Imagina, estar en tu casa viendo la tele y que te llegue un whatsapp que diga: «Tio!! la gineta está en el bebedero!! Corre p’allá!!«
Pues aunque parezca increible (sobre todo para mi mismo) estoy ya en condiciones de poder montarlo!! Os presento el sistema (tengo que buscarle un nombre digno) y os cuento como funciona. Trataré de ser conciso y poco técnico.


Pruebas iniciales


Obviamente de primeras di muchas vueltas y probé muchos sistemas de IA (basicamente librerias de PYTHON desarrolladas sobre tensorflow, Google 2015) para la clasificación de imágenes y redes neuronales. El «metodo» es basicamente el mismo en todos los casos: se le pasa a un software miles y miles de fotos acompañadas de un txt que les diga qué está viendo en cada caso y se les deja que las analizen (entrenamiento) durante un tiempo que tiende a ser largísimo o muy largísimo (se requieren equipos potentes).
Tras mucho tiempo de trabajo pude conseguir alguna cosa interesante pero el problema era siempre el mismo : muchisímos falsos positivos. Demasiados. Tantos que hacían inutil cualquier positivo auténtico. Si pones un sistema a monitorizar un streaming de vídeo y le dices «avisame cuando aparezca un perro«, peor que no te avise cuando pasa el perro es que si lo haga cuando no pasa.
El problema es que la inmensa mayoría de los proyectos de reconocimiento de objetos en imágenes están pensados y desarrollados para ejecutarse en situaciones muy acotadas, bien controladas y con poca variación: un sistema de clasificación visual de objetos que pasar por el escaner de un aeropuerto, el reconocimiento de texto escrito sobre un folio blanco, matrículas de coches en carretera, etc… situaciones con variación restringuida. Pero para mi proposito lo que necesitaba era un sistema capaz de «ver» un conejo que apenas ocupa el 5% de la superficie de la foto de 640 pixels, en un paisaje de piedras, vegetación, sombras, hierbas y viento, grabado por una cámara/webcam de 30€, sin enfoque automático, sin corrección de exposicion, abandonada en mitad del campo, que se moja por las noches o llena de polvo, grabando en unas condiciones pésimas de luz la mayor parte de las veces y que todavía empeora más cuando entra en modo nocturno, en blanco y negro, reduce la resolución y sobreexpone todo lo que haya en el centro.

Sigue leyendo…

domingo, 23 de marzo de 2025 (Hace más de 1 mes)

En la finca tenemos unas 30 higueras, de todos los tamaños. En cierta ocasión se me ocurrió fotografiarlas todas para, con el paso de los años, ver como van creciendo.
Mientras estaba haciendo las fotos me di cuenta de un detalle. Si tenéis buen ojo naturalista lo veréis en las fotos.

Algunas higuerasAlgunas higueras

Casi la mitad de la higueras tenían palmitos (Chamaerops humilis) creciendo debajo.
El naturalista aficionado dirá «claro, debajo hace fresquito, humedad y está protegida del sol«. El naturalista experto te dirá: «claro, las higueras y los palmitos fructifican ambas en otoño y por el sureste son fuente de alimento habitual de zorros y tejones. Cuando estos visitan las higueras al final del verano suelen llevar el estomago lleno de «regalitos» de visitas anteriores. Las semillas de higuera se pueden destruir fácilmente con la masticación, pero las semillas de palmito soportan (e incluso requieren) la masticación y la digestión.» Sigue leyendo…

miércoles, 13 de noviembre de 2024
Upscayl es una aplicación multiplataforma (Windows, Linux, Mac) con uso de IA para ampliación de imágenes, gratuita y sin publicidad. Con ayuda de la IA la aplicación reconoce patrones comunes (pelo, texturas, piel, ojos) y es capaz de eliminar el ruido de una imagen respetando absolutamente la imagen original. Estas aplicaciones son ideales para ampliar imágenes pequeñas al doble o triple sin que prácticamente se note la ampliación. Hablando en propiedad estas herramientas no «agreguen» detalles (que no existen) sino que evitan que desaparezcan o se dañen los que ya hay como efecto de la ampliación.
En imágenes ya de por sí grandes (4000 o 6000 pixels) y que lo normal es que no ampliemos mucho más tienen un ventaja extra si las usamos para limpiar la imagen de ruido sin destruir el detalles originales en la imagen.
Para esto bastante con ejecutar el programa dejando el zoom de ampliación al 100%, eligiendo el motor «GENERAL PHOTO (REAL-ERSGAN). Dependiendo del equipo que tengás y del tamaño de la imagen el cálculo puede tardar incluso algún minuto o dos.

En el video se muestra el efecto de aplicar el cálculo Real-Ersgan sobre un JPG 98% de 6016×4016 pixels.

Poned el vídeo a pantalla completa y máxima resolución (1080px)

Si queréis probarlo, como digo es gratuito, sin restricciones ni publicidad. La versión de Linux que he probado no es necesario siquiera instalarla, es simplemente una appimage, se descarga, se ejecuta y a funcionar (creo que en Windows y MAC es igual).
Descargar UPSCAYL-2.11 Oficial

sábado, 9 de noviembre de 2024

Esta foto no es mía y se la he dejado ver a una IA (Claude) para que la analize y determine si es fotografía real o imagen generada por IA.

Este es el análisis de Claude:
Después de analizar la imagen, considero que es una FOTOGRAFÍA REAL. Aquí están los elementos que me llevan a esta conclusión:
Detalles naturales en el pelaje:
Los bigotes del gato muestran variaciones naturales en grosor y dirección
El pelaje tiene una textura realista con transiciones graduales
Las marcas del patrón tabby son asimétricas y naturales
Ojos:
Los reflejos en los ojos son coherentes con la luz de la luna
La pupila tiene una forma y dilatación natural para una foto nocturna
La textura del iris es detallada y no muestra patrones repetitivos
Elementos del entorno:
La vegetación en primer plano tiene una profundidad y desenfoque natural
Las ramas secas muestran irregularidades realistas
Las sombras y la iluminación son consistentes con una toma nocturna
Calidad fotográfica:
La firma del fotógrafo (@cecilialcamesa) sugiere que es una foto artística
El contraste blanco y negro está bien ejecutado con una gama tonal natural
La luna tiene un halo natural debido a la exposición prolongada
Lo que más me convenció es la naturalidad de los pequeños detalles: la forma en que la luz interactúa con los bigotes, las imperfecciones naturales en la vegetación, y especialmente la expresión del gato que, aunque parece casi «sonriente», muestra una tensión muscular facial que es típica en los gatos cuando están alertas o cazando.

¿Estás de acuerdo con el análisis de la IA?
Ojo que hay un detalle, muy gordo, que delata la imagen en una décima de segundo y determina si ¿es foto real o imagen de IA?

Cuaderno de campo es un blog desarrollado y mantenido por Trebol-a y en el que escriben Trebol-a, Miguel, Merche y Mónica
Si quieres saber algo más sobre los autores acude a la página acerca-de, si quieres contactar con alguno de nosotros hazlo a través de contactar ó de Google+

Creative Commons: Todo el contenido de la web (imágenes, textos, vídeos, a excepción de aquellas obras de otros autores enlazados por Cuaderno de Campo) se acoge a los términos expresados en la licencia Creative Commons