Passa ai contenuti principali

Le CUDA-tele


Una rete neurale o, meglio, due, per generare figure astratte che ricordano pattern organici.
Questo esperimento, basato ancora una volta sulle Generative Adversarial Network (GAN), ricorda molto da vicino il modo in cui, nel 2018, fu creato per la priva volta artificialmente il ritratto di un uomo, il gentiluomo francese Edmond de Belamy. L'opera, conosciuta col nome di “Portrait of Edmond de Belamy”, fu venduta all'asta da Christie's per 432.500 $, inaugurando il dibattito, oggi ancora più acceso che mai, sulla presunta creatività dell'IA.

Il meccanismo adversarial
Il Generator crea immagini sempre più raffinate, il Discriminator impara a distinguerle da quelle reali. 
Il risultato di questa competizione tra le due reti neurali è un'immagine artificiale molto simile a quella reale ma completamente inventata.
A differenza del Belamy, che è stato addestrato su 15.000 ritratti classici realizzati tra il XIV e il XVIII secolo, questo nuovo esperimento utilizza il Describable Textures Dataset, puntando a generare pattern naturali e primordiali.

Arte non umana
Le opere che ho ottenuto non imitano stili rinascimentali, ma esplorano forme indefinibili: pattern che richiamano Tàpies o Richter, pur restando “non umani” nella loro coerenza strutturale. L'effetto di “quasi-riconoscimento” stimola lo spettatore a cercare familiarità con le texture note senza però trovarla.

Autenticità e CUDA-tela
Il ritratto di Edmond de Belamy è firmato dalla funzione di perdita utilizzata dal modello GAN, che, credo, non abbia potuto utilizzare i proventi derivati dall'asta di Christie's; la paternità d'opera delle immagini come quelle qui riportate, se consideriamo gli algoritmi e l'hardware i nuovi pennelli della creazione artistica, potrebbe essere attribuita (il condizionale è d'obbligo vista la complessità e la novità della materia) a tutti quelli che, come me, hanno messo a punto gli iper-parametri delle reti neurali e “sprecato” parte del loro tempo.

Oltre l'imitazione
Addestrata su texture anziché su opere umane, questa GAN crea un linguaggio visivo originale, libero dal peso della tradizione, che esplora configurazioni visive nuove.

Implicazioni culturali
Musei e collezionisti integrano sempre più l'arte generativa; il mercato degli NFT ha accelerato l'interesse riguardo alle generazioni artificiali, seppure con alti e bassi. L’NFT è un certificato digitale basato su tecnologia blockchain che attesta l'unicità e la proprietà di un'opera digitale. Possiamo pensare alla blockchain come a un libro mastro digitale, condiviso tra tante persone nel mondo, dove si scrivono in modo sicuro e permanente tutte le operazioni (come vendite, scambi, o firme digitali).

Verso una co-creazione
Ricercatori sviluppano sistemi multimodali e feedback in tempo reale per collaborazioni uomo-macchina.
Il futuro è la co-creazione: l'algoritmo esplora spazi vasti, l'artista dirige il tutto con giudizio estetico.

Un'estetica post‑umana
Sette anni dopo il Belamy, l'arte generativa non è più una sorpresa: ha un'estetica propria, fatta di equilibri tra ordine e casualità, elementi organici e artificiali.
Potremmo essere alla nascita di un'estetica post‑umana, una nuova frontiera da esplorare.
Il codice Python è stato progettato per generare arte astratta basata su texture provenienti principalmente da tre dataset e utilizza anche trasformazioni artistiche aggressive che alterano queste texture di base in modi significativi (maggiore saturazione, contrasto, rotazioni, prospettiva, ecc.).
1. DTD (Describable Textures Dataset): questo dataset contiene varie texture naturali categorizzate, come “marmo”, “intrecciato”, “screpolato”, “a bolle”, “a pois”, “a rete”, “venato”, ecc. Queste texture forniscono una base ricca per pattern astratti.
2. Oxford Flowers 102: questo contribuisce con texture organiche derivate da fiori, che includono pattern, petali, colori vivaci, e strutture organiche.
3. CIFAR100: questo aggiunge una varietà più ampia di texture provenienti da oggetti del mondo reale e scene naturali.

Alla fine dell'addestramento, la GAN è riuscita a generare, come previsto, immagini raffigurati una grande varietà di texture non presenti nei dataset di addestramento:

Texture organiche:
- Pattern fluidi simili a marmo o minerali con striature
- Formazioni cellulari che ricordano bolle o strutture biologiche
- Texture simili a corteccia, legno venato o materiali naturali
- Pattern floreali astratti
Texture geometriche:
- Griglie e motivi a reticolo con bordi sfumati
- Pattern intrecciati con variazioni di profondità
- Strutture cristalline con ripetizioni angolari
- Motivi a mosaico con transizioni graduali
Texture dinamiche:
- Vortici e spirali con variazioni di densità
- Onde e flussi che creano movimento visivo
- Esplosioni di colore con gradienti radiali
- Pattern nebulosi con aree di concentrazione variabile
Combinazioni emergenti:
- Ibridazioni tra forme organiche e geometriche
- Texture stratificate con effetti di profondità
- Contrasti tra aree altamente strutturate e zone più sfumate
- Giustapposizioni di micro e macro pattern

La diversità è ulteriormente ampliata dalle tecniche di interpolazione e variazione di temperatura applicate nello spazio latente, che producono una gamma più ampia di stili all'interno di questi pattern di base.

Paradigmi al confronto:

Aspetto

Belamy (2018)

GAN con Texture (2025)

Dataset

Ritratti classici

Texture naturali open-source

Risoluzione

~256×256 px

128×128 px, maggiore dettaglio

Training

2 settimane

~35 minuti ottimizzazioni Tensor Core

Estetica

Ritratto sfocato “old master”

Astrazioni organiche e geometriche dall'aspetto liquido

Accessibilità

Progetto proprietario

Codice open-source

Costo computazionale

Elevato allora

Ridotto grazie a TF32 e AMP

Post popolari in questo blog

Salmoni, scarpette, cetrioli e altro

Tutto il testo contenuto in questa pagina è stato pensato e scritto dall'autore del blog.   1. Come il salmone 2. Ooops! 3. Le scarpette hi-tech 4. Equivoci contemporanei 5. I saccenti 6. Medaglie di legno 7. La festività del Nulla 8. Gli aggiornamenti elettronici del Libro dell'Apocalisse 9. Dubbi ne ho 10. La maieutica del vulcaniano 11. Un piacevole vasetto di miele 12. Povere sfere 13. Caos comune mezzo gaudio 14. La fontana senza volti 15. Il piromane super beffardo 16. Boom di serpenti 17. Sistemi in via di degradazione 18. Il gatto nero 19. Alain Delon è ancora vivo? 20. Per sempre con i cani 21. Eventi imprevedibili 22. I robot sottomessi 23. Lady Gaga e Bruno Mars incantano 24. Definizioni mancate 25. Il mio nemico drone 26. Errore di valutazione 27. Ringraziamenti 28. Cari cetrioli, vi scrivo 29. Boom di detective 30. Gli UFO trascurati 31. Il grande salto delle rane 32. La malattia artificiale 33. Homo consumens 34. Lacune informatiche 35. Sei troppo! 36. ...

Welcome reader!

Siamo equi: ci sono sciocchezze che fanno meditare   (da Improvvisi per macchina da scrivere di Giorgio Manganelli)   Le repliche sismiche stabilizzano la faglia dopo una sua frattura; analogamente i pensieri d'assestamento riordinano la mente dopo un periodo turbolento o di trasformazione interiore. Nel blog, questi pensieri vengono organizzati, tra il serio e il faceto, in 60 mie riflessioni che mi sono servite a comprendere meglio e, a volte, a metabolizzare alcune esperienze cognitive, emotive e sociali. Riflessioni che, per varie ragioni, non hanno alimentato il confronto dialogico usuale, spesso condizionato dai frame che semplificano, spesso eccessivamente, i nostri ruoli “pubblici”, specie negli ambienti lavorativi. Per questo, “Pensieri d’assestamento” va inteso come la rottura di un frame atteso; come un comportamento fuori contesto che però non può essere rinegoziato, vista la natura asimmetrica della comunicazione; come un “angolo degli oratori”, in cui...

Interpretazioni

Esistono diversi modelli di intelligenza artificiale generativa, i cosiddetti LLM (Large Language Models), e ognuno di essi può valutare in modo diverso i testi “human written”, attribuendo un diverso valore semantico alle parole e alle frasi, come se per una stessa opera esistessero più piani di lettura. Tuttavia, se questa multidimensionalità esegetica non è stata concepita dall’autore, allora le diverse interpretazioni riflettono semplicemente la complessità delle reti neurali, complessità che appare molto simile, almeno nei risultati, alla sensibilità del lettore. Per sensibilità del lettore intendo la capacità di cogliere le sfumature, i dettagli stilistici, le connessioni logiche-argomentative di un testo, andando oltre la semplice comprensione letterale. Il bagaglio di esperienze, conoscenze e prospettive personali può influenzare profondamente la decodifica di un testo. Per questo motivo, una stessa opera può evocare emozioni, riflessioni e pensieri diversi a seconda delle p...