Passa ai contenuti principali

Post

Fine-tuning locale di un modello linguistico

Fine-tuning locale di un modello linguistico: successi, limiti e lezioni apprese Ho fatto un nuovo fine-tuning su un piccolo modello linguistico locale. Non volevo limitarmi a dire: “ho addestrato un modello”. Volevo capire una cosa più importante: il nuovo addestramento migliora davvero le risposte? Per verificarlo ho costruito una pipeline completa. Prima ho preparato una serie di prompt di test. Poi ho interrogato il modello base e ho salvato le sue risposte in un file. Successivamente ho costruito un dataset in formato JSONL, con coppie istruzione-risposta, e ho eseguito un fine-tuning leggero tramite adapter. La tecnica usata è stata quella del fine-tuning parametrico efficiente , cioè un adattamento che non modifica tutto il modello, ma addestra solo piccoli componenti aggiuntivi. In pratica, il modello di partenza resta quasi invariato, mentre viene creato un piccolo adapter specializzato. Questo rende l’esperimento molto più leggero, adatto anche a un laptop di fasc...
Post recenti

Il sogno dell'automazione

Il fermento attorno all'Intelligenza Artificiale ha alimentato un mito pericoloso: l'idea che basti premere un bottone per ottenere sistemi complessi, sicuri e personalizzati. Nel mondo delle soluzioni locali e protette — come le architetture RAG (Retrieval-Augmented Generation) — questa è un'illusione. La verità è che l'indipendenza digitale non si compra un tanto al chilo e non tollera la pigrizia intellettuale. Sviluppare una pipeline che colleghi la conoscenza privata al web in totale sicurezza richiede competenza, adattamento e, soprattutto, la volontà di studiare. Chi cerca la soluzione pronta senza sforzo è destinato a fallire al primo aggiornamento software. Costruire un assistente che elabori dati offline non significa installare un'applicazione commerciale. Significa far dialogare componenti radicalmente diversi: file system, interpreti di codice, chiamate API locali e driver hardware. Ogni passaggio di questa catena rappresenta un potenziale p...

Quando la forma diventa pensiero

Questa produzione nasce dalla collaborazione tra la mia mente creativa e l’intelligenza artificiale: un dialogo in cui l’idea artistica, la direzione estetica e la visione compositiva sono state guidate dall’intuizione umana, mentre l’IA ha contribuito a trasformare quella visione in una struttura digitale complessa. Il risultato si avvicina all’architettura parametrica contemporanea.  Tubi metallici, archi, ramificazioni, nodi e attraversamenti costruiscono una composizione asimmetrica ma bilanciata, quasi un monumento urbano sospeso tra ingegneria poetica e installazione artistica. Per realizzarla non mi sono fermato a un semplice utilizzo creativo dell’IA: mi sono spinto fino alla creazione di un vero server MCP personalizzato , capace di collegare il processo generativo a Blender e trasformare l’intenzione artistica in una scena tridimensionale concreta. Non è una modellazione tradizionale, né un risultato casuale. È una forma nata da una regia creativa aumentata: l...

Un quasi-MCP artigianale

È nato da un piccolo esperimento di automazione locale: usare Codex Desktop non solo per scrivere codice, ma per entrare in un ciclo operativo con Blender, fino a ottenere un risultato visivo valutabile e migliorabile. L’idea di partenza era semplice: Codex può preparare uno script per Blender, ma il problema è che, senza feedback, lavora quasi alla cieca. Scrive codice, ma non vede davvero cosa succede nella scena. Allora ho costruito una piccola pipeline automatica. Il ciclo funziona così: Codex modifica lo script  ↓  PowerShell intercetta il salvataggio ↓  Blender si avvia in background  ↓  Blender esegue lo script  ↓  viene salvata la scena modificata  ↓  viene generato un render PNG  ↓  Codex usa immagine e log come feedback  ↓  Codex corregge di nuovo lo script  In pratica ho creato una sorta di ciclo chiuso creativo. Non è un MCP standard, perché non c’è un server MCP vero e proprio con tool esposti...

La dama testarda

Ho appena finito un lungo "carteggio" pomeridiano con un modello agentico per mettere a punto un gioco di dama italiana con interfaccia grafica e avversario controllato dall’IA.  All’apparenza sembrava tutto semplice: una scacchiera, pedine bianche e nere, mosse obbligatorie, un algoritmo minimax per far ragionare il computer. Poi, giocandoci davvero, sono emersi i primi problemi. Il primo sintomo era chiaro: alcune mosse dell’IA sembravano palesemente sbagliate. Non era una questione di “IA debole”, ma di regole. Il motore permetteva comportamenti non coerenti con la dama italiana, come prese non valide o priorità sbagliate nelle catture multiple.  Ho chiesto esplicitamente nel prompt dell'app Windows di verificare di nuovo le regole implementate a primo acchito: presa obbligatoria, maggior numero di pezzi catturati, priorità al pezzo più forte, valore dei pezzi catturati e ordine in cui vengono incontrati. Una volta corretto il motore, però, è arrivato un secondo proble...

Dal prompt alla produzione

C'è un momento preciso in cui ho capito che qualcosa era davvero cambiato nel modo di usare l'IA. Non è stato leggendo un articolo né guardando un video tutorial. È successo quando ho scritto una semplice frase in chat e, pochi minuti dopo, mi sono ritrovato sul desktop un documento completo con le notizie più rilevanti del settore, una notifica sul telefono e, soprattutto, tutto il lavoro già fatto senza alcun intervento manuale. Non parlo di automazione in senso stretto, fatta di flussi rigidi, trigger e connettori da configurare uno a uno. Parlo di qualcosa di diverso: un sistema multi-agente IA a cui descrivi un obiettivo in linguaggio naturale e che decide autonomamente come raggiungerlo. Naviga sul web, scrive il codice necessario, lo esegue, produce un output e ti avvisa quando il lavoro è terminato. La parte più interessante, però, è il modo in cui ho strutturato la ricerca delle informazioni. Invece di affidarmi a un singolo agente che fa tutto, ho implemen...

Apprendimento sincronico multirappresentazionale

Per decenni la didattica delle telecomunicazioni ha affrontato un limite cognitivo quasi invisibile: l’idea che uno studente possa comprendere sistemi altamente multidominio semplicemente osservandone separatamente le rappresentazioni simboliche.  La modulazione 16-QAM ne è un esempio emblematico.  Nei percorsi tradizionali, il discente incontra formule trigonometriche, diagrammi di costellazione, componenti in quadratura, sequenze binarie e grafici temporali come oggetti distinti, distribuiti in tempi e contesti differenti.  Questa frammentazione produce spesso un apprendimento puramente dichiarativo, incapace di trasformarsi in rappresentazione mentale dinamica.  Lo studente memorizza la definizione della QAM ma non “vede” il fenomeno emergere cognitivamente. L'animazione sviluppata per la 16-QAM suggerisce invece un paradigma differente, che potrebbe essere descritto come apprendimento sincronico multirappresentazionale. In questo modello, la comprensi...