Passa ai contenuti principali

La rete neurale ha la febbre



Immaginiamo una rete neurale che impara a rispondere alle domande leggendo dei testi, proprio come fa uno studente che studia a casa per poi rispondere all’interrogazione. 
Il cuore del sistema è, come nel penultimo post, un transformer.
Per addestrarlo ho utilizzato un dataset basato su una raccolta di articoli Wikipedia.
Il processo di addestramento simula l'insegnante che corregge le cose dette dallo studente: legge domanda e contesto, genera una risposta, effettua delle verifiche e aggiusta i pesi della rete neurale. 
Questo è reso possibile dalla seguente ripartizione dei dati: il 90% per il training e il 10% per la validazione.
Il test che ho preparato è parametrico rispetto alla temperatura di generazione delle risposte, come mostrato dall'output copiato direttamente dalla console:
Question: Explain why Rome is considered the capital of Italy and its historical significance.

Temperature 0.7: pivotal throughout history

Temperature 1.0: pivotal throughout history.

Temperature 2.0: it would provide great views

Question: Detail the events of 1969 that were significant for space exploration, particularly focusing on the Apollo 11 mission.

Temperature 0.7: the landing of Apollo 11 on the Moon

Temperature 1.0: landing of Apollo 11 on the Moon

Temperature 2.0: highlights of 1969 as one particular event of humanity's lifecycle.

Questi risultati mostrano come:

- Temperature basse (0.7) producono risposte conservative e coerenti

- Temperature medie (1.0) bilanciano coerenza e varietà

- Temperature alte (2.0) generano risposte creative ma meno affidabili

Se la temperatura sale il sistema tende a essere più creativo ma anche a farneticare.
Poiché le risposte sono concise, potrebbe essere utile un ulteriore fine-tuning. 
La scelta della temperatura dipende dall'uso: bassa per applicazioni che richiedono precisione (supporto medico o legale), alta per usi creativi (brainstorming).​​​​​​​​​​​​​​​​
Conclusioni: con questo esperimento siamo saliti molto di livello nel mastering sulla progettazione di reti neurali che, una volta specializzate con un dataset di ambito, possano essere davvero utili nelle professioni.

Fine-tuning: ulteriore addestramento, su un insieme di dati specifico per un dato compito, di un modello IA pre-addestrato.
Ad esempio, una rete neurale addestrata su un vasto dataset (come ImageNet) può essere messa a punto per riconoscere le immagini in cui sono presenti solo determinati particolari che sfuggono all'ispezione visiva. Spesso consiste nell'aggiornamento dei pesi degli ultimi layer.
Mi fa pensare a uno studente che si specializza in un determinato campo dopo aver maturato le abilità e competenze di base.



Post popolari in questo blog

Salmoni, scarpette, cetrioli e altro

Tutto il testo contenuto in questa pagina è stato pensato e scritto dall'autore del blog.   1. Come il salmone 2. Ooops! 3. Le scarpette hi-tech 4. Equivoci contemporanei 5. I saccenti 6. Medaglie di legno 7. La festività del Nulla 8. Gli aggiornamenti elettronici del Libro dell'Apocalisse 9. Dubbi ne ho 10. La maieutica del vulcaniano 11. Un piacevole vasetto di miele 12. Povere sfere 13. Caos comune mezzo gaudio 14. La fontana senza volti 15. Il piromane super beffardo 16. Boom di serpenti 17. Sistemi in via di degradazione 18. Il gatto nero 19. Alain Delon è ancora vivo? 20. Per sempre con i cani 21. Eventi imprevedibili 22. I robot sottomessi 23. Lady Gaga e Bruno Mars incantano 24. Definizioni mancate 25. Il mio nemico drone 26. Errore di valutazione 27. Ringraziamenti 28. Cari cetrioli, vi scrivo 29. Boom di detective 30. Gli UFO trascurati 31. Il grande salto delle rane 32. La malattia artificiale 33. Homo consumens 34. Lacune informatiche 35. Sei troppo! 36. ...

Generatore Markmap HD

Pagina per il download di  Memento Lite Generatore Markmap Avanzato - Specifiche per l'utente finale Scopo principale: l'applicazione “Generatore Markmap Avanzato” permette agli utenti di trasformare testo scritto in formato Markdown in mappe mentali interattive. Offre funzionalità per creare, visualizzare, salvare, modificare, gestire ed esportare queste mappe mentali in vari formati. Interfaccia utente: l'interfaccia è strutturata nelle seguenti sezioni principali: Link al blog esterno: un link “🌐 Visita il Blog: Pensieri d'assestamento” che apre il blog associato in una nuova scheda. Intestazione (Header): Titolo: “Generatore Markmap Avanzato”. Sottotitolo: “Trasforma, salva e condividi il tuo testo Markdown in mappe mentali interattive”. Area Principale dei Contenuti: divisa in due pannelli affiancati (o impilati su schermi piccoli): Pannello di Input (Editor Markdown): Titolo: “✏️ Editor Markdown”. Area di Testo: un campo multiriga dove l...

Neural Tic-Tac-Toe Lab

Questo articolo presenta l'implementazione di una rete neurale specializzata nel gioco del tris (tic-tac-toe), addestrata mediante una metodologia innovativa basata sull'enumerazione completa degli stati di gioco. L'approccio supera le limitazioni dei metodi tradizionali di campionamento casuale, garantendo una copertura totale dello spazio delle configurazioni possibili. Struttura della rete neurale La rete implementata utilizza un'architettura feed-forward compatta con 9 neuroni di input, 16 neuroni nel layer nascosto e 9 neuroni di output. I neuroni di input ricevono la rappresentazione numerica dello stato della board (-1, 0, 1 per ciascuna delle 9 caselle), mentre i neuroni di output producono valutazioni numeriche per ogni possibile mossa. Il layer nascosto utilizza 16 neuroni con funzione di attivazione relu per introdurre capacità di apprendimento non-lineare. La rete contiene complessivamente 297 parametri: 144 pesi per le connessioni input-hidden, 16 bi...