Immagina di dover scegliere la prossima casella vuota in una griglia gigante (6 cartelle × 3 righe × 9 colonne), seguendo regole complesse.
Ecco svelato il mistero della generazione IA dei set di cartelle della tombola, passo-passo:
1) La Mappa delle probabilità
Quando il modello GRU (Gated Recurrent Units) deve piazzare un numero (es. il numero 42), non sceglie a caso.
Quando il modello GRU (Gated Recurrent Units) deve piazzare un numero (es. il numero 42), non sceglie a caso.
Cosa succede dietro le quinte:
- Il modello genera una lista di preferenze (logit) per tutte le 162 caselle.
- Queste preferenze vengono trasformate in probabilità (usando la softmax), come un dado con 162 facce, dove ogni faccia ha un peso diverso.
2) Perché il dado è truccato?
Durante l’allenamento, il modello ha imparato:
- Regole implicite:
Se il modello deve piazzare il numero 15 (che appartiene alla colonna 2, perché 10-19), il dado avrà:
Durante l’allenamento, il modello ha imparato:
- Regole implicite:
- Se sta piazzando un numero tra 1-9, le caselle della prima colonna avranno probabilità alte.
- Se sta piazzando il secondo numero di una riga, eviterà di riempire una colonna già completa (ogni riga deve avere esattamente 5 numeri).
Se il modello deve piazzare il numero 15 (che appartiene alla colonna 2, perché 10-19), il dado avrà:
- Probabilità alte per le caselle della colonna 2.
- Probabilità nulle per colonne sbagliate (es. colonna 3 o 5).
3) Il ruolo del caos controllato
Il modello usa la funzione torch.multinomial per lanciare il dado. Questo introduce un elemento casuale, ma guidato:
- Cosa significa:
Se il modello fosse totalmente deterministico, genererebbe cartelle identiche. Il "caos controllato" garantisce varietà, pur mantenendo le regole.
Il modello usa la funzione torch.multinomial per lanciare il dado. Questo introduce un elemento casuale, ma guidato:
- Cosa significa:
- Non sceglie SEMPRE la casella con la probabilità più alta (sarebbe troppo ripetitivo).
- Esplora caselle con probabilità media/bassa, purché rispettino le regole.
Se il modello fosse totalmente deterministico, genererebbe cartelle identiche. Il "caos controllato" garantisce varietà, pur mantenendo le regole.
4) Come evita gli errori?
Anche se tecnicamente potrebbe scegliere una casella non valida (es. mettere il 20 nella colonna 1), nella pratica:
- Grazie all’allenamento:
Se il modello prova a mettere il numero 75 nella colonna 1 (1-9), il dado assegnerà a quelle caselle una probabilità pari a 0.0000001% (praticamente impossibile).
Anche se tecnicamente potrebbe scegliere una casella non valida (es. mettere il 20 nella colonna 1), nella pratica:
- Grazie all’allenamento:
- Le caselle vietate hanno probabilità quasi zero, perché il modello le ha viste raramente/mai nei dati di training.
- È come se il dado avesse delle facce invisibili: puoi lanciarlo, ma quelle facce non verranno mai selezionate.
Se il modello prova a mettere il numero 75 nella colonna 1 (1-9), il dado assegnerà a quelle caselle una probabilità pari a 0.0000001% (praticamente impossibile).
In Sintesi:
Il dado magico non è casualità pura, ma un meccanismo sofisticato che:
1. pesa le scelte in base alle regole apprese;
2. introduce variabilità per creare cartelle uniche;
3. blocca le mosse impossibili, senza bisogno di controlli espliciti.
È l’equilibrio perfetto tra creatività e disciplina!
1. pesa le scelte in base alle regole apprese;
2. introduce variabilità per creare cartelle uniche;
3. blocca le mosse impossibili, senza bisogno di controlli espliciti.
È l’equilibrio perfetto tra creatività e disciplina!