Il sorgente di Claude Code e' finito online per errore: una source map lasciata nel pacchetto NPM ha esposto tutto il codice. Anthropic ha reagito con un DMCA su GitHub, bloccando repository e anche profili che non c'entravano nulla. Nel frattempo la community ha portato il codice in Python e Rust, e quei porting risultano legali. Analizziamo cosa c'era dentro: un codebase largamente vibe-codato, con ripetizioni, poca revisione e qualche feature non ancora pubblica. Nessuna ricetta magica, ma una gestione della memoria multilivello che non si trova negli altri tool. Ne discutiamo anche dal punto di vista della proprieta' intellettuale: l'IP sul codice e' davvero legata al linguaggio in cui lo scrivi?
Nella seconda parte raccontiamo i nostri progetti open source. Paolo ha costruito Antivocale, un'app Android che trascrive i messaggi vocali di WhatsApp usando i modelli Gemma direttamente sul telefono, senza passare dal cloud. Dall'idea al primo prototipo funzionante in meno di una giornata: Gemini ha generato il PRD, Claude Code ha scritto il codice, Paolo ha fatto da passacarte tra i due modelli dal bar. La parte difficile? Le due settimane successive per far funzionare tutto su diverse versioni di Android e pubblicare sullo store. Stefano presenta Lince, un tool open source per far girare i coding agent in sandbox con una dashboard da terminale: supporta Claude Code, Codex, Open Code e Gemini, gira su Linux e Mac, e permette di lavorare con piu' agenti in parallelo sullo stesso progetto.
Parliamo anche di Turbo Quant e quantizzazione della KV cache, con i primi risultati della community su LamaCPP: il breakeven e' piu' in la' di quanto ci si aspettasse, circa 100-150k token. Discutiamo i problemi di qualita' dei modelli GLM 5 di ZAI, che dopo meta' contesto iniziano a generare parole a caso, probabilmente per una quantizzazione troppo aggressiva della KV cache. Poi Gemma 4, i nuovi modelli edge di Google ora tutti multimodali che competono con modelli molto piu' grandi, Voxtral TTS di Mistral che promette bene per il text-to-speech in Europa, e il nostro contest di robotica con Cyberwave tra digital twin, edge AI e cingoli rotti. Chiudiamo con una riflessione sul burnout e su quanto sia importante staccare davvero.
00:00 Introduzione e accoglienza
02:26 Turbo Quant e quantizzazione della KV cache: i primi risultati
06:25 Quantizzazione live vs statica: il breakeven e i compromessi
11:22 Modelli GLM 5 di ZAI: quando la quantizzazione aggressiva rompe tutto
17:34 Stesso modello, provider diversi, risultati diversi
24:30 Il leak di Claude Code: source map su NPM, DMCA e il putiferio
30:22 DMCA, porting legale e proprieta' intellettuale sul codice
35:26 Antivocale: un'app Android nata al bar in una mattina
41:10 App AI fai-da-te: dall'idea alla validazione in un weekend
46:49 Burnout e tempo off-grid: sapere quando staccare
48:42 Scout, cifrari e progetti creativi dei bambini
50:36 Lince: sandbox e dashboard per i coding agent
55:09 Robotica con Cyberwave: digital twin, edge AI e cingoli rotti
59:10 AI e robotica autonoma: dal rover al porto, cosa tenere sul ledge
01:02:52 Gemma 4: modelli edge multimodali che sfidano i giganti
01:08:42 Voxtral TTS di Mistral e sviluppi AI in Europa
Lince - Tool open source per far girare coding agent in sandbox con dashboard da terminale. Supporta Claude Code, Codex, Open Code e Gemini su Linux e Mac.
Antivocale - App Android open source che trascrive i messaggi vocali di WhatsApp usando modelli Gemma direttamente sul telefono, senza cloud.
Tutti i nostri progetti - I repository open source di Risorse Artificiali su GitHub, inclusi Lince, Antivocale e gli strumenti che costruiamo per il podcast.
Talk Voxxed Days Zurich - Il talk di Stefano e Alessio sulla quantizzazione dei modelli, per capire meglio i trade-off di cui parliamo in puntata.
Spotify
YouTube
Sito web