Flux 1.0 meglio di Midjourney? La prova.
Robot potenziati dall'IA, OpenAi perde pezzi, Instagram rivoluziona gli analytics
Ciao,
come va? Qui si rallenta, ma siccome continuo ad informarmi quotidianamente, continuo anche a distillare il meglio per te.
Ah, se non hai già scaricato la mia guida all’adozione degli strumenti di GenAI, potrebbe essere il momento di farlo. Buona lettura!
Flux 1.0: la prova
Ho testato Flux 1.0, un modello text to image open source che viene definito il "Midjourney Killer". Sarà vero? Buona visione!
📰 News
OpenAI continua a perdere pezzi, da novanta. John Shulman, co-fondatore, lascia per andare nella rivale Anthropic. “Questa scelta nasce dal mio desiderio di approfondire la mia attenzione sull’allineamento dell’IA”, ha detto il manager. Altri, in passato, hanno addotto la stessa motivazione, per cui è possibile dedurre che Sam Altman sia meno interessato dei suoi colleghi alle questioni di etica e sicurezza dei modelli di IA.
Greg Brockman, altro co-fondatore, ha deciso di prendersi un periodo di pausa fino a fine anno.
Nel frattempo, forse come arma di distrazione, Sam Altman ha pubblicato una foto delle fragole del suo giardino, alludendo alla prossima evoluzione di ChatGPT, nome in codice “Strawberry”.
Google ha firmato un accordo di licenza non esclusivo con Character AI, startup che ha un’interessante large language model oltre che un’app molto utilizzata che permette di creare e dialogare con bot di vario tipo. Ma Big G non si è fermata qui, ha anche assorbito i co-fondatori Noam Shazeer e Daniel De Freitas, insieme ad altri talenti dell’azienda. Questa “quasi-acquisition” o “acqui-hiring” è una mossa che altri hanno fatto di recente, Microsoft con Inflection e Amazon con Adept. Un modo per aggirare le regole dell’antitrust.
Suno ha preso posizione contro la causa intentata dalla RIAA. Le case discografiche sostengono che l’IA sia come un pappagallo che copia e ripete la musica ascoltata. Suno, invece, afferma che il loro modello assimila pattern e stili (di musica pescata in rete che, ammettono, potrebbe anche essere coperta da copyright) per poi imparare a creare nuova musica, un po’ come fanno gli umani. Dunque, dal loro punto di vista “learning is not infringing”.
Robot: la robotica sta facendo enormi passi avanti anche grazie all’intelligenza artificiale generativa. Figure sta costruendo umanoidi che dovrebbero svolgere lavori pesanti al fianco degli umani. Il loro nuovo robot si chiama Figure 02 ed è capace di conversare con gli umani e di vedere il contesto (ha 6 videocamere) perché il suo “cervello” è potenziato dai modelli di OpenAI. Può lavorare circa 20 ore. E in BMW già lo usano, come si vede dal video.
Sul fronte ricerca, Google ha sviluppato un robot in grado di giocare a ping-pong e vincere il 100% delle partite contro i principianti e il 45% contro i giocatori medi.
🪄 Prompt
Runway, grazie al suo modello image to video, permette anche di dare vita a riprese video. Basta prendere un frame del video originario e usarlo come prompt in Runway Gen-3 (qui il mio tutorial). Ad esso, si può aggiungere un testo per descrivere l’effetto che si vuole ottenere. Nel mio esempio, ho ripreso il Castel Ruggero di Lauria e poi ho usato il prompt:
static wide shot: paint explosion over the castle dropping down, realistic. camera still
📈 Stats
Gartner nella sua “CMO Spend Survey” ha rilevato che la spesa per il marketing è calata drasticamente di 15 punti rispetto all’anno scorso. Ora siamo al 7,9% dei ricavi totali. Le priorità di spesa sono quelle che hanno a che fare con la generazione di domanda e il supporto alle vendite.
🔧 Tools & Tips
Instagram rivoluziona i suoi analytics: le “Visualizzazioni” diventano la metrica principale per tutti i formati: reels (prima “plays”), foto, caroselli, storie. Un modo per far capire ai creator che non si devono focalizzare su follower e reach.
ChatGPT ora permette agli utenti non paganti di generare fino a 2 immagini al giorno.
Mistral AI ha rilasciato Mistral Large 2, la seconda versione del suo modello linguistico che si può usare gratuitamente.
Meta ha rilasciato SAM 2 (Segment Anything) un modello di IA per la segmentazione precisa delle parti di un video, con un semplice click. La demo permette di capire bene come funziona. È open, per cui verrà facilmente integrato in molti prodotti per l’editing dei video.
Chrome ha nuove funzioni potenziate dall’IA (per ora solo in US). L’integrazione di Google Lens permetterà di cercare immagini e testi senza lasciare la scheda di navigazione. “Tab Compare” è un comparatore di prodotti riassunti con Gemini (AI Overview). Infine la possibilità di ricerca nella cronologia usando il linguaggio naturale.
🎁 Goodies
Ti lascio con una cantautrice scoperta da poco, King Hannah e il suo indie-rock.
Se ti è piaciuta la newsletter lascia un cuore, un commento o condividila con i tuoi contatti. Alla prossima!
Grazie Vincenzo, apprezzo molto i tuoi articoli. Sei sempre preciso e dettagliato. Seguendo la tua newsletter so di poter contare su una persona esperta e competente. Complimenti. Io da un po' di tempo sto usando Perplexity come fonte di informazioni e come aiuto per trovare ispirazione per i miei post. Mi trovo bene. Altre AI che posso usare gratuitamente per gli stessi scopi? Buona domenica.