Le nuove capacità di ChatGPT

Creare immagini con la voce, AI Index Report di Stanford, IA per delfini

apr 19, 2025

Ciao, come va?
ti devo raccontare una cosa che mi è successa questa settimana. Stavo leggendo l’ultimo libro di Carlo Lucarelli “Almeno tu”, quando mi blocco su questo passaggio “In mezzo, incorniciato dallo sfondo rosso e arancio, c’è il video di un canale YouTube bloccato sul volto di un uomo dai capelli pettinati con la riga e un maglioncino blu a collo alto, le labbra spinte in avanti a metà di una frase. - “Come clonare una voce con l’intelligenza artificiale”, - legge Lara da sopra la spalla di Paola.

Non può essere. Entro nel mio account YouTube e lo trovo. Il mio video, credo il primo in Italia a trattare questo argomento. Grazie Carlo :)

È il momento buono per entrare in lista d’attesa per i miei corsi (per te che sei iscritto a questa newsletter c’è uno sconto del 30% fino a fine mese).

Test di o3 e o4

OpenAI ha rilasciato nuovi "modelli di ragionamento" in ChatGPT. Si tratta di o3 e di o4 (mini e mini-high). Sono i primi modelli pensati per agire come agenti ed usare tutti gli strumenti che hanno a disposizione per rispondere: la ricerca, la visione avanzata, la scrittura di codice, la generazione di immagini, la programmazione di task. La mia prova.

Creare immagini con la voce

La versione 7 di Midjourney (alpha) contiene diverse novità: un miglioramento della qualità e della rispondenza ai prompt, la possibilità di scrivere prompt in italiano, la modalità draft e quella conversazionale. Quest’ultima è la più innovativa perché permette di parlare ed ottenere le immagini richieste. Il test.

📰 News

Google ha svelato DolphinGemma, un modello IA progettato per analizzare e generare le vocalizzazioni dei delfini. L’idea è quella di comprendere le ricorrenze nel linguaggio di questi affascinanti cetacei e, magari, provare a comunicare con loro.

Anthropic ha introdotto Research (beta) una funzione che permette di fare ricerche sul web, anche integrandole con informazioni recuperate da Gmail, Google Calendar, e Docs. È attiva solo sugli account Max, Team, Enterprise in US, Giappone, Brasile.

Gemini ora permette di generare video con un semplice prompt, grazie al modello VEO 2 (sono di 8 secondi a 720p). Io lo stò testando da tempo perché faccio parte del programma riservato ai beta tester.

Grok ha aggiunto la funzione Grok Studio, identica a Canvas di ChatGPT. Permette di vedere l’anteprima di un codice e lavorare su documenti (è integrato con Drive).

Instagram ha rilasciato la funzione “Blend” per i Reels, che permette di creare un feed condiviso di video consigliati all’interno di una chat di gruppo.

📈 Stats

Stanford ha pubblicato il consueto AI Index Report che contiene un sacco di materiale sullo stato dell’IA. Ad esempio, questo grafico che mostra come le aziende abbiano incrementato l’adozione di IA nel 2024 (+55% dall’anno prima).

🔧 Tools & Tips

AI Product Rankings è un sito che ti permette di cercare il tuo prodotto/brand e vedere come si posiziona nei risultati di ChatGPT, Claude e Perplexity.

Video: consigli per trasformare i video YouTube in Shorts.

Meta: best practice per creare annunci che spingono per un contatto via messaggio (sembrano performare bene).

🪄 Prompt

Per applicare un particolare stile alle tue immagini create con ChatGPT puoi usare questa mia nuova guida. Ti basterà scrivere un prompt del tipo ”Crea un’immagine di una donna usando lo stile di Botero”.

Scaricala gratuitamente.

🎁 Goodies

Questa volta ti lascio con Fazil Say, un pianista suggeritomi da Natalia, un affezionata lettrice che ringrazio. La sua musica è un misto di romanticismo classico e influenze mediorientali.

Se ti è piaciuta la newsletter lascia un cuore, un commento o condividila con i tuoi contatti. Buona Pasqua!

Vincos Newsletter

Discussione su questo Post