Imagen 3: il modello di Google per le immagini
Google presenta il nuovo hardware potenziato da Gemini, Grok 2 fa discutere, novità Threads
Ciao,
come sta andando l’estate? Io non mi lamento, sto prendendo molti appunti e sarei tentato di scrivere un libro a partire da quanto ho scritto nel white paper in basso. Potrebbe essere un libro in continuo aggiornamento, dato che l’argomento è in continua evoluzione. Ma non so se ce ne sia bisogno. Fammi sapere che ne pensi.
Imagen 3: la prova
Siccome faccio parte del programma di beta testing, sono riuscito a provare in anteprima Imagen 3, il nuovo modello text to image di Google. Si può usare attraverso il servizio ImageFX, che per ora è disponibile solo negli USA (da noi usando una VPN) e presto lo potremo utilizzare in Gemini e in tutti i servizio di Big G. Buona visione!
📰 News
Google ha presentato i suoi nuovi hardware, ma durante l’evento si è parlato più di software perché l’intelligenza artificiale potenzierà tutti i dispositivi. In alcuni casi le funzioni sono “nice to have”, in altri potrebbero cambiare il modo in cui interagiamo con “la ferraglia”. Per esempio, avere un’assistente (il Google Assistant potenziato da Gemini) finalmente capace di dare risposte e non rimandare alla ricerca sul web è già un passo in avanti. Inoltre, avere un dialogo realistico con un bot (funzione che qui chiamano “Gemini Live”), è qualcosa che abbiamo visto solo nelle demo di OpenAI e che ora Google sta rilasciando (agli abbonati di Gemini Advanced su Android in primis). Certo, le demo di OpenAI sembrano più sconvolgenti perché il sistema ha meno paletti e controlli rispetto a quello di Google. In ogni caso, useremo più spesso la voce e, sospetto, che non ci limiteremo solo a dettare comandi. Che ne pensi?
Altre cose interessanti che ho visto sono la funzione “Call Notes”, che trascrive e fa il riassunto di conversazioni telefoniche, e l’app “Pixel Screenshot” che risponde alle nostre domande, andando a trovare le risposte tra gli screenshot salvati.
In definitiva, è chiaro che l’intelligenza artificiale generativa sta diventando un elemento differenziante per chi vende hardware, perché è in grado di “aumentare” il valore del dispositivo. Vedremo se aiuterà le vendite dei Pixel (io ho già ordinato il 9 Pro) e se danneggerà Apple, che si muove più cautamente, forte di una fedelissima base utenti. C’è da chiedersi anche se ai nuovi arrivati, come OpenAI, non serva un qualche dispositivo fisico per competere adeguatamente in questo nuovo campo di battaglia.
Ti lascio il riassunto della presentazione in 20 minuti.
xAI ha rilasciato Grok 2, la nuova versione del chatbot integrato in X (ancora non disponibile in Italia, ma se vuoi fammi sapere che lo testo). Ora il bot di Musk riesce a creare anche immagini da testo e lo fa senza censure. Così, il web si è riempito di immagini false di personaggi famosi che hanno fatto discutere, come Kamala Harris con le armi. Questa funzione non è nativa di Grok, ma è realizzata attraverso le API di Flux 1.0, modello open source che ho testato la settimana scorsa e che è già stato integrato da altre applicazioni. Certo, averla all’interno di un servizio di massa pone dei problemi etici e legali, di cui dovrà farsi carico il gestore, padre-padrone Elon Musk.
In basso una mia immagine-speranza, creata con Flux.
A proposito di Musk, questa settimana ha fatto anche l’intervistatore di Donald Trump. Doveva essere un evento da 8 milioni di ascoltatori su X, ma il sistema ha fatto “crash” dopo pochi minuti. Musk ha dato la colpa ad un fantomatico attacco DDoS, ma è stato smentito da un reportage di The Verge.
Pulpit AI, non ci crederai, è un servizio dedicato ai preti per aiutarli a generare o modificare contenuti religiosi. Usa Claude per scrivere sermoni, migliorare le bozze e spezzettarli in contenuti per i social. Pare sia efficace per ridurre i tempi e raggiungere più persone.
🪄 Prompt
ChatGPT/Claude/Gemini per la scrittura di blog post e articoli.
Scrivi un articolo coinvolgente per un blog sul tema [X], seguendo queste linee guida:
Struttura:
Usa titoli e sottotitoli formattati in modo chiaro
Dividi il testo in paragrafi brevi e di facile lettura
Tono e stile:
Adotta un tono informale
Usa la seconda persona singolare per coinvolgere direttamente il lettore
Contenuto:
Inizia con la formula PAS (Problem, Agitate, Solution): a) Presenta un problema relativo al tema [X] b) Amplifica le conseguenze negative del problema c) Offri una soluzione pratica e realizzabile
Arricchisci l'articolo con esempi concreti, aneddoti o dati rilevanti
Conclusione:
Riassumi i punti chiave dell'articolo
Inserisci la call to action [iscrizione alla newsletter]
Lunghezza: Circa 800-1000 parole
Assicurati che l'articolo sia informativo, coinvolgente e offra un valore reale al lettore.
📈 Stats
LinkedIn ha pubblicato un report (pdf) che esplora i maggiori driver del successo delle campagne B2B. Spoiler: vincono i video, creativi e con un messaggio chiaro.
🔧 Tools & Tips
Google Trends si arricchisce di più dati, come i trend correlati a quello principale.
Runway ha aggiunto un modello “Turbo” che permette di generare video in 20 secondi. Finora ci volevano almeno 2/5 minuti.
Midjourney ora permette l’accesso alla sua interfaccia web a chi ha generato 10 immagini su Discord. Questa settimana ha anche lanciato un nuovo editor.
Threads sta aggiungendo alcune funzioni utili:
la programmazione dei post
la creazione e conservazione di più bozze (massimo 100)
un pannello di insight che mostra l’età, il genere, il luogo di provenienza delle persone che vedono e interagiscono con i nostri post.
🎁 Goodies
Il mio artista preferito ha deciso di regalarci una versione inedita di “Get Behind The Mule”. La voce di Tom Waits e un organo Wurlitzer per accompagnarci in questa calda estate.
Se ti è piaciuta la newsletter lascia un cuore, un commento o condividila con i tuoi contatti. Alla prossima!
L'immagine foto-realistica di Putin dietro le sbarre è bellissima! Fa bene al cuore. Se la pubblichi sui social diventa virale, ne sono certo!