Il nuovo libro di Maarten Grootendorst, il bellissimo "Segment Anything 2" (SAM 2) per mac e il motore Vchitect-2.0
- Libri
- SAM2
- Vchitect
Ecco le novità del giorno…
E’ uscito il nuovo libro di Maarten Grootendorst, si chiama "Hands-On Large Language Models" e io l’ho già ordinato (con 250 visual a colori!) :)
Link Amazon
Il team di AIatMeta ha rilasciato Segment Anything 2 (SAM 2), un modello di visione artificiale all'avanguardia per la segmentazione di immagini e video. Questa nuova versione offre prestazioni nettamente migliori rispetto al suo predecessore, con tempi di inferenza estremamente rapidi su dispositivi come Mac e iPhone grazie all'ottimizzazione per Apple CoreML.
Una delle caratteristiche chiave di SAM 2 è la sua capacità di eseguire l'inferenza in una frazione di secondo, rendendo possibile l'annotazione di qualsiasi immagine in tempi quasi istantanei. Il team ha rilasciato checkpoint del modello ottimizzati in diverse dimensioni (tiny, small, base e large) con licenza Apache, permettendo agli sviluppatori di scegliere il miglior compromesso tra dimensioni e prestazioni in base alle loro esigenze.
Oltre all'applicazione open source per l'annotazione di immagini, AIatMeta sta lavorando per aggiungere il supporto per i video nelle prossime release. Sono inoltre disponibili guide per il fine-tuning di SAM 2 su casi d'uso specifici, come il Medical SAM per applicazioni nel campo medico.
Per facilitare l'adozione di questa nuova tecnologia, il team ha rilasciato un'app packaged pronta all'uso per eseguire SAM 2 direttamente su Mac, si scarica qui.
Poi è uscito questo nuovo motore text-to-image chiamato Vchitect-2.0.
Sembra interessante, su HF c’è anche una demo che genera pochi secondi.