OpenAI sta espandendo un programma, Custom Model, per aiutare i clienti enterprise a sviluppare modelli AI generativi personalizzati utilizzando la sua tecnologia per casi d'uso, domini e applicazioni specifiche.
Custom Model è stato lanciato l'anno scorso alla conferenza inaugurale degli sviluppatori di OpenAI, DevDay, offrendo alle aziende l'opportunità di lavorare con un gruppo di ricercatori dedicati di OpenAI per addestrare e ottimizzare modelli per specifici domini. "Decine" di clienti si sono iscritti a Custom Model da allora. Ma OpenAI afferma che, lavorando con questa prima sfilza di utenti, si è resa conto della necessità di far crescere il programma per "massimizzare ulteriormente le prestazioni".
Quindi assistenza al fine-tuning e modelli addestrati personalizzati.
L'assistenza al fine-tuning, un nuovo componente del programma Custom Model, utilizza tecniche oltre il fine-tuning - come "ulteriori iperparametri e vari metodi efficienti di fine-tuning dei parametri su una scala più ampia," nelle parole di OpenAI - per consentire alle organizzazioni di impostare pipeline di addestramento dei dati, sistemi di valutazione e altre infrastrutture di supporto per migliorare le prestazioni del modello su compiti specifici.
Per quanto riguarda i modelli addestrati personalizzati, sono modelli personalizzati costruiti con OpenAI - utilizzando i modelli base e gli strumenti di OpenAI (ad esempio GPT-4) - per clienti che "necessitano di raffinare ulteriormente i loro modelli" o "impregnare nuove conoscenze specifiche del dominio," dice OpenAI.
OpenAI dà l'esempio di SK Telecom, il gigante delle telecomunicazioni coreano, che ha lavorato con OpenAI per raffinare GPT-4 al fine di migliorare le prestazioni nelle "conversazioni relative alle telecomunicazioni" in coreano. Un altro cliente, Harvey - che sta costruendo strumenti legali alimentati da AI con il supporto del Fondo per le startup di OpenAI, il braccio di OpenAI focalizzato sull'AI - si è unito a OpenAI per creare un modello personalizzato per la giurisprudenza che incorporava centinaia di milioni di parole di testo legale e feedback da avvocati esperti licenziati.
"Siamo convinti che in futuro la grande maggioranza delle organizzazioni svilupperà modelli personalizzati che sono personalizzati per la propria industria, business o caso d'uso," scrive OpenAI in un post sul blog. "Con una varietà di tecniche disponibili per costruire un modello personalizzato, organizzazioni di tutte le dimensioni possono sviluppare modelli personalizzati per ottenere un impatto più significativo e specifico dalle loro implementazioni di AI."
OpenAI sta navigando in alto, avvicinandosi a un incredibile fatturato annuale di $2 miliardi. Ma c'è sicuramente una pressione interna per mantenere il passo, in particolare mentre l'azienda progetta un data center da $100 miliardi co-sviluppato con Microsoft (se i rapporti sono da credere). Dopotutto, il costo dell'addestramento e del servizio dei modelli AI generativi di punta non sta diminuendo, e il lavoro di consulenza come l'addestramento del modello personalizzato potrebbe essere proprio ciò che mantiene in crescita i ricavi mentre OpenAI progetta i suoi prossimi passi.
I modelli raffinati e personalizzati potrebbero anche alleviare la pressione sull'infrastruttura di servizio dei modelli di OpenAI. I modelli personalizzati sono in molti casi più piccoli e performanti rispetto ai loro corrispondenti generici, e - mentre la domanda di AI generativa raggiunge livelli di febbre - senza dubbio rappresentano una soluzione attraente per un OpenAI storicamente sfidato dalla capacità di calcolo.
Oltre al programma Custom Model espanso e alla costruzione di modelli personalizzati, OpenAI ha oggi presentato nuove funzionalità di raffinamento del modello per gli sviluppatori che lavorano con GPT-3.5, tra cui un nuovo cruscotto per confrontare la qualità e le prestazioni del modello, supporto per integrazioni con piattaforme di terze parti (a partire dalla piattaforma per sviluppatori di AI Weights & Biases) e miglioramenti agli strumenti. Per quanto riguarda il raffinamento per GPT-4, tuttavia, la bocca è cucita, essendo stato lanciato in accesso anticipato durante DevDay.