Computer Vision IRL: dall'idea al deploy on-premise - Egon Ferri
Computer Vision IRL: dall'idea al deploy on-premise - Egon Ferri - PyCon Italia 2024
Elevator Pitch:
Reale caso di studio di Immobiliare.it su come realizzare un servizio di classificazione di immagini in ambito real estate: dall'idea fino al deployment in produzione di un servizio REST basato su FastAPI e il model serving TorchServe per la gestione di elevati carichi di req/s con latenze inferiori ai 200ms per richiesta.
Description:
Nell'ambito della Computer Vision (CV), l'attenzione è spesso rivolta allo sviluppo di modelli di deep learning, trascurando le fasi cruciali di definizione del problema come: preparazione dei dati, messa in produzione del modello e successivo monitoraggio.
In questo talk, illustreremo il nostro approccio allo sviluppo di servizi di CV attraverso un use-case reale: la classificazione degli ambienti di un immobile utilizzando esclusivamente tecnologie open-source.
In particolare racconteremo:
- come dall'esigenza di business passiamo ai requisiti tecnici per il modello e il servizio;
- il processo di creazione del dataset di immagini e dello sviluppo e dell'ottimizzazione della performance del modello;
- la messa in produzione in ambiente on-premise del servizio di CV basata sulla combinazione di una proxy API targata FastAPI e di un model serving basato su TorchServe per assicurare un servizio che sia scalabile e che garantisca un throughput elevato e una bassa latenza;
- come abbiamo implementato il nostro sistema di monitoraggio per garantire l'efficienza e la correttezza del servizio, vigilando sull'hardware, sulla qualità dei dati, sull'accuratezza del modello e sulle KPI di business.
Attraverso questo approccio, abbiamo realizzato un servizio di CV innovativo e performante, dimostrando l'efficacia delle soluzioni open-source nel rispondere a esigenze complesse di business.
Learn more: https://2024.pycon.it/event/computer-vision-irl-dallidea-al-deploy-on-premise
#DeepLearning #FastAPI