Ricercatori Unict tra i protagonisti del progetto Ego4d

CATANIA (ITALPRESS) – La costruzione di un vasto dataset di video che raccoglie scenari della vita di tutti i giorni al fine di verificare la capacità delle macchine di ricordare il passato, predire il futuro e comprendere le interazioni sociali.
E’ quanto prevede il progetto Egocentric 4D Live Perception (Ego4D) che un gruppo di ricercatori del Dipartimento di Matematica e Informatica dell’Università di Catania, guidati dal professore Giovanni Maria Farinella, sta portando avanti insieme ad altri gruppi di ricerca di atenei sparsi in tutto il mondo, tra cui anche Facebook AI Research (FAIR).
A partire da questi dati, inoltre, il progetto Ego4D si pone l’obiettivo di definire cinque “benchmark”, ovvero un insieme di test finalizzati a verificare la capacità delle macchine di ricordare il passato (memoria episodica), predire il futuro e comprendere – nello stesso momento in cui accadono – le interazioni tra mani e oggetti, le interazioni sociali e le relazioni tra l’audio e la percezione visiva.
Applicazioni che possono risolvere diverse problematiche aperte con particolare riferimento all’ambito industriale e alla sicurezza sul lavoro. Basti pensare ad un macchinario robotizzato in grado di prevedere l’azione successiva che compirà l’operaio e quindi di interrompere il proprio funzionamento nel caso in cui la persona che sta lavorando corra il rischio di un infortunio compiendo una azione pericolosa.
I dati raccolti in Ego4D, acquisiti dal punto di visita umano con videocamere indossabili, hanno lo scopo di addestrare le tecnologie di intelligenza artificiale del prossimo futuro per supportare le persone nello svolgimento del proprio lavoro e nella vita di tutti i giorni.
I cinque benchmark individuati e oggetto di studio sono finalizzati a supportare la memoria episodica e assisterci (ad esempio ricordare dove abbiamo lasciato il giocattolo preferito di nostro figlio); prevedere su dove è probabile che una persona si sposterà, quali oggetti toccherà, o quale attività eseguirà successivamente; comprendere come le persone interagiscono con gli oggetti cambiandone lo stato (quando tagliamo un ortaggio per cucinare); riconoscimento audiovisuale utile, ad esempio, per richiamare parti di una lezione o sessione di formazione che abbiamo seguito in maniera distratta; capire le interazioni sociali, un aspetto fondamentale per migliorare e personalizzare le esperienze delle persone.
Oltre tremila ore di video – che saranno resi pubblici a partire dal mese di novembre – costituiscono il dataset che, in termini di ore di ripresa, è 20 volte più grande di qualsiasi altro insieme di dati esistente nell’ambito di ricerca in cui il progetto opera. I video sono stati realizzati da più di 850 partecipanti distribuiti in nove diversi paesi (tra cui Regno Unito, Stati Uniti, Italia, Giappone, India e Ruanda) e estremamente eterogenei per età, dati demografici, professione e genere. Gli scenari ripresi sono centinaia, appartengono a contesti della vita di tutti i giorni (cucinare, cucire, fare shopping, disegnare, riparare degli oggetti) e a professioni (metalmeccanici, falegnami, restauratori, meccanici di scooter e bici, panettieri, elettricisti, muratori).
«Il progetto Ego4D permette ai ricercatori in Intelligenza Artificiale di confrontarsi con nuovi problemi computazionali e studiare algoritmi che possano migliorare lo stato dell’arte e produrre conoscenza utile ad innovare la società in cui viviamo e lavoriamo» spiega il dottor Antonino Furnari dell’Università di Catania.
Il professore Giovanni Maria Farinella, responsabile scientifico del progetto per Unict, spiega che «Ego4D favorirà lo sviluppo di nuovi algoritmi di Intelligenza Artificiale applicabili in ambito industriale». «Questi dovranno essere capaci di predire la prossima azione che sarà svolta da un operatore, ad esempio per diminuire i rischi di incidenti e ottimizzare la formazione dei neoassunti abbassandone i costi, ma anche e soprattutto saranno utili a supportare l’uomo nel corretto svolgimento di un lavoro complesso suggerendo e verificando il prossimo passo da compiere in una procedura» ha aggiunto.
(ITALPRESS).