High-performance Data and Graph Analytics

Internet e i social media hanno completamente cambiato il modo in cui interagiamo con altre persone in giro per il mondo. Milioni di connessioni e interazioni avvengono ogni giorno a velocità incredibile: i grafi sono uno strumento chiave per comprendere e descrivere questi fenomeni. Il corso di High-Performance Data and Graph Analytics, organizzato in collaborazione con Oracle Labs e giunto alla sua terza edizione, è ideato per fornire strumenti teorici e pratici per analizzare in modo efficiente grafi di enormi dimensioni: ottimizzazione del codice, algortimi di Machine Learning e analisi delle performance sono solo alcuni dei piatti nel menù, aggiornato ad ogni edizione per essere sempre più interessante.
Parallelamente alle lezioni, gli studenti hanno la possibilità di testare la loro abilità partecipando ad un contest: i migliori studenti prenderanno parte ad una seconda fase di selezione svolta direttamente da Oracle Labs e avranno l’opportunità di essere selezionati per una internship da Milano, Zurigo, o Redwood City.


Le track di quest’anno

Il contest e le lezioni di questa edizione del corso si focalizzano su queste due track:

  • Graph-based Machine Learning
  • Relational Hash-JOIN vs Graph traversal

Calendario delle lezioni

  • Il contest inizia il 9/11/20, e termina il 9/12/20 alle 23.59
Data Orario Topic
2/11/20, Lunedì 17:00-19:00 Introduzione al corso e all’analisi di grafi
5/11/20, Giovedì 17:00-19:00 Guest lectures di Oracle Labs, con Marco Arnaboldi e Miroslav Cepek
7/11/20, Sabato 9:30-18:00 Architetture hardware per analisi di grafi, strutture dati e Graph Queries
8/11/20, Domenica 9:30-18:00 Full-immersion su Graph Machine Learning

Success stories

Ecco i racconti di alcuni dei vincitori delle precedenti edizioni

Mi chiamo Matteo Moreschini, ho partecipato al contest di High Performance Data & Graph Analytics 2020 proponendo un algoritmo di Entity Resolution veloce e scalabile basato su algoritmi di gradient boosting, e svolgerò una internship ad Oracle Labs in cui lavorerò su Machine Learning applicato a graph analytics

Mi chiamo Luca Carminati e ho partecipato al contest di High Performance Data & Graph Analytics 2020. Assieme al mio team ho sviluppato un algoritmo genetico per ottimizzare query PGQL in un Graph Database, e sono stato selezionato per una internship. Mi occuperò di compilazione di linguaggi e applicazione di funzioni direttamente nel Database.

Ciao, mi chiamo Simone Baselice. Durante il secondo anno della triennale in Ingegneria Informatica ho partecipato all’edizione 2020 del contest sviluppando con un algoritmo di query planning efficiente per PGX, il motore di graph analysis di Oracle Labs. Grazie al contest ho avuto la fantastica opportunità di essere selezionato per un internship in Oracle Labs. Lavorerò per il team Data Studio che si occupa dello sviluppo di una piattaforma web-based per graph analytics e visualization.



Edizioni precedenti

Ogni edizione del corso si focalizza su tematiche leggermente differenti, in modo da restare sempre aggiornato sullo stato dell’arte in ambito Graph Analytics

Edizione 2019-2020

  • Query Planning per effettuare ricerche efficienti all’interno dei grafi
  • Entity Resolution per identificare profili sospetti in attività finanziarie

Edizione 2018-2019

  • Accelerazione con GPU dell’algoritmo di PageRank
  • Graph Machine Learning per predirre interazioni tra proteine e essere di aiuto al mondo della ricerca farmaceutica