Web: struttura, analisi, classificazione
(F74, 6 crediti, laurea magistrale in Informatica)

DOCENTI: Nicolò Cesa-Bianchi

Orario lezioni:

Testi consigliati (da integrare con materiale fornito dal docente):
Pierre Baldi, Paolo Frasconi, Padhraic Smyth
Modeling the Internet and the Web
Wiley, 2003 (disponibile in biblioteca).

Mark Levene
An Introduction to Search Engines and Web Navigation
Pearson Education, 2005 (disponibile in biblioteca).

Romualdo Pastor-Satorras, Alessandro Vespignani
Evolution and Structure of the Internet: A Statistical Physics Approach
Cambridge University Press, 2004 (disponibile in biblioteca).

Obiettivi: Il web è un oggetto la cui complessità può essere dominata attraverso un sofisticato mix di tecniche informatiche e statistiche. Scopo di questo corso è fornire allo studente un insieme di strumenti matematici ed algoritmici utili a: comprendere la struttura del grafo del web, calcolare alcuni dei principali indici di rilevanza associati alle pagine, realizzare sistemi di categorizzazione automatica di pagine web.

Programma:

  1. Modelli matematici della struttura a larga scala del web.
  2. Algoritmi per l'analisi dei link: PageRank, HITS, Salsa.
  3. Apprendimento supervisionato: modello statistico
  4. k-NN e alberi di decisione
  5. Classificatori lineari e funzioni kernel.
  6. Ranking e classificazione automatica di pagine web.
Esami

Avvisi:

Sfogliate le pagine del calendario e cliccate sulle date per trovare i riassunti e le date delle prossime lezioni. Cliccate poi su "altri dettagli" per avere la formattazione corretta.