50 likes | 189 Views
KAPPAELLE Problemi Aperti. Carlo Tasso LIA - UNiUD Gruppo infoFACTORY. WEB 2.0 Nuovi REQUISITI e nuovi PROBLEMI: verso la Content-based online Business Intelligence. Monitorare automaticamente siti Web, riviste online, portali tematici, community, UGC (forum, blog, newsgroup), ecc.
E N D
KAPPAELLEProblemi Aperti Carlo Tasso LIA - UNiUD Gruppo infoFACTORY
WEB 2.0Nuovi REQUISITI e nuovi PROBLEMI:verso la Content-based online Business Intelligence • Monitorare automaticamente siti Web, riviste online, portali tematici, community, UGC (forum, blog, newsgroup), ecc. • Analisi semantica dei testi: Identificazione dei concetti e relazioni, capire di cosa trattano • Annotazione Semantica automatica, basata su ontologie di dominio • Filtraggio semantico personalizzato delle informazioni, superando l’approccio delle “parole chiave” • Sistemi di classificazione e clustering automatici • Strumenti di information extraction • Sentiment Analysis, analisi della polarità delle opinioni • Social Network Analisys, quantitativa a qualitativa/content-based (capire la struttura del network, identificare diversi gruppi, identificare influencer, ponti, riconoscere contenuti simili per raccomandare e notificare proattivamente, … ) • Key Performance Indicators significativi per l’analisi
Information Access, Motori di Ricerca:Problemi Aperti • Automatic Tagging, semantic mark-up • Uso dei tag cloud e delle folksonomie come aiuto alla ricerca, nuove forme di visualizzazione e di elaborazione,… ) • Uso di ontologie di dominio per modificare/raffinare una query: • Query costituite da testi • Estraggo i termini della query • Cerco i concetti relativi in WordNet, e disambiguo • Trovo altri termini sinonimici (o in relazione) dall’ontologia del dominio • Estendo la query • Ordinamento in base ai concetti del dominio, estratti dall’ontologia • Costruzione automatica di Ontologie • Monitoraggio della stato dell’arte dei motori di ricerca. Analisi delle tendenze.
Personalizzazione nei siti Web 2.0:Problemi Aperti • Strumenti personalizzati per l’ausilio alla ricerca di informazioni (wikipedia) • Strumenti di annotazione (oltre ai tag), ed analisi semantica delle annotazioni e tag, basata o meno su ontologie • Suggerimenti basati sui contenuti • Analisi del comportamento degli utenti, analisi basata sui contenuti • Match-making basato sui contenuti e su ontologie • Analisi delle opinioni • Analisi dei profili utente, sintesi di stereotipi
Towards Information Extraction:Problemi Aperti • ‘Intelligent’ scraping • Information extraction in Italian Language • Opinion Mining, Extraction, Summarization con tecniche NLP (http://www.cs.uic.edu/~liub/ACL-07-tutorial-WCM-to-NLP.pdf) • Sentiment Analysis per l’Italiano • Relation/event extraction • Automating Online Business Intelligence, verso la Knowledge Discovery