70 likes | 182 Views
Tópicos de projetos da disciplina de mineração de dados 2001.1. Jacques Robin e Francisco Carvalho CIn-UFPE. Lista de tópicos. Desenvolvimento de ferramentas : Implementar algoritmo de mineração de exceções em cuboides OLAP Implementar processador de consultas DMQL usando o Weka
E N D
Tópicos de projetos da disciplinade mineração de dados 2001.1 Jacques Robin e Francisco Carvalho CIn-UFPE
Lista de tópicos • Desenvolvimento de ferramentas: • Implementar algoritmo de mineração de exceções em cuboides OLAP • Implementar processador de consultas DMQL usando o Weka • Estender uma API para consulta de data warehouses multidimensionais a partir de bancos de dados dedutivos orientado a objetos • Estender engenho de busca na Web com agrupamento de páginas baseado em similaridade tanto do conteúdo das páginas como dos links entre elas • Mineração de flat file: • Minerar warehouse do ProDoc • Mineração de data warehouse • Minerar warehouse de estatísticas de futebol de robôs com MS OLAP Server ou Weka ou Progol • Minerar warehouse da Covest com SQL Server e Weka • Minerar warehouse de dados epidemiológicos do DataSus com SQL Server e Weka
Lista de tópicos • Mineração da Web: • Minerar páginas Web contendo estatísticas esportivas (ex, www.nba.com, sports.espn.go.com) com Java, XSB e SQL Server, e possivelmente também Weka e Progol • Minerar arquivo de log do servidor Web do CIn-UFPE ou do Radix.com com SQL Server e Weka
Implementação de algoritmo de mineração de exceções em hipercubos OLAP
Log do Soccer Server Ferramenta de modelagem E-R Hipercubo OLAP derivados Data Mart ROLAP Hipercubo OLAP primitivo ... Serviços de transformação de dados SGBD relacional Servidor OLAP JODI: API OLE DB for OLAP / Java Microsoft SQL Server API XSB-SQL InterProlog API Java / XDB Log do Soccer Server DOODI: APIOLE DB for OLAP / XSB Sistema dedutivo XSB Exemplo detalhado: preparação de dados
Exemplo detalhado: mineração dos dados Caracterização Multi-dimensional dos resultados das partidas em função das estatísticas de fases de jogo e da taxa de sucesso de cada tipo de jogada Hipercubo OLAP derivados Servidor OLAP Microsoft SQL Server Data Mart ROLAP SGBD relacional JDBC Previsão do sucesso de uma jogada em função do seu contexto no jogo Previsão da melhor jogada a tentar para cada contexto de jogo Weka Clusters de jogadas