580 likes | 679 Views
DATA MINING EM TRAJET ÓRIAS DE OBJETOS MÓVEIS. Eduarda Zanette Greici Baretta Franzen Mateus Mello. Aparelhos GPS, celulares, smartphones etc... Dispositivos móveis deixam traços digitais que podem ser coletados como trajetórias , descrevendo a mobilidade de seus usuários (BOGORNY);
E N D
DATA MINING EM TRAJETÓRIAS DE OBJETOS MÓVEIS EduardaZanette Greici Baretta Franzen Mateus Mello
Aparelhos GPS, celulares, smartphones etc... • Dispositivos móveis deixam traços digitais que podem ser coletados como trajetórias, descrevendo a mobilidade de seus usuários (BOGORNY); • Permite o rastreamento do indivíduo • Novo tipo de dado (Trajetória de Objetos Móveis) TRAJETÓRIAS DE OBJETOS M
Figura 1: GPS de um barco de pesca de atum no litoral brasileiro M
Dados espaço-temporais • Representadospor um conjunto de pontos no espaço (x, y) em um instante de tempo (t) • T = (x1, y1, t1), …, (xn, yn, tn) DADOS DE TRAJETÓRIAS
DUAS ABORDAGENS SOBRE DATA MINING EM TRAJETÓRIAS • Data Mining Espaço-Temporal baseado na geometria da trajetória; • Análise baseada somente na forma física da trajetória; • É considerado apenas as propriedades geométricas (espaço e tempo); • Agrupamento das trajetórias baseado em algorítmos de densidade; M
DUAS ABORDAGENS SOBRE DATA MINING EM TRAJETÓRIAS • Data Mining Espaço-Temporal baseado na semântica da trajetória; • Baseado nas informações semânticas da trajetória; • Lida com dados esparsos; • Pré-processamento dos dados para enriquecimento das trajetórias. M
DATA MINING BASEADO EM TRAJETÓRIAS GEOMÉTRICAS • Padrões de Movimentos; • Padrões de Frequência; • Padrões Sequenciais; • Classificação; • Detecção de outliers; M
PADRÕES DE MOVIMENTOS (LAUBE, 2004) • Atualmente temos cinco padrões de movimentos: • Convergência; • Encontro; • Flock; • Liderança e • Recorrência (recurrence); M
T4 T1 T2 T3 T5 PADRÕES DE MOVIMENTOS: CONVERGÊNCIA • Determinado número de trajetórias que passaram por uma determinada região, não necessariamente no mesmo momento. convergência M
T2 T3 T1 PADRÕES DE MOVIMENTOS: FLOCK • Determinadas trajetórias que passaram por uma determinada região, se movendo em uma mesma direção durante um intervalo de tempo (ex: trânsito) flock M
T2 T3 T1 PADRÕES DE MOVIMENTOS: LIDERANÇA • Determinado número de trajetórias que passaram por uma determinada região, se movendo em uma mesma direção e ao menos uma trajetória está liderando as outras (ex: migração de pássaros) liderança M
T2 T3 T1 PADRÕES DE MOVIMENTOS: ENCONTRO • Determinado número de trajetórias que passaram por uma determinada região, se movendo em uma mesma velocidade e direção. encontro M
F1 F1 F1 F1 PADRÕES DE MOVIMENTOS: RECORRÊNCIA • Determinadas trajetórias visitarem uma determinada região um número k de vezes recorrência M
PADRÕES DE FREQUÊNCIAS • Grupos móveis (HWANG, 2005); • Padrão de co-localização (CAO, 2006); • Traclus (HAS, 2007); M
PADRÕES DE FREQUÊNCIAS: GRUPOS MÓVEIS • Os grupos considerados padrões são determinados através de uma distância mínima entre as trajetórias e um tempo mínimo; • Não é considerado a direção; • A determinação dos grupos pode ser feita através do algoritmo Apriori; M
PADRÕES DE FREQUÊNCIAS: CO-LOCALIZAÇÃO • São trajetórias que encontram-se espacialmente próximas; • Janela de tempo; • Movendo em conjunto; M
PADRÕES DE FREQUÊNCIAS: TRACLUS • TRACLUS – TrajectoryClustering; • Baseado em algoritmos de densidade; • Divide a trajetória em subgrupos com T de tamanho (parâmetro); • O agrupamento ocorre pela proximidade destes segmentos; • Interessante para estudo da trajetórias de furações • O tempo não é considerado M
Outlier: trajetória muito diferente das demais do conjunto. • Uso na identificação de carros ou pessoas com comportamento suspeito, fraude em cartão de crédito. • Vários métodos analisam a trajetória como um todo. MINERAÇÃO DE TRAJETÓRIAS: DETECÇÃO DE OUTLIERS G
Método descrito por Lee (2008) divide as trajetórias em subtrajetórias e as analisa comparativamente umas com as outras. • É o framework • Partition—and-Detect Ou Algoritmo TraOD MINERAÇÃO DE TRAJETÓRIAS: DETECÇÃO DE OUTLIERS G
Classificarobjetos de acordo com suastrajetórias e outrascaracterísticas. Reconhecimento de padrões. Muitoútilparaclassificação de navios, no controle de fronteiras, dapesca, poluição. Algunsmétodostambémanalisam a trajetóriacomo um todo. MINERAÇÃO DE TRAJETÓRIAS: CLASSIFICAÇÃO G
Método de Lee (2008) verificaquealgumascaracterísticastendem a aparecersomenteemdeterminadossegmentos. MINERAÇÃO DE TRAJETÓRIAS: CLASSIFICAÇÃO G
DuasFases: • Baseadanaregião (forma clusters) • Baseadanatrajetória (cluster portrajetória) MINERAÇÃO DE TRAJETÓRIAS: CLASSIFICAÇÃO G
Descreve movimentos frequentes, considerando regiões visitadas e a duração do movimento. • Útil para gerenciamento de tráfego em áreas urbanas. MINERAÇÃO DE TRAJETÓRIAS: PADRÕES SEQUENCIAIS G
Padrões de trajetórias = conjunto de trajetórias individuais que partilham a propriedade de visitar a mesma sequencia de lugares, com tempo de viagem semelhante. • Padrão a • Ticen-5min- praça XV -30min- Igreja Matriz • Padrão b • Ticen-5min-Beiramar-10min- UFSC MINERAÇÃO DE TRAJETÓRIAS: PADRÕES SEQUENCIAIS G
Primeiro as trajetórias são transformadas de pontos para regiões e com as regiões de interesse formadas, as trajetórias são novamente inseridas. MINERAÇÃO DE TRAJETÓRIAS: PADRÕES SEQUENCIAIS G
time • Após, é averiguado o tempo de percurso entre as regiões. MINERAÇÃO DE TRAJETÓRIAS: PADRÕES SEQUENCIAIS G
DATA MINING BASEADO EM TRAJETÓRIAS SEMÂNTICAS A IMPORTÂNCIA DE CONSIDERAR A SEMÂNTICA E
MODELO STOPS E MOVES • Primeiromodeloconceitualparatrajetórias • STOPS: partes importantes da trajetória do ponto de vista da aplicação, onde o objeto móvel é considerado parado por um intervalo de tempo • MOVES: parte da trajetória entre dois stops consecutivos ou entre um stop e o início/fim da trajetória. • Todas as partes da trajetória que não são stops, são definidos como moves. E
MODELO STOPS E MOVES • TRAJETÓRIAS SEMÂNTICAS SÃO UMA SEQUENCIA DE • STOPS AND MOVES • STOPS SÃO DEPENDENTES DA APLICAÇÃO E
IB-SMOT (Intersection-Based Stops and Moves of Trajectories) • CB-SMOT (Clustering-Based Stops and Moves of Trajectories) • DB-SMOT (DIRECTION-based Stops and Moves of Trajectories) Métodosparainstanciar o modelo de stops e moves e minerartrajetóriassemânticas E
IB-SMOT (Alvares, 2007) • STOPS: partes de uma trajetória que interceptam um objeto geográfico de interesse por um tempo mínimo • Objetos geográficos de interesse => candidatos a stops. • Candidato a stop: (Rc, ∆c) Rc é a geometria do objeto geográfico de interesse e ∆c é a duração mínima de tempo. E
IB-SMOT (Alvares, 2007) • Verifica para cada trajetória do conjunto de dados se há intersecção com os candidatos a stop em um tempo mínimo. E
IB-SMOT E
IB-SMOT: UTILIZAÇÃO • Interessante para aplicações de turismo: -Quais os pontos turísticos visitados por um turista? -Onde ele comeu? -Onde se hospedou? E
CB-SMOT (Palma, 2008) • Baseado em clusterização • Identifica partes da trajetória em que a velocidade do objeto móvel é menor do que no restante da trajetória, sendo considerada a média da velocidade no trecho. E
CB-SMOT: PARÂMETROS • minTime: tempo mínimo de uma subtrajetória com baixa velocidade para que seja um stop • maxAvgSpeed:velocidade média máxima de uma subtrajetória para ser considerada um cluster • maxSpeed:velocidade instantânea máxima aceitável dentro de um cluster E
CB-SMOT: IDÉIA GERAL Encontrar as partes (subtrajetórias) lentasdatrajetória • Parteslentas = com velocidademédiamenorque um certolimite • parâmetromaxAvgSpeed(relativo a velocidademédiadatrajetória) E
CB-SMOT: IDÉIA GERAL • Parteslentas tem queterumaduraçãomínima • ParâmetrominTime • Nãoqueremospontos de altavelocidade no cluster • ParâmetromaxSpeed(relativo a velocidademédiadatrajetória) E
CB-SMOT: PASSOS • Formação de clusters pelos pontos da trajetória onde a velocidade está abaixo da definida (calculada pelo valor passado multiplicado pela velocidade média) em um tempo mínimo • Intersecção dos clusters com os candidatos à stops E
CB-SMOT: PASSOS • Para cada intersecção, é verificada se a duração dessa respeitou o tempo mínimo definido para o objeto geográfico associado. Se respeitar, então será considerado um stop rotulado pelo nome do objeto geográfico, do contrário, será um stop desconhecido, definido como Unknownstop. • Verificar se dois ou mais stopsdesconhecidos se interceptam. Neste caso, terão o mesmo nome. E
CB-SMOT E
CB-SMOT: UTILIZAÇÃO • Interessante onde a velocidade é importante. • Exemplo de utilização é em trajetórias de tráfego urbano, para identificar regiões com congestionamento E
DB-SMOT (Manso, 2010) • Baseado em clusterização • Clusters sãoformadosporpartesdatrajetóriaemquehávariação de direção, a qualdeve ser maiorque um determinado valor, informadocomoparâmetro E
DB-SMOT: PARÂMETROS • minDC: variaçãomínimadadireção • minTime: duraçãomínima de umasubtrajetória com variaçãodadireçãopara ser considerada um stop • maxTol: tolerância, emnúmeromáximo de pontoscontíguossemgrandevariaçãodadireção, aceitávelem um cluster E
DB-SMOT: IDÉIA GERAL • Os clusters correspondem a partesdatrajetóriaemquehágrandevariaçãonadireção • Grande variação = variação de direçãonão inferior a um certolimite • parâmetrominDirChange E
DB-SMOT: IDÉIA GERAL • Cluster tem queterumaduraçãomínima • ParâmetrominTime • Tolerância, em número máximo de pontos contíguos sem grande variação da direção, aceitável em um cluster. • Parâmetro maxTol E