370 likes | 549 Views
Mineração de processos. Mineração de Dados – Trimestre 2009.1 Prof. Marcus Sampaio. Stéfani Pires. Agenda. O que é Mineração de Processos? Que logs são esses? Motivação Objetivos Log exemplo Tipos de conhecimento Perspectiva de processo/ organização / caso Algoritmo α
E N D
Mineração de processos Mineração de Dados – Trimestre 2009.1 Prof. Marcus Sampaio StéfaniPires
Agenda • O que é Mineração de Processos? • Que logs são esses? • Motivação • Objetivos • Log exemplo • Tipos de conhecimento • Perspectiva de processo/ organização / caso • Algoritmo α • Definições / Passos / Limitações • Técnica Heurística • ProM Framework
O que é mineração de Processos? 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework Extrairconhecimento de logs de eventosgravadospor um sistema de informação.
Que logs sãoesses? • Sistemas de informaçãoempresariaisarmazenameventosrelevantes de alguma forma estruturada. • Ex. de sistemas: • ERP (Enterprise Resource Planning) • Registramtodas as transações: Ex: preenchimento de formulários, alterações de documentos • CRM (Customer Relationship Management) • Registraminterações com osconsumidores • B2B (Business to Business) • Registramtrocas de mensagem entre partes; • WFM (Workflow Management) • Registram o inicio e conclusão de atividades 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Motivação • Os sistemas possuem modelos de processos (implícitos ou explícitos). • Oferecem liberdade em sua utilização • Ex: Um sistemas de informação hospitalar com diretrizes clínicas que descrevem o tratamento de uma doença específica. 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework Modelos de referênciadescrevemcomo as pessoas DEVEM trabalhar!
ObjetivosdaMineração de Processos • Relacionado a tendências de gestão (BPR (Business Process Reengineering), BI (Business Intelligence), KM (Knowledge Management) ) • O objetivo é entender o que realmente está acontecendo. • Process Discovery e Delta Analysis 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework É umatécnica de MONITORAMENTO de sistemas de informação.
ObjetivosdaMineração de Processos (2) • Delta Analysis – pode também ser usado para comparar diferentes departamentos/organizações que usam o mesmo sistema ERP. • Padrões interessantes podem ser encontrados em diferentes níveis: • Componentes de software • Processos de negócio • Organizações 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Log Exemplo(1) 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Log Exemplo(2) 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Tipo de Conhecimento a ser minerado 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework Perspectiva de Processo Perspectiva de Organização Perspectiva de Caso
Perspectiva de Processo • Foco no controle de fluxo • Expresso em uma Rede de Petri 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework COMO?
Perspectiva de Processo (2) • Exemplo Lógico • Atividade A é sempre sequida por B; • Atividade C e D podem ser executadas em paralelo; • Exemplo de Performance • O tempo médio de processamento da atividade A é 35 minutos; • Atividade A é executada para 80% dos casos; 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Perspectiva de Organização • Foco no executor da atividade • Construir Rede Social – transferência de trabalho entre pessoas 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework QUEM?
Perspectiva de Organização (2) • Estrutura Organizacional • Diagrama “Atividade-Função-Pessoa” 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Perspectiva de Organização (3) • Exemplo Lógico • John e Mary trabalham no mesmo time de desenvolvimento; • Pete é o admininstrador do departamento X; • Exemplo de Performance • John trabalha em média com 30 casos por dia; • Mary e Pete trabalham juntos em 50% dos casos; 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Perspectiva de Caso • Foco nas propriedades de um caso • Tenta estabelecer relações entre as propriedades de um caso • Requer campos adicionais com características dos casos. 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework O QUE?
Perspectiva de Caso (2) • Exemplo Lógico • Casos de mais de 5.000 euros são manipulados por John; • Atividade A é executada apenas para clientes particulares; • Exemplo de Performance • 80% dos casos de mais de 5.000 euros são concluídos em dois dias; • A média de tempo de conclusão de casos tratados por John e Mary é de duas semanas; 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - • Objetivo: Inferir a estrutura do processo; • Entrada: Log do sistema • Saída: Uma rede de Petri (P, T, F), onde: • P = conjunto de estados • T = conjunto de transições • F = conjunto de ligações (arcos) 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (2) • Entrada: 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (3) • Definições: • Seja T um conjunto de atividades: • W = {ABCD, ACBD, AED} • Para encontrar o modelo de processos, devem ser procuradas relações de dependência/causa no log de eventos 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (4) • . • Ex: • A>B, A>C, A>E, B>C, C>D, E>D, … • AB, AC, AE, BD, CD, ED • B || C, C || B 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (5) • Passos (8): 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework • Tw = {A, B, C, D, E} • Ti= {A} • To = {D}
̀ Algoritmo - (6) • Passos (8): 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (7) • Passos (8): 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
̀ Algoritmo - (8) • Como funciona: 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Exemplos 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Limitações do Algoritmo • Problemas lógicos (não abordadas aqui) • (atividades invisíveis, duplicadas, …) • Não sabe lidar com: • Ruídos • Atividades de baixa frequência • Sequência de baixa frequência • Exceções • Uma Solução: Técnicas heurísticas de mineração 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Técnicaheurística • Utiliza a frequênciacomométricaparaindicargrau de certezaque A B • Seja W um log de eventosem T, e a,b T • Observe que o valor darelaçãoestásempre entre -1 e 1 • Um valor alto indicamaiorconfiançanaexistenciadarelação AB 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Técnicaheurística (2) • Ex: • A >B aparece em 5 sequências e B>A em nenhuma: • AB = 5/6 = 0.833 • A >B aparece em 50 sequências e B>A em nenhuma: • AB = 50/51 = 0.980 • A >B aparece em 50 sequências e B>A aparece 1 vez (ruído): • AB = 49/52 = 0.94 • Como definir um limiar? 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Técnicaheurística (3) • Não é preciso um limiar, basta escolher o melhor candidato!!! • Ex: 27 eventos do log de ex. anterior + 3 ruídos: ABCED, AECBD, AD ) 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
Técnicaheurística (4) • Grafo de dependência, com a confiança de cada relação. • Técnica incompleta. 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
ProM Framework • www.processmining.org • Grátis e Open Source 1. O que é Miner. de Pro.? 2. Que logs sãoesses? 3. Motivação 4. Objetivos 5. Log exemplo 6. Tipos de conhecimento 6.1. P. de processo 6.2. P. de organização 6.3. P. de casos 7. Algoritmoα 7.1. Definições 7.2. Passos 7.3. Como funciona 7.4. Limitações 8. Técnicaheurística 9. ProM Framework
(OFF) Estudos de caso • Prefeitura: • Descobrir os caminhos de execução mais frequentes • Minerar processos e comparar com os modelos implantados • Empresa: • Objetivo: reduzir o período de teste dos scanners produzidos • Perguntas: • Como os testes então realmente sendo executados? • Os testes estão seguindo o modelo de referência? • Em que partes do processo de teste gasta-se mais tempo?
Perguntas? Mineração de Processos StéfaniPires