280 likes | 377 Views
INF-103: Avaliação de Desempenho. Geração de Números Aleatórios. Carlos Alberto Kamienski ( cak@ufabc.edu.br ) UFABC. Motivação.
E N D
INF-103: Avaliação de Desempenho Geração de Números Aleatórios Carlos Alberto Kamienski (cak@ufabc.edu.br) UFABC
Motivação • Um dos principais passos para a realização de simulações e experimentações é a geração de valores aleatórios para algumas variáveis com alguma distribuição e probabilidade específica, como normal e exponencial • Procedimento composto de 2 passos • Gerar um número aleatório entre 0 e 1 (uniforme) • Transformar esse número em um valor que satisfaça a distribuição específica
Motivação • Algumas geradores de números aleatórios são melhores do que os outros • Como gerar números aleatórios para simulação/experimentação? • O que são números aleatórios adequados para simulação/experimentação? • Como funciona a geração de números aleatórios/experimentação?
Um gerador simples • O métodos mais comum é usar uma relação recursiva na qual o próximo número na seqüência é uma função do último número gerado (ou dos últimos dois números) • xn = f (xn-1, xn-2, ...) • Por exemplo • xn = 5 xn-1 + 1 mod 16 • Começando com x0 = 5 • x1= 5(5) + 1 mod 16 = 26 mod 16 = 10
Um gerador simples • Os primeiros 32 números obtidos através do procedimento acima são • 10, 3, 0, 1, 6, 15, 12, 13, 2, 11, 8, 9, 14, 7, 4, 5 10, 3, 0, 1, 6, 15, 12, 13, 2, 11, 8, 9, 14, 7, 4, 5 • Dividindo os xi por 16 • 0,6250; 0,1875; 0,0000; 0,0625; 0,3750, 0,9375; 0,7500; 0,8125; 0,1250; 0,6875; 0,5000; 0,5625; 0,8750; 0,4375; 0,2500; 0,3125; 0,6250; 0,1875; 0,0000; 0,0625; 0,3750, 0,9375; 0,7500; 0,8125; 0,1250; 0,6875; 0,5000; 0,5625; 0,8750; 0,4375; 0,2500; 0,3125
Terminologia • Semente • x0 = valor usado para iniciar a seqüência = 5 • Ciclo • Somente os 16 primeiros números são únicos • O 17º é igual ao primeiro • Dado um número, o próximo será sempre o mesmo • O tamanho do ciclo deste gerador é 16 • Cauda • Alguns geradores não repetem a parte inicial da seqüência de números, que é chamada de cauda • Período • O período do gerador é a soma do tamanho da cauda e o tamanho do ciclo
Números pseudo-aleatórios • A função f é determinística • Dada a mesma semente, a função f sempre gerará a mesma seqüência de números • Os números ainda podem ser considerados aleatórios porque passam em testes de aleatoriedade • Esses números são apenas parcialmente aleatórios • Em simulação, são preferíveis a números totalmente aleatórios porque é possível repetir os experimentos • Se um resultado diferente é necessário, é possível alterar a semente • Controle sobre a reprodutibilidade dos experimentos
Tipos de Geradores • Geradores congruo-lineares • Geradores de Tausworthe • Geradores de Fibonacci estendidos • Geradores combinados
Geradores congruo-lineares • Descobertos por D.H. Lehmer em 1951: Os resíduos de potências sucessivas de um número têm boas propriedades aleatórias. • xn = an mod m • Ou de forma equivalente, • xn = a.xn-1 mod m • a multiplicador • m módulo • Lehmer escolheu os seguintes valores: a = 23 e m = 108 Bom para o ENIAC: máquina com 8 dígitos decimais.
Geradores congruo-lineares • Generalizacão (atualmente em uso): xn = (a.xn-1 + b) mod m • Pode ser analisado utilizando a teoria das congruências • Geradores Congruo-Lineares Mistos • Geradores Congruo-Lineares (LCG) misto = possui tanto uma multiplicação por a como uma adicão de b
Seleção dos Parâmetros do LCG • a, b e m afetam o período e a autocorrelação • O módulo m deve ser grande • O período nunca será maior do que m • Para o cálculo ser eficiente, m deve ser potência de 2 • Assim, mod m pode ser obtido por truncamento • Se b é não-nulo, período máximo m será obtido se e só se: • Os inteiros m e b forem primos entre si. • Todo número primo que for um fator de m deve ser também um fator de a -1 • Se m for múltiplo de 4, a -1 também deve ser múltiplo de 4. • Essas condições são satisfeitas se m = 2k, a = 4c + 1 e b for ímpar • Onde, c,b e k são inteiros positivos
Correlação • Indica a força e a direção do relacionamento linear entre duas variáveis aleatórias • Correlação 1: correlação perfeita • Correlação -1: anti-correlação perfeita • Correlação 0: nenhuma correlação • Exemplos: • X={1,2,3,4,5}, Y={30,40,50,60,70}, correção = 1 • X={1,2,3,4,5}, Z={70,60,50,40,30}, correção = -1 • X={1,2,3,4,5}, W={1,10,1,10,1}, correção = 0 • X={1,2,3,4,5}, V={1,20,5,10,15}, correção = 0,3746749
Auto-Correlação • Medida que informa o quanto o valor de uma realização de uma variável aleatória é capaz de influenciar seus vizinhos • Descreve a correlação entre valores da variável em tempos diferentes • É uma ferramenta matemática usada para encontrar padrões que se repetem • Ex.: presença de um sinal periódico • Na geração de números aleatórios, demonstra aleatoriedade dos números
Auto-Correlação • X={1,2,3,4,5,6,7,8,9,10,1,2,3,4, 5,6,7,8,9,10,1,2,...}
Auto-Correlação • X= “1000 números: distribuição uniforme de 0 a 1”
Período x Auto-correlação • Um gerador que possua um período máximo é chamado de gerador de período completo • xn = (234 + 1) xn-1 + 1 mod 235 • xn = (218 + 1) xn-1 + 1 mod 235 • É preferível aquele que exibir baixa auto-correlação entre números sucessivos • Ambos os geradores têm o mesmo período completo, mas o primeiro tem uma correlação de 0,25 entre xn-1 e xn, enquanto que o segundo tem uma correlação desprezível de menos do que 2-18
Seleção dos Parâmetros 0.58 0.56 0.54 m = 231 – 1, a = 4, b = 1 0.52 Média Empírica 0.5 m = 482, a = 13, b = 14 0.48 m = 27, a = 26, b = 5 0.46 0.44 m = 9, a = 4,b= 1 0.42 0 500 1000 1500 2000 Tamanho da amostra
Recomendações para Escolha da Semente • Simulações com múltiplas seqüências: • necessitam de mais de uma cadeia de números aleatórios • Fila única = Duas cadeias • Intervalo entre chegadas e tempos de serviços aleatórios • Não usar zero • Pode ser usada com LCGs. Mas, LCGs multiplicativos ou um LCG de Tausworthe ficarão presos em zero • Evite valores pares. Para LCGs multiplicativos com módulo m = 2k, a semente deve ser ímpar * É melhor evitar geradores que possuam muitas restrições sobre os valores das sementes ou cujo desempenho (período e aleatoriedade) dependam do valor da semente
Recomendações para Escolha da Semente • 3. Não subdivida uma cadeia. Não gere sementes sucessivas: u1 para gerar intervalos entre chegadas, u2 para gerar o tempo de serviço implica em Forte correlação • 4. Use cadeias que não se superponham. Superposição Correlação. Ex.: Mesma raiz implica na mesma cadeia • 5. Reutilize sementes em replicações sucessivas. • 6.Não utilize sementes aleatórias tais como a hora do dia: Não dá para garantir ausência de superposição
Mitos Sobre a Geração deNúmeros Aleatórios • Um conjunto complexo de operações leva a resultados aleatórios • É melhor usar operações simples que possam ser avaliadas analiticamente quanto à sua aleatoriedade • Um teste simples, como o teste do qui-quadrado, é suficiente para testar a qualidade de um gerador de números aleatórios. A seqüência 0, 1, 2, ...m-1 passa no teste do qui-quadrado com uma boa nota, mas falharia num teste de execução. Use tantos testes quantos forem possíveis
Mitos Sobre a Geração deNúmeros Aleatórios • Números aleatórios são imprevisíveis. É fácil obter os parâmetros a,c e m a partir de alguns números. Isso implica em LCGs serem inadequados para aplicações de criptografia
Mitos Sobre a Geração deNúmeros Aleatórios • 4. Algumas sementes são melhores do que outras. • xn = (9806 xn-1 + 1) mod (217 _ 1) • Funciona corretamente para todas as sementes exceto x0 = 37911 • Fica preso em xn = 37911 para sempre • Geradores deste tipo devem ser evitados. • Qualquer semente diferente de zero na faixa válida deveria produzir seqüências de igual qualidade. • Para alguns a semente deve ser ímpar. • Geradores cujo período ou aleatoriedade dependam da semente não devem ser usadas, dado que um usuário desavisado pode não se lembrar de seguir todas as diretrizes.
Geração de Valores para Variáveis Aleatórias (diferentes de U(0,1)) • Seja F(x) a distribuição acumulada da função X • A inversa da função F • Gerar X como • Exemplo: Exponencial
INF-103: Avaliação de Desempenho Geração de Números Aleatórios Carlos Alberto Kamienski (cak@ufabc.edu.br) UFABC