1 / 7

Mineração de dados

Mineração de dados. Dicas para a realização do Trabalho1. Dicas gerais. Para este trabalho, é melhor que os arquivos estejam no formato ARFF Para gerar um arquivo ARFF, pode-se abrir um arquivo compatível com o Weka, como o CSV, e salvar como ARFF, ou criar “a mão” o arquivo no formato ARFF.

zenda
Download Presentation

Mineração de dados

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mineração de dados Dicas para a realização do Trabalho1

  2. Dicas gerais • Para este trabalho, é melhor que os arquivos estejam no formato ARFF • Para gerar um arquivo ARFF, pode-se abrir um arquivo compatível com o Weka, como o CSV, e salvar como ARFF, ou criar “a mão” o arquivo no formato ARFF. • Quando se abre um arquivo CSV no Weka, o primeiro registro é usado para nomear as colunas (atributos)

  3. Salvar e utilizar o modelo de classificação Salvar: • executar o algoritmo de classificação (porexemplo, o J48) pararealizar o treinamento (geração do modelo) • Clique o botãodireitosobre o modeloquedeve ser salvo, naResults list • SelecioneSave model e salve o modelo. Carregar(o modelo salvo anteriormente) • Carregueos dados de testeusando a opçãoSupplied test set • Clique o botãodireitonaResults list, selecioneLoad model e escolha o modelo salvo paracarregar • SelecioneRe-evaluate model on current test set OBS: - o arquivo usado para teste deve conter os mesmos nomes de atributos e os mesmos tipos que o arquivo usado para gerar o modelo.

  4. Arquivo a ser entregue • O arquivo a ser entregue junto com o relatório do trabalho deve ser um arquivo texto, com uma só coluna, contendo a classe prevista (1 a 7), na mesma ordem do arquivo contest.txt.

  5. Geração do arquivo • Em Test options, clicar em More options , marcar Output predictions e desmarcar todas as demais opções. • O arquivo arff a ser gerado a partir de contest.txt deve ter as mesmas 4 colunas (atributos) que o treino.arff , com os mesmos nomes e tipos de atributo. A coluna correspondente à classe deve ser toda preenchida com o caractere ? • Carregue os dados contest.arff usando a opção Supplied test set e execute como visto anteriormente

  6. Formato do resultado da execução === Run information === Scheme: weka.classifiers.rules.ZeroR Relation: treino1-weka.filters.unsupervised.attribute.NumericToNominal-R4 Instances: 1500 Attributes: 4 att1 att2 att3 classe Test mode: user supplied test set: size unknown (reading incrementally) === Predictions on test set === inst#, actual, predicted, error, probability distribution 1 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 2 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 3 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 4 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 5 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 6 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098 .......... 1182 ? 3:3 + 0.127 0.084 *0.34 0.133 0.131 0.088 0.098

  7. Formato do arquivo a ser entregue 3 3 3 3 3 3 3 3 3 3 3 3 … 3 Arquivo texto que contém uma só coluna, com a classe prevista. Importante: a ordem dos registros deve ser a mesma do arquivo contest.txt fornecido e deve ter 1182 registros

More Related