420 likes | 861 Views
Informacion sobre la mineria de datos.<br>Asociada a una base de datos
E N D
Minería de datos Integrantes: Alexis Venegas Bryan Alarcón Pedro Pizarro Docente: Mario Ramirez
Contenidos ¿Qué es la Minería de Datos? • Técnicas de Minería de Datos • Ejemplo de usos de la Minería de Datos • Herramientas de Software • Conclusión
¿Qué es la Minería de Datos? “Proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos”
Existen términos que se utilizan frecuentemente como sinónimos de la minería de datos. Uno de ellos se conoce como "análisis (inteligente) de datos", que suele hacer un mayor hincapié en las técnicas de análisis estadístico. El KDD es la extracción automatizada de conocimiento o patrones interesantes, previamente desconocidos y potencialmente útiles de grandes Bases de Datos.
Tipos de base de datos OLTP: son sistema de bases de datos orientadas al procesamiento de transacciones, el acceso a los datos esta optimizado para uso frecuente de lectura y escritura. OLAP: Son sistemas de bases de datos orientadas al procesamiento analítico, el acceso suele ser de solo lectura. Data WareHouse: es un almacén de recolección de datos orientada a un ámbito determinado, no es volátil y puede variar en el tiempo.
Etapas de la minería de datos • Determinación de los objetivos: establece los límites de los objetivos que el cliente desea. • Pre-procesamiento de datos: es la selección, limpieza, reducción y transformación de Bases de Datos. • Determinación del modelo: se inicia con un análisis estadístico de los datos y crea una visualización grafica para tener una aproximación a los datos. • Análisis de los resultados: verifica si los resultados obtenidos son coherentes y compara los datos obtenidos con gráficos que ayudan al cliente a tomar una decisión.
Técnicas de Minería de Datos • Redes Neuronales: se tratan de un sistema de interconexión de neuronas en una red que colaboran para producir una salida. • Perceptron: es un discriminador lineal, es capas de generar un criterio para la selección de un sub-grupo de un grupo de un componente mas grande.
Técnicas de Minería de Datos • Perceptron Multicapa: red neuronal de varias capas, se usa para llegar a una salida por varios caminos
Técnicas de Minería de Datos • Regresión Lineal: utilizada para formar relaciones entre datos, puede ser rápida y eficaz, pero no es eficiente para relaciones de 2 o más variables.
Técnicas de Minería de Datos • Arboles de Decisión: se utiliza en métodos por inteligencia artificial y análisis predicativo, representa condiciones y categoriza una seria de condiciones que ocurren de forma sucesiva
Técnicas de Minería de Datos • Modelos Estadísticos: expresión variable en forma de igualdad, se emplea en diseños experimentales para señalar factores diferentes que puedan modificar a una respuesta. • Agrupamiento: es una agrupación de una serie de vectores según criterios de distancia, dispone los vectores de entrada de forma que puedan estar mas cercanos
Técnicas de Minería de Datos • Reglas de asociación: se usa para descubrir hechos dentro de un conjunto de datos • Se pueden clasificar de dos formas: Algoritmos supervisados y no supervisados • Algoritmos supervisados: predicen un dato op un conjunto de datos, estos son desconocidos a partir de uno conocido • Algoritmos no supervisados: predicen o analizan patrones y tendencias de los datos
Ejemplos de uso de Minería de Datos • Negocios: La minería de Datos se usa en Negocios, mediante estadísticas de los datos, percibir a clientes con una mayor posibilidad de responder a una oferta. • Contratación de personal: identifica características de sus empleados de mas éxito, además ayuda a obtener información para contratar personal centrándose en sus empleados. • Comportamiento en Internet: se usa para ofrecer propaganda de acuerdo a preferencias de los usuarios al comprar un producto, y ofrecer otro producto de similares características al cliente
Herramientas de Software de Minería de Datos • Orange: Programa de Licenciamiento Libre, permite la minería de datos y realizar análisis de datos, desarrollada en C++, implementa algoritmos de minería de datos, operaciones de procesamiento y representación grafica, disponible para Linux, Mac y Windows
Herramientas de Software de Minería de Datos • RapidMiner: Software de Licenciamiento libre, el cual tiene un aprendizaje automático y para minería de datos, mediante el encadenamiento de operadores en un entorno grafico.
Herramientas de Software de Minería de Datos • KNIME: Software de licenciamiento gratuito, programado en lenguaje Java, desarrollado por el departamento de Bioinformática de La Universidad de Constanza, Alemania, se basa en diseño de un flujo de ejecución que muestre las distintas etapas en un proyecto de minería de datos
Conclusión • Las Técnicas de Minerías de datos nos permiten investigar mas a fondo en un conjuntos de datos, descubrir patrones en el tiempo, en cualquier contexto y poder extraer información de este proceso, además, existen herramientas que nos ayudan a permitir investigar mas allá en los datos que podemos observar, estos cuentan con aprendizaje automático, permite hacer análisis predictivos de datos, usados en distintas áreas, como publicidad, ciencia, informática, etc.