1 / 34

Experimentación Numérica

Experimentación Numérica. Antiplagium. Integrantes. Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado. Agenda. Objetivo de la Experimentación Selección del Método Experimental Hipótesis Ejecución del Experimento Resultados Conclusiones.

gerda
Download Presentation

Experimentación Numérica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Experimentación Numérica Antiplagium

  2. Integrantes Piere Cordero Patricia Natividad Gustavo Barrenechea Renzo Gómez Kim Alvarado

  3. Agenda Objetivo de la Experimentación Selección del Método Experimental Hipótesis Ejecución del Experimento Resultados Conclusiones

  4. Objetivo de la Experimentación

  5. Objetivo Encontrar el algoritmo más eficiente para la detección de plagio de documentos. Comparar dos algoritmos según tiempo de ejecución y porcentaje de plagio.

  6. Algoritmos a Comparar Secuencia de Maximales Lenguaje Natural

  7. Factores Experimentales Los factores elegidos para el análisis son: • El número de comparaciones entre documentos. • El tamaño de los documentos

  8. Variables de Respuesta El porcentaje de plagio de un documento contra los documentos de la base de datos. El tiempo de ejecución del algoritmo de detección de plagio.

  9. Selección del Método Experimental

  10. Método Experimental Se utilizará el estadístico T-Student. Análisis con la distribución Normal. Análisis de las medias con desviación estándar conocidas

  11. Criterios de evaluación Media muestralµ Varianza muestral δ2

  12. T-student Sirve para comparar medias de muestras independientes. Su objetivo es demostrar por hipótesis una muestra es mejor que otra. Trabaja con la media y la varianza. Requiere saber si las varianzas son iguales o no.

  13. T-student Alpha: Grado de confianza o de certeza. Utilizaremos 95% como grado de certeza. C: Punto crítico que separa la región a rechazar y la región de aceptación.

  14. T-student Sean: Si: Varianza muestral del algoritmo i g.l.: Grados de libertad (n1+n2-2) y la fórmula para hallar el estadístico t:

  15. Hipótesis

  16. Hipótesis para el tiempo de ejecución H0: X1 < X2 : "Secuencia de Maximales requiere un mayor tiempo de ejecución que Lenguaje Natural“ H1: X1 >= X2: " Lenguaje Natural requiere un mayor tiempo de ejecución que Secuencia Maximales ” Siendo: X1: Media de tiempo de ejecución de Lenguaje Natural. X2: Media de tiempo de ejecución de Secuencia Maximales.

  17. Hipótesis para el porcentaje de plagio H0: X1 < X2 : "Secuencia de Maximales detecta mayor porcentaje de plagio que Lenguaje Natural“ H1: X1 >= X2: " Lenguaje Natural detecta mayor porcentaje de plagio que Secuencia Maximales ” Siendo: X1: Media de porcentaje de Lenguaje Natural. X2: Media de porcentaje de plagio de Secuencia Maximales.

  18. Ejecución del Experimento

  19. Muestra de ejecución Datos Utilizados. Ejecución del algoritmo Secuencia Maximales. Ejecución del algoritmo Lenguaje Natural.

  20. Datos utilizados 50 documentos de extensión .txt que serán comparados cada uno contra la los 49 restantes.

  21. Ejecución del Experimento

  22. Para los tiempo de ejecución

  23. Para los tiempo de ejecución

  24. Comparación de tiempo de ejecución

  25. Para el porcentaje de detección de plagio

  26. Para el porcentaje de detección de plagio

  27. Comparación de porcentaje de detección de plagio

  28. Resultados

  29. Resultados para el tiempo de ejecución t = -8.7274 Rechazo Ho Si t > 1.9845 "Como t = -8.7274 < 1.9845 se acepta Ho"

  30. Resultados para porcentaje de plagio t = -2.7371 Rechazo Ho Si t > 1.9845 "Como t = -2.731 < 1.9845 se acepta Ho"

  31. Conclusiones

  32. Conclusiones Se acepta la Hipótesis nula para el tiempo de ejecución, es decir el algoritmo de Secuencias Maximales requiere de un mayor tiempo de ejecución que el algoritmo Lenguaje Natural Se acepta la Hipótesis nula para el porcentaje de detección de plagio, es decir el algoritmo de Secuencias Maximales detecta mayor porcentaje de plagio frente al algoritmo de Lenguaje Natural.

  33. Bibliografía

  34. Bibliografía Estadística Descriptiva e Inferencial Córdova Zamora, Manuel (2003)

More Related