El libro "Investigación cualitativa. Aplicación de métodos mixtos y de técnicas de minería de datos", es un material de apoyo para el profesor y el estudiante universitario en materias de investigación cualitativa, metodología observacional mixta y minería de datos. Esta obra incluye las últimas técnicas tanto en procedimientos de investigación cualitativa como en el uso de softwares para el análisis de los resultados. También, la obra proporciona ejemplos prácticos de utilización de ambos recursos. La aplicación de este tipo de técnicas a la investigación en el ámbito educativo y la salud está revolucionando las prácticas de observación y de tratamiento de los datos por lo que la utilización de este manual puede ser de gran ayuda al lector interesado en esta temática.
En este libro se introducen los conceptos fundamentales de la minería de datos (data mining) y del aprendizaje automático (machine learning). El lector podrá encontrar una revisión completa de las técnicas avanzadas más usadas en estos campos con un enfoque claramente descriptivo para que entienda los conceptos e ideas básicos ocultos detrás de cada algoritmo o técnica. Las páginas de este libro abordan desde las etapas previas de preparación de los datos ?los métodos de reducción de la dimensionalidad y extracción de características (PCA, SVD, NNMF), métodos de aprendizaje no supervisado (agrupamiento jerárquico, k-means, canopy), métodos de aprendizaje supervisado (k-NN, SVM, redes neuronales, árboles de decisión, métodos probabilísticos)?, hasta los diferentes métodos de combinación de clasificadores.
La Minería de Datos es uno de los términos que más de moda están dentro de las ciencias de la computación, y consiste en analizar e interpretar de forma automática comportamientos, patrones, tendencias, asociaciones, predicciones y otras características del conocimiento inmerso en los datos. Las grandes cantidades de datos de que disponemos en la actualidad nos obligan a extraer de un modo automatizado la información clave contenida en ellos. Para lograrlo, utilizamos herramientas informáticas que soportan técnicas especializadas, estas técnicas constituyen la Minería de datos. Con la ayuda de este libro, a través de ejemplos totalmente resueltos, el lector profundizará en el descubrimiento e interpretación de la información contenida en grandes conjuntos de datos. Se trata de exponer con sencillez y mediante una metodología interactiva los conceptos de minería de datos e inteligencia de negocios. Asimismo, este libro analiza las herramientas más habituales y las posibilidades que ofrecen SAS, SAS Enterprise Guide, SAS Enterprise Miner, IBM SPSS e IBM SPSS Modeler.
La minería de datos es una práctica de análisis que permite obtener un determinado conocimiento a partir de la información extraída de una base de datos. El objetivo del presente libro es instruir al lector en esta disciplina y guiarlo en el desarrollo de modelos descriptivos y predictivos que faciliten la toma de decisiones en una organización, a partir de la herramienta SPSS Clementine, uno de los programas más usados hoy en día para ese fin. Entre los principales temas abordados en esta obra se hallan la metodología y las técnicas de este campo, las características de SPSS Clementine, las opciones de su interfaz y los pasos para su instalación. Además de ello, se proponen veinte casos prácticos que son resueltos de manera didáctica con técnicas como los árboles de decisión, las redes neuronales, los clústeres, las series temporales, las reglas de asociación y dependencia, la validación de datos erróneos, y la integración y partición de datos. Este libro está dirigido a todos aquellos que necesiten efectuar decisiones a partir del análisis de grandes bases de datos. Por tal motivo, representa un aporte valioso para los estudiantes y profesionales de las carreras de Ingeniería de Sistemas,Ingeniería Industrial, Estadística, Administración de Empresas, Marketing, Medicina, Educación, entre otras.
La minería de datos es una práctica de análisis que permite obtener un determinado conocimiento a partir de la información extraída de una base de datos. El objetivo del presente libro es instruir al lector en esta disciplina y guiarlo en el desarrollo de modelos descriptivos y predictivos que faciliten la toma de decisiones en una organización, a partir de la herramienta SPSS Clementine, uno de los programas más usados hoy en día para ese fin. Entre los principales temas abordados en esta obra se hallan la metodología y las técnicas de este campo, las características de SPSS Clementine, las opciones de su interfaz y los pasos para su instalación. Además de ello, se proponen veinte casos prácticos que son resueltos de manera didáctica con técnicas como los árboles de decisión, las redes neuronales, los clústeres, las series temporales, las reglas de asociación y dependencia, la validación de datos erróneos, y la integración y partición de datos. Este libro está dirigido a todos aquellos que necesiten efectuar decisiones a partir del análisis de grandes bases de datos. Por tal motivo, representa un aporte valioso para los estudiantes y profesionales de las carreras de Ingeniería de Sistemas, Ingeniería Industrial, Estadística, Administración de Empresas, Marketing, Medicina, Educación, entre otras.
La incorporación de la semántica temporal en las técnicas de minería de datos tradicionales ha dado lugar a la creación de una nueva disciplina denominada Minería de Datos Temporales". Esta incorporación es especialmente necesaria cuando el objetivo consiste en obtener conocimiento útil en dominios dinámicos, cuya naturaleza es variable en el tiempo. Sin embargo, este proceso da lugar a un problema de gran complejidad y, por lo tanto, su solución presenta mayores desafíos computacionales que las técnicas de minería de datos no temporales. Basado en el esquema intertransaccional, en esta tesis se propone un algoritmo denominado TSET Miner para la minería de secuencias frecuentes a partir de conjuntos de datos transaccionales y relacionales. La principal aportación de esta propuesta consiste en la utilización de una única estructura de datos arborescente, llamada TSET, para la generación y almacenamiento de todas las secuencias (asociaciones temporales) extraídas en el proceso de minería de datos. Dada la versatilidad asociada al uso de una única estructura de datos, en esta tesis se propone también un conjunto de algoritmos basados en el uso de TSET que mejoran en eficiencia al original y amplían su uso en nuevos dominios de aplicación, permitiendo extraer un nuevo tipo de patrón temporal denominado patrón secuencial. El resultado es la familia de algoritmos denominada TSET Miner, actualmente compuesta por TSETmax; TSETfuzzy; TSETiterative; TSETsequential Miner. Uno de los principales problemas asociados con las técnicas asociacionistas de minería es el gran número de patrones que se suelen extraer, incluso si se tratan de conjuntos de datos de tamaño mediano. Esto implica que el proceso de evaluación e interpretación sea prácticamente inabordable por los expertos del dominio. Una solución a este problema consiste en la aplicación de técnicas de minería de segundo orden, cuyo objetivo consiste en obtener un modelo global o conjunto de patrones que muestren de forma compacta y con mayor nivel de abstracción la información temporal presente en el conjunto de secuencias frecuentes. En esta tesis se propone la obtención de un tipo de patrón temporal basado en un modelo de redes de restricciones propuesta por Dubois y cols. [36]. Cada restricción muestra la relación temporal incierta entre parejas de eventos y se denota como un vector compuesto por tres valores de posibilidad que expresan el grado de plausibilidad relativo de cada una de las relaciones temporales básicas entre dos instantes de tiempo, es decir, antes", en el mismo instante" y después". El método propuesto se basa en la Teoría de la Evidencia de Shafer [134] como herramienta matemática para la obtención de los grados de posibilidad de los patrones a partir del valor de frecuencia de las secuencias que lo forman. Relativo al campo de aplicación, el dominio en el que se han realizado los experimentos ha sido el denominado Cuidados Intensivos", perteneciente al dominio de la medicina. Este dominio de aplicación, además de poseer una gran complejidad conceptual, es de naturaleza dinámica y variable. En esta tesis se ha estudiado la aplicación de las técnicas de minería propuestas en conjuntos de datos pertenecientes a dos problemas de distinta naturaleza. Los resultados obtenidos muestran la validez de las técnicas en este tipo de dominios, estableciendo la solución como punto de partida prometedor para la obtención de aplicaciones inteligentes de análisis de datos y de ayuda al diagnóstico temporal.
La Red Temática de Álgebra Lineal, Análisis Matricial y Aplicaciones (ALAMA) celebra cada dos años (desde 2008). Los encuentros ALAMA tienen el objetivo de reunir a los investigadores cuyo trabajo esté relacionado con el álgebra lineal, el análisis matricial y sus posibles aplicaciones sobre teoría de control, criptografía y teoría de códigos, teoría de grafos, álgebra polinomial numérica, polinomios ortogonales, procesamiento de señales e imágenes, optimización, estadística, informática, minería de datos, estructura y mecánica de vibraciones, ingeniería, física, química, biología, medicina... Este libro recoge las actas del congreso celebrado en mayo-junio de 2018 en la Universidad de Alicante.