Nuestra edad de información moderna conduce al crecimiento dinámico y extremadamente alto del mundo de la minería de datos. Sin duda, que requiere diferentes tipos adecuados y efectivos de métodos de análisis de datos, técnicas y herramientas que pueden responder al aumento constante de las necesidades de investigación empresarial.
De hecho, la minería de datos no tiene sus propios métodos de análisis de datos. Utiliza las metodologías y técnicas de otras áreas relacionadas de la ciencia.
Entre los métodos utilizados en el análisis de pequeños y big data están:
- Técnicas matemáticas y estadísticas
- Métodos basados en inteligencia artificial, aprendizaje automático
- Visualización y método y herramientas gráficas
Aquí veremos una lista de los tipos clásicos y modernos de métodos y modelos de análisis de datos más conocidos.
Métodos matemáticos y estadísticos para el análisis de datos
Las ciencias matemáticas y estadísticas tienen mucho que dar a la gestión y análisis de la minería de datos. De hecho, la mayoría de las técnicas de minería de datos son herramientas de análisis de datos estadísticos. Algunos métodos y técnicas son bien conocidos y muy efectivos.
El análisis descriptivo es una idea del pasado. Esta técnica estadística hace exactamente lo que sugiere: «Describe». Analiza los datos y analiza eventos y situaciones pasadas para tener una idea de cómo abordar el futuro.
Nos permite aprender de los comportamientos pasados y descubrir cómo podrían influir en el rendimiento futuro.
El análisis de regresión permite modelar la relación entre una variable dependiente y una o más variables independientes. En la minería de datos, esta técnica se utiliza para predecir los valores, dado un conjunto de datos particular. Por ejemplo, la regresión podría usarse para predecir el precio de un producto, al tener en cuenta otras variables.
¿Qué es la metodología de análisis?
La metodología de análisis presentada en este y el capítulo anterior para recomendar las decisiones se denomina análisis de decisión normativo porque la metodología prescribe cómo las personas deben tomar decisiones en lugar de describir cómo las personas toman decisiones. En 1954, L. Jimmie Savage desarrolló axiomas con respecto a las preferencias y creencias de un individuo. Si un individuo acepta estos axiomas, Savage demostró que el individuo debe preferir las decisiones obtenidas utilizando el análisis de decisión. Tversky y Kahneman [1981] realizaron una serie de estudios que muestran que los individuos no toman decisiones consistentes con la metodología del análisis de decisiones. Es decir, sus estudios indican que el análisis de la decisión no es una teoría descriptiva. Kahneman y Tversky [1979] desarrollaron la teoría de la perspectiva para describir cómo las personas realmente toman decisiones cuando no se guían por el análisis de decisiones. En 2002, Dan Kahneman ganó el Premio Nobel de Economía por este esfuerzo. Una teoría descriptiva alternativa de la toma de decisiones es la teoría del arrepentimiento [Bell, 1982].
La metodología TFBA permite no solo predecir distribuciones de flujo termodinámicamente factibles, sino también reducir su rango de flujo, y calcular el rango de concentraciones de metabolitos. Debido a la naturaleza no lineal de TFBA, predice un óptimo local en lugar del global. Las posibles soluciones incluyen el uso de múltiples reinicios, la explotación de metodologías estocásticas o técnicas de optimización global. La estimación de una distribución de flujo factible termodinámico es el primer paso para evaluar los efectos de los cambios ambientales (t, pH, I) en la producción de succinato, así como la identificación de posibles objetivos de modificación genética destinadas a mejorar el rendimiento de succinato. El segundo paso es el cálculo de los coeficientes de control metabólico que utiliza los límites más apretados del análisis termodinámico para dar predicciones más precisas de los pasos/reacciones/enzimas más importantes. Los resultados de este análisis muestran que solo un pequeño número de pasos tienen un sesgo de control significativo y, por lo tanto, son buenos objetivos para modificar la red para mejorar la producción de ácido succínico. Dado que las vías que conducen hacia el ácido succínico requieren CO2, es quizás obvio que el paso que elimina el CO2 de la célula tendría un efecto negativo. Además, también se muestra que el paso que convierte el piruvato en acetil-CoA y el formato es un paso clave que debe inhibirse para mejorar la producción de ácido succínico, redirigiendo el flujo lejos de los otros subproductos. Mejorar los pasos que muestran un sesgo de control positivo, incluida la absorción de glicerol y los pasos que evitan la vía pentosa-fosfato, también tendrá un resultado beneficioso.
Para estudiar más a fondo esta red también consideraremos en el futuro diferentes condiciones ambientales y su efecto sobre los flujos, reversibilidades y el control del sistema.
Se ha implementado una metodología de análisis de estimabilidad basada en un procedimiento secuencial de ortogonalización para distinguir los parámetros potencialmente estimables de las mediciones experimentales. Gracias a este enfoque, 21 parámetros del más influyente y los menos correlacionados han sido seleccionados de los 49 parámetros del modelo. Estos parámetros se identificaron utilizando los datos experimentales disponibles. Luego se validó el modelo y se logró un buen acuerdo entre las predicciones del modelo y las mediciones.
Artículos Relacionados:
