Un banco está interesado en saber qué clientes probablemente pueden incumplir los pagos de préstamos. El banco también está interesado en saber qué características de los clientes pueden explicar el comportamiento de pago de su préstamo. Un anunciante está interesado en elegir el conjunto de clientes o prospectos que tienen más probabilidades de responder a una campaña de correo directo. El anunciante también está interesado en saber qué características de los consumidores tienen más probabilidades de explicar la capacidad de respuesta a la campaña. Un gerente de adquisiciones está interesado en saber qué pedidos probablemente se retrasarán, en función del comportamiento reciente de los proveedores. Un inversor está interesado en saber qué activos tienen más probabilidades de aumentar de valor.
Las técnicas de clasificación (o categorización) son útiles para ayudar a responder tales preguntas. Ayudan a predecir la membresía del grupo (o clase, por lo tanto, llamadas técnicas de clasificación) de individuos (datos), para membresías de grupo predefinidas (por ejemplo, «éxito» versus «falla» para la clasificación binaria, el enfoque de esta nota), y también para describir cuál Las características de los individuos pueden predecir su membresía grupal. Los ejemplos de membresías/clases del grupo podrían ser: (1) clientes leales versus clientes que se convertirán; (2) clientes sensibles al alto precio versus bajo precio sensible al precio; (3) clientes satisfechos versus insatisfechos; (4) compradores versus no compatientes; (5) activos que aumentan en el valor versus no; (6) Los productos que pueden ser buenas recomendaciones para un cliente versus no, etc. Las características que son útiles para clasificar individuos/datos en grupos/clases predefinidos podrían incluir, por ejemplo (1) demografía; (2) psicografía; (3) comportamiento pasado; (4) Actitudes hacia productos específicos, (5) datos de redes sociales, etc.
Existen muchas técnicas para resolver problemas de clasificación: árboles de clasificación, regresión logística, análisis discriminante, redes neuronales, árboles impulsados, bosques aleatorios, métodos de aprendizaje profundo, vecinos más cercanos, máquinas de vectores de apoyo, etc. (por ejemplo, consulte el paquete R «E1071» para más métodos de ejemplo). También hay muchos paquetes R para todo lo desarrollado en el pasado, incluidos los métodos «de moda» en el aprendizaje profundo, vea varias noticias aquí o aquí o aquí, por ejemplo. Microsoft también tiene una gran colección de métodos que desarrollan. En este informe, por simplicidad nos centramos en los dos primeros, aunque siempre uno puede usar algunos de los otros métodos en lugar de los discutidos aquí. El enfoque de esta nota no es explicar ningún método específico de clasificación («cuadro negro, matemático»), sino para describir un proceso para la clasificación independiente del método utilizado (por ejemplo, independiente del método seleccionado en uno de los pasos en el proceso descrito abajo).
Una pregunta importante al usar métodos de clasificación es evaluar el rendimiento relativo de todos los métodos/modelos disponibles, es decir, para usar el mejor de acuerdo con nuestros criterios. Para este propósito, existen métricas de evaluación de clasificación de rendimiento estándar, que discutimos a continuación: este es un enfoque clave de esta nota.
Una empresa de navegación se había convertido en víctima de la crisis en la industria de la navegación. El problema comercial del estudio de caso de «barco», aunque hipotético, representa muy bien el tipo de problemas comerciales que enfrentan muchas compañías reales en un entorno empresarial cada vez más intensivo de datos. El equipo de gestión ahora estaba explorando varias opciones de crecimiento. Expandirse aún más en algunos mercados, en particular América del Norte, ya no era algo a considerar en el futuro lejano. Se estaba convirtiendo en una necesidad inmediata.
El equipo creía que para desarrollar una estrategia para América del Norte, necesitaban una mejor comprensión de sus clientes actuales y potenciales en ese mercado. Creían que tenían que construir barcos más específicos para sus segmentos más importantes allí. Para ese propósito, la compañía de navegación había encargado un proyecto para ese mercado. Al ser una empresa amigable para los datos, se tomó la decisión de desarrollar una comprensión de sus clientes de manera basada en datos.
¿Cómo se clasifican las técnicas de investigación?
Dado que las empresas tienen que tomar decisiones bien fundadas, los gerentes de marketing deben averiguar qué necesitan saber para desarrollar objetivos de marketing, seleccionar un mercado objetivo, posicionarlo (o posicionarlo o posicionarlo) y desarrollar productos, precio , Estrategias de publicidad y colocación. Necesita información para esto. Para poder tomar buenas decisiones, los gerentes de marketing deben tener información que sea exactamente, actual y relevante. Para comprender estas necesidades, primero debe realizar investigaciones de mercado para identificarlas. Por lo general, la investigación de marketing es un proceso continuo, una serie de pasos que hacen que los gerentes de marketing sean repetidamente para aprender algo sobre el mercado. Una empresa puede llevar a cabo una investigación misma o comisionar a otra compañía para implementarla. La gerencia debe estar informada para poder tomar decisiones.
Un proceso de investigación generalmente tiene siete fases (Solomon et al. 2017):
Un problema se relaciona con las preguntas generales para las cuales la empresa necesita respuestas. Hay tres preguntas por responder.
¿Cuál es el objetivo de investigación y qué preguntas deben responder la investigación? El triángulo estratégico se puede utilizar para analizar la situación si el problema no es visible directamente de la empresa. Por ejemplo, podría estar claro que las ventas de la compañía están disminuyendo. El análisis de fortalezas y debilidades y el análisis del margen de contribución muestran, por ejemplo, que el programa de ventas de la compañía está desactualizado. Esta fase generalmente termina con la necesidad de más información (a través de la investigación de mercado) para crear un nuevo concepto con el contenido del contenido, las estrategias y las medidas. El vínculo entre el triángulo estratégico (Figura 1) y la pirámide conceptual consiste en información sobre los tres puntos clave del triángulo estratégico y el análisis y el reenvío de la información relevante para la creación de un nuevo concepto corporativo (Ganser 2014a).
¿Cuál es la clasificación de las técnicas?
El método de clasificación examina las características de un conjunto de datos en el que un resultado particular era común (por ejemplo, los clientes que recibieron y redimieron un cierto descuento). Luego busca en un conjunto de datos más grande para esas características similares para ver qué puntos de datos tienen más probabilidades de reflejar esa conclusión (por ejemplo, qué clientes probablemente canjearán un cierto descuento si se les da). Los modelos de clasificación pueden ayudar a las empresas a un mejor presupuesto, tomar mejores decisiones comerciales y estimar el retorno de la inversión (ROI).
Los árboles de decisión son métodos utilizados en la minería de datos al ejecutar modelos de clasificación o regresión. Son un subconjunto de aprendizaje automático. Se pueden hacer preguntas simples de sí o no sobre puntos de datos para clasificarlos y proporcionar información útil. Las instituciones financieras, por ejemplo, pueden usar un árbol de decisión para determinar la elegibilidad de préstamo exitosa basada en datos categóricos pertinentes, como el umbral de ingresos, la duración de la cuenta, el porcentaje de crédito utilizado y el puntaje de crédito. A continuación se explican muchas técnicas de clasificación en la minería de datos.
El análisis de datos puede ser una tarea gigantesca sin el conjunto correcto de herramientas. La plataforma automatizada de HEVO le permite todo lo que necesita tener para una experiencia de replicación de datos sin problemas. ¡Nuestra plataforma tiene lo siguiente en la tienda para usted!
- Transformaciones de datos: el mejor soporte nativo de clase y flexible para código complejo y transformación de datos sin código a la punta de todos.
- Soporte en vivo: el equipo HEVO está disponible durante todo el día para extender un soporte excepcional a sus clientes a través de llamadas de chat, correo electrónico y soporte.
- Configuración rápida: HEVO con sus funciones automatizadas, se puede configurar en un tiempo mínimo. Además, con su IU simple e interactiva, es extremadamente fácil para los nuevos clientes trabajar y realizar operaciones.
- Mapeo de esquemas automáticos: HEVO elimina la tediosa tarea de la gestión del esquema y detecta automáticamente el formato de Data Intering y la replica al esquema de destino. También puede elegir entre asignaciones completas e incrementales para adaptarse a sus requisitos de replicación de datos.
Cuando se trata de clasificar grandes cantidades de datos, la clasificación es una de las técnicas más empleadas. Esta técnica de análisis de datos incorpora algoritmos de aprendizaje supervisados que se adaptan a la calidad de los datos. Aquí hay algunas técnicas de clasificación en la minería de datos:
Las técnicas de clasificación en la minería de datos, como los árboles de decisión, son las más recientes.
¿Cómo se clasifican las técnicas de investigación documental?
La búsqueda de información coloca una serie completa de procesos cognitivos para el usuario (lectura, resolución de problemas, conocimiento de procedimiento y conocimiento declarativo, etc.). Para exponerlo claramente, lo que sucede durante un IR, varios investigadores (tanto en el campo de la información como en el campo de las ciencias cognitivas) en la búsqueda de información han propuesto modelos. Se supone que reflejan lo que realmente está sucediendo y, para algunos, permiten formular hipótesis en el origen cognitivo de los actos perceptibles.
Aunque la recuperación de la información es una actividad humana antigua, su estudio se desarrolló sobre todo con la aparición de sistemas de recuperación documentales computarizados. Un primer modelo es el de la recuperación de información. En este modelo hay tres elementos: el usuario, el conjunto de documentos y, entre los dos, el especialista en información (bibliotecario o documental) que puede interrogar la base de datos. Este modelo fue diseñado cuando los usuarios aún no tenían acceso a catálogos de computadora. El bibliotecario usó un lenguaje cerrado, como un tesauro, para indexar los documentos e interrogar el sistema reutilizando este mismo lenguaje. Por lo tanto, el usuario que necesita información la expresa en forma de una pregunta y el bibliotecario la transcribe en una solicitud para interrogar un sistema documental. Los documentos, por otro lado, fueron representados, es decir, transcritos en registros bibliográficos e indexados. Por lo tanto, existe un acoplamiento entre la solicitud y el índice del sistema que proporcionará una respuesta.
Este modelo fue criticado por dos razones principales. El primero es la vaguedad de algunos términos utilizados (especialmente la noción de necesidad de información) y la falta de explicación de las conexiones que se crean (¿cómo se mueve de una necesidad a una pregunta y luego a una solicitud?) El segundo es que la necesidad de información sigue siendo la misma durante todo el trabajo. Sin embargo, todos los estudios muestran que la pregunta inicial a menudo evoluciona durante la investigación.
Sin embargo, estas críticas, aunque válidas en términos absolutos, están atenuadas por el hecho de que se refieren a puntos no esenciales en este sistema. El propósito de este modelo es describir concretamente lo que está sucediendo. El aspecto cognitivo (y en este caso la necesidad de información), incluso si parece, no es esencial. Esta es la razón por la cual los términos son vagos. Además, incluso si el interrogatorio del usuario evolucionará simultáneamente con el progreso de su trabajo, cuando cuestiona al bibliotecario, cada vez que comienza un nuevo ciclo de investigación. Por lo tanto, la crítica más fuerte sería decir que este modelo ahora es obsoleto, porque el intermediario entre el sujeto y los documentos ya no existe.
¿Cómo se clasifican las técnicas de recoleccion de datos?
Para analizar y tomar decisiones sobre un cierto negocio, ventas, etc., se recopilarán datos. Estos datos recopilados ayudarán a llegar a conclusiones sobre el desempeño de un negocio en particular. Por lo tanto, la recopilación de datos es esencial para analizar el rendimiento de una unidad de negocios, resolver un problema y hacer suposiciones sobre cosas específicas cuando sea necesario. Antes de entrar en los métodos de recopilación de datos, comprendamos qué es la recopilación de datos y cómo ayuda en varios campos.
En estadísticas, la recopilación de datos es un proceso de recopilación de información de todas las fuentes relevantes para encontrar una solución al problema de investigación. Ayuda a evaluar el resultado del problema. Los métodos de recopilación de datos permiten a una persona concluir una respuesta a la pregunta relevante. La mayoría de las organizaciones utilizan métodos de recopilación de datos para hacer suposiciones sobre probabilidades y tendencias futuras. Una vez que se recopilan los datos, es necesario someterse al proceso de organización de datos.
Las principales fuentes de los métodos de recopilación de datos son «datos». Los datos se pueden clasificar en dos tipos, a saber, datos primarios y datos secundarios. La importancia principal de la recopilación de datos en cualquier investigación o proceso comercial es que ayuda a determinar muchas cosas importantes sobre la empresa, particularmente el rendimiento. Por lo tanto, el proceso de recopilación de datos juega un papel importante en todas las transmisiones. Dependiendo del tipo de datos, el método de recopilación de datos se divide en dos categorías, a saber,
- Métodos de recopilación de datos primarios
- Métodos de recopilación de datos secundarios
En este artículo, se explican los diferentes tipos de métodos de recopilación de datos y sus ventajas y limitaciones.
Los datos primarios o los datos sin procesar son un tipo de información que se obtiene directamente de la fuente de primera mano a través de experimentos, encuestas u observaciones. El método de recopilación de datos primario se clasifica aún más en dos tipos. Están
Artículos Relacionados:
