Que Computadora Comprar

Minería de Datos Tecnología

Herramientas de minería de datos se utilizan para juzgar las tendencias futuras y el comportamiento que permiten a las empresas a tomar decisiones basadas en el conocimiento y proactivas. La extracción de datos automatizada ofrece, prospectivo analiza paso que deja atrás el análisis de los hechos pasados ​​que ofrecen las herramientas retrospectivas de los sistemas de apoyo a las decisiones. Herramientas de minería de datos pueden responder a preguntas de negocios que estaban mucho tiempo en resolverse. Buscan bases de datos de patrones ocultos e información para encontrar predictivo que los expertos pueden pasar por alto.

Técnicas de Data Mining pueden ser implementadas rápidamente en el hardware existente y las plataformas de software para aumentar el valor de los recursos de información existentes y puede ser fácilmente integrado con nuevos productos y sistemas.

Cómo funciona minería de datos

1) Preparación de la información:

Los datos tienen que estar debidamente organizados para el procesamiento eficaz de la información. En la minería de datos, el 70 por ciento a 80 por ciento del tiempo se dedica a clasificar y resumir la información de que los esfuerzos de minería de hecho comenzar. Los datos se preparó sobre la base de los objetivos de la información deseada.

2) Modelado:

Modelo se crea dependiendo de muchos factores tales como tamaño de la base, el número de variables conocidas y qué tipo de algoritmos de extracción de datos para ser empleados. El éxito de los modelos de ayudar a las empresas a estudiar y efectivamente identificar su mercado objetivo. Los modelos de minería de datos están diseñados contra los almacenes masivos de transacción de datos de detalle de 10 TB a 20 TB. Estos modelos se utilizan a menudo como extremo delantero por las capacidades de segmentación inteligentes para permitir la derivación de los segmentos de clientes procesables.

3) Los clientes de puntuación:

La mejor manera de acceder a la viabilidad de los modelos es probar contra un conjunto de datos existentes, donde ya está la respuesta a una pregunta en particular conocidos. Puntuación es la salida de un modelo, que es el número entre 0 y 1 como la probabilidad de respuesta a una pregunta específica.

4) Puntaje dinámica:

En este proceso de puntuación se determina por otra aplicación de software con el objetivo de utilizar esta puntuación para algunos otros propósitos. Para que los resultados hasta al día y eliminando la necesidad de marcar una base de datos completa, sólo se requiere subconjuntos de registros se anotó.

Ámbito de aplicación de minería de datos

La minería de datos obtiene su nombre de las similitudes entre buscar valiosa información de negocios en una gran base de datos. La minería de datos se encuentra información exacta ya sea tamizado a través de una inmensa cantidad de material o inteligente que el sondeo. La tecnología de minería de datos puede generar nuevas oportunidades de negocio al proporcionar estos servicios:

1) la predicción automatizada de tendencias y el comportamiento:

La minería de datos busca automáticamente la información predictiva en grandes bases de datos. Las preguntas, que requieren un amplio análisis ahora se puede responder directamente de los datos de forma rápida. Problema predictivo es un ejemplo típico de marketing dirigido. La minería de datos utiliza los datos de correos anteriores para identificar los objetivos y aportar maximizar el retorno sobre la inversión en futuros envíos.

2) Descubrimiento automatizado de modelos previamente desconocidos:

Herramientas de bases de datos de minería de datos e identificar patrones de búsqueda que antes estaban ocultos en un solo paso. Patrón de descubrimiento es un ejemplo del análisis de los datos de ventas minoristas para identificar productos aparentemente no relacionados que se compran a menudo juntos.

Herramientas de minería de datos se pueden analizar bases de datos masivas en minutos si estas herramientas se ejecutan en sistemas de alto rendimiento de procesamiento en paralelo. Procesamiento más rápido permite a los usuarios experimentar de forma automática con más modelos para entender datos complejos.

Bases de datos pueden ser más grandes tanto en profundidad y anchura:

a) más columnas: Analistas debe proporcionar el número limitado de variables durante el análisis por falta de tiempo. La minería de datos permite a los usuarios explorar la profundidad de una base de datos sin seleccionar un subconjunto de variables.

b) Cantidad de filas: más grandes muestras de provocar errores de estimación más baja, la varianza y permiten a los usuarios hacer inferencias acerca de pequeños segmentos importantes de la población.

Las técnicas más utilizadas en la minería de datos son los siguientes:

i) Las redes neuronales artificiales: proporciona modelos no lineales de predicción que se aprenden a través de la formación y se asemejan a redes neuronales biológicas en la estructura.

ii) Los árboles de decisión: Es el árbol en forma de estructuras que representan conjuntos de decisiones. Este árbol de decisiones genera normas para la clasificación de un conjunto de datos. Algunos métodos de árboles de decisión incluyen árboles de clasificación y regresión (CART).

iii) Los algoritmos genéticos, que imparte técnicas de optimización que usan procesos tales como combinación genética, mutación y selección natural en un diseño basado en los conceptos de evolución.

iv) la inducción de la Regla: Útil si-entonces las reglas se basan en la significación estadística.

Arquitectura para la minería de datos

La minería de datos está completamente integrado con un almacén de datos y la flexibilidad de las herramientas interactivas de análisis de negocio. Muchas de las herramientas de minería de datos que actualmente trabajan fuera del almacén de datos y requiere pasos adicionales para importar, extraer y analizar los datos. Mientras nuevo enfoque requiere de la implementación operativa, la integración con el almacén simplifica la aplicación de la minería de datos. El almacén de los datos resultantes de análisis puede ser útil para mejorar los procesos empresariales en toda la organización en la gestión de la campaña de promoción, lanzamiento de nuevos productos y la detección de fraudes.

Almacén de datos es el punto ideal de partida que contiene una combinación de los datos internos de seguimiento todos los contactos del cliente, junto con los datos de mercado externos para actividades de la competencia. Para la prospección de información de antecedentes sobre los clientes potenciales proporciona una base excelente. Este almacén se pueden implementar en Sybase, Oracle, ladrillo rojo, y así sucesivamente, y debe ser optimizado para el acceso a los datos flexible y rápido.

Al navegar por el almacén de datos de un OLAP (On-Line Analytical Processing) permite a un servidor más sofisticado para el usuario final modelo de negocio. Estas estructuras multidimensionales permiten al usuario analizar los datos según el punto de vista. El servidor de minería de datos está totalmente integrado con el almacén de datos y el servidor OLAP para incorporar el análisis de retorno de la inversión empresarial enfocada. Plantilla de metadatos que es centrado en los procesos se definen los objetivos de minería de datos para los problemas específicos del negocio como la gestión de campañas, la prospección y la optimización de la promoción. La integración con el almacén de datos permite que las decisiones operativas para aplicar directamente y seguimiento. Con las nuevas decisiones y los resultados de la bodega y la organización crece continuamente puede extraer las mejores prácticas y aplicarlas en futuras decisiones.

Aplicaciones

Datos de las áreas de aplicación de minería son los siguientes:

1) Una empresa farmacéutica puede examinar su actividad reciente de la fuerza de ventas y sus resultados para mejorar la cual las actividades de marketing tendrá el mayor impacto en los próximos meses. Los datos deben incluir información sobre los sistemas locales de atención de salud, así como la actividad del mercado competidor. Mediante el uso de una red de área amplia de los resultados pueden ser distribuidos a la fuerza de ventas que permite a los representantes a que revise las recomendaciones desde la perspectiva de los atributos clave en el proceso de decisión. Este análisis dinámico del almacenamiento de datos permite a las mejores prácticas de toda la organización para ser aplicadas en situaciones específicas de ventas.

2) Una compañía de tarjeta de crédito puede obligar a su enorme almacén de datos de transacciones de clientes a identificar a los clientes que estén interesados ​​en un nuevo producto de crédito. El uso de un correo de prueba pequeña se puede identificar los atributos de los clientes con una afinidad por el producto.

3) Un gran paquete de bienes de consumo se aplica la empresa de minería de datos para mejorar su proceso de ventas para sus distribuidores. Los datos recogidos de los paneles de consumidores, los envíos, y actividad de la competencia puede ser usado para determinar las razones de cambio de marca y tienda. Mediante el uso de este análisis, el fabricante de seleccionar las mejores estrategias que llegan a sus segmentos de clientes objetivo.