DMG Archivos - artyco | the data driven company
91 640 41 50 hola@artyco.com
Por qué la orquestación de datos es la clave para la personalización de marketing

Por qué la orquestación de datos es la clave para la personalización de marketing

Por qué la orquestación de datos es la clave para la personalización de marketing

En el pasado, la mayoría de los responsables de marketing recogían datos en la parte baja del funnel para identificar a los clientes y sus atributos después de la compra. Este método de recopilación de información introdujo un sesgo de confirmación bastante grande y redujo el potencial de mercado total de una marca o empresa. En otras palabras, la recopilación de información fue buena, pero la calidad de la información no lo fue. En este post voy a contarte la importancia que tiene la orquestación de los datos de cara a la personalización, así como qué estrategias llevar a cabo al respecto, tanto en B2B como en B2C, ¿te interesa? Vamos a ello.

La introducción de las cookies cambió por completo la forma en que recopilamos y accedemos a los datos, mejorando la precisión de estos respecto a la parte superior del embudo y, por extensión, la determinación del potencial de negocio de la marca.

Las cookies de terceros nos dieron un nuevo camino para observar y comprender mejor los journeys de los compradores de manera individual, los patrones de compra y otras características y atributos que antes desconocíamos. De este modo, la orquestación de datos aumentaba en complejidad, ya que estos eran cada vez mayores.

Hoy día, debido a la gran variedad y cantidad de datos que recogen las empresas, podemos decir que la orquestación de datos en la personalización de marketing es la combinación de datos, identidad e inteligencia artificial

A su vez, los proveedores de tecnología han estado ajustando los algoritmos de machine learning que mejoran los volúmenes y tipos de datos que las plataformas pueden ingerir, modelar y usar para tomar decisiones programáticas altamente específicas y personalizadas dentro de las campañas de marketing de pago.

 

El futuro de la personalización de marketing a través de la orquestación de datos

Orquestación de datos para la personalización

Gracias a los avances tecnológicos en el campo del marketing, la eficacia de los datos ha mejorado sustancialmente, tanto a la hora de desarrollar campañas, como en el conocimiento de los consumidores y clientes. Ya que antes era mucho más complejo manejar toda esa cantidad de datos.

La tendencia en el futuro está alineada precisamente con esos avances tecnológicos, los cuales, mediante integraciones y actualizaciones, logren sacar más y más partido a los datos.

Lo cierto es que los responsables de marketing siempre han tenido (y seguirán teniendo) una gran cantidad de información disponible para ayudarles en su trabajo, y como no, para crear campañas altamente personalizadas. Sin embargo, no serán como se podrán obtener en el futuro, gracias a esa tecnología.

Debido a todo esto, en la búsqueda de la personalización, la orquestación de datos juega un papel cada día más importante, ya que sin esta, todos esos datos circularían sin orden y concierto, siendo mucho menos aprovechados.

A través de la orquestación de datos se logra recopilar y modelar datos de múltiples canales, tanto online como offline, teniendo en cuenta aspectos como el aumento de ventas, el tráfico, las conversiones online o el nivel de reconocimiento de marca. Y clasifica y segmenta los datos a través de identificadores online, personales y de journeys de compra. El resultado es un enfoque de marketing basado en las personas que ayuda a los responsables de marketing a llegar al consumidor adecuado en el momento adecuado y en el contexto adecuado. 

Pero ¿cómo la orquestación de datos ayuda a generar más ingresos? Una de las principales batallas que se libran en los grandes departamentos de marketing, está relacionada con la creación de modelos de atribución de ingresos, es decir, determinar qué inversiones nos están aportando los ingresos. Y aunque no lo creas, en este aspecto la orquestación de datos tendrá mucho que decir.

Personalizar de una manera efectiva cada campaña de marketing que realizamos, exige tener una orquestación de datos efectiva que soporte ese nivel de personalización. Gracias a tener esa orquestación adecuada de datos, podremos crear modelos de atribución más eficaces, impulsando estos para conocer a la perfección cuánto me genera cada uno de los euros que invierto. Si conozco a la perfección qué inversión me genera más ingresos, podré escalar el modelo, aumentando ingresos.

En el B2B hay alguna diferencia. Los ciclos de ventas B2B suelen ser más largos y los especialistas en marketing B2B tienden a centrarse en las partes del embudo que generan directamente el ROI, como las conversiones de oportunidades y la calificación de leads. Pero una fuerte inversión en actividades de bajo embudo puede limitar la capacidad de conversión y reducir el alcance general de la campaña. La orquestación de datos en partes más altas del funnel y la creación de modelos de atribución, pueden ayudar a estos especialistas a dar un salto bastante importante en sus ingresos.

La segmentación es otro de los factores importantes que se pueden aprovechar con la orquestación de datos. En Marketing Digital, a través de la tecnología, se pueden ejecutar campañas automatizadas, con un alcance de audiencia, con contenido personalizado y realizando pruebas automatizadas A / B, todo mientras vas almacenando datos. 

Y es que la orquestación de datos no puede existir sin la recopilación de datos. Gracias a estos, la tecnología y el saber hacer, se pueden crear segmentaciones en tiempo real en función de los datos que se vayan recogiendo, las cuales sirvan para virar las campañas o crear acciones automatizadas cada vez más precisas.

 

Dónde comenzar con la orquestación de datos

Orquestación de datos

Es sencillo de entender, pero complicado de poner en marcha. Fundamentalmente los pasos a seguir podrían ser estos:

#1. Conoce y comprende a tu cliente, así como todas las formas en que puedes recopilar datos sobre ellos de una manera que cumpla con la privacidad y la legalidad.

#2. Busca una combinación de 1st party data y 3rd party data que funcione para las necesidades de tu compañía.

#3. Para obtener datos de terceros, evalúa los mejores DMP, CDP o soluciones internas según el tamaño de tu compañía.

#4. Para datos de terceros, asegúrate de hacer las preguntas correctas sobre cómo se recopilan los datos (por calidad + privacidad) y el proceso de modelado, porque todos los proveedores de datos de terceros tendrán diferentes metodologías (algunas mejores que otras).

#5. Asegúrate de que tu proveedor de datos DMP, CDP o de terceros sea capaz de transferir de manera fácil y segura los datos a todos los canales de comercialización.

#6. Por último, asegúrate de que tus proveedores de canales de marketing pueden agregar a su estrategia de orquestación de datos, elementos importantes como información de la audiencia, métricas de participación, audiencias similares, etc.

 

Estrategias de orquestación de datos

Estrategia de orquestación de datos

Vamos a verlo con un ejemplo en cada uno de los principales sectores: el B2C y el B2B. Para entenderlo bien, la orquestación de datos , la vamos a poner en un contexto en el que se cumplen cada una de las etapas en el journey de cualquier consumidor o cliente, estando orientado a estrategias relacionadas con la audiencia, usadas a través de una campaña. Vamos a ello.

En B2C.

Imaginemos una compañía de medios de cine que quiere promocionar una próxima película e impulsar a las personas a comprar entradas para ir a verla.

Lo primero que deberías de hacer es lanzar una campaña de CPM con ofertas varias, para así recoger datos y conocer qué tipo de audiencia participa en ellas.

Usando los atributos de las personas que participaron en el anuncio, dirígelos a una campaña de consideración, usando la información de interés reunida en la parte superior del embudo para agrupar a las personas en un segmento concreto.

A ese segmento concreto, dirígeles un avance de la película y utiliza las ofertas basadas en un objetivo de CPCV para reorientar a las personas que vieron el avance completo con un anuncio nativo o de display, promoviendo una venta de entradas. Esta sería la parte de acción de la campaña.

Para terminar, usando datos de atribución, analiza quién fue al cine y realmente compró una entrada, para construir la medición de la campaña.

En todo este proceso, como has podido comprobar, la recogida de datos y la orquestación a lo largo de todos los canales han sido fundamentales para lograr lanzar cada acción en función de cada etapa del journey. Vamos con un caso de B2B.

 

En B2B.

Normalmente en el B2B, se invierte mucho en la parte inferior del embudo de conversión. Sin embargo, esta estrategia realmente obstaculiza su capacidad de conversión.

Al final, si no se invierte en la parte superior del embudo, cualquier campaña que se realice, comenzará con un objetivo muy estrecho.

Para ello, comienza con una gran campaña de sensibilización, con una orientación bastante abierta para ampliar el embudo lo más posible.

Una vez lanzada, recoge los datos que te vayan saliendo: intereses, sectores, cargos… y lanza campañas de CPM más dirigidas y automatizadas en función de la respuesta. Al final del día, todos los datos recopilados a través de la campaña nutrirán el embudo. La clave es aprovechar todos esos datos para crear una estrategia de orquestación y personalización de datos.

La recompensa es una mejor integración de campañas online y offline, datos más limpios, una orientación más estricta y, en última instancia, la atribución de ingresos.

 

Estos son sólo unos pocos ejemplos sobre la importancia que tiene la orquestación de datos hoy día en cualquier negocio a la hora de personalizar los mensajes. Como ves, esta orquestación necesita de personas expertas en el manejo de los datos y la tecnología que la posibilita, siendo una gran opción encontrar el socio perfecto especializado en todo ello, el cual sepa sacar todo el beneficio a cada necesidad. ¿Hablamos?

Emilio Fernández Lastra

Chief Marketing Officer

“Después de la hipoteca, el inbound marketing es la mejor
herramienta para asegurar una relación a largo plazo”

¿Te ha parecido interesante lo que has leido?

En artyco podemos ayudarte a conseguir tus objetivos

¿Hablamos?

Si, quiero

+34 916 404 150

hola@artyco.com

© Artyco comunicación y servicios - Todos los derechos reservados

© Artyco comunicación y servicios - Todos los derechos reservados

Tealium, el mejor CDP para conocer mejor a tus clientes. Entrevista a Marco Lembo

Tealium, el mejor CDP para conocer mejor a tus clientes. Entrevista a Marco Lembo

Tealium, el mejor CDP para conocer mejor a tus clientes – Entrevista a Marco Lembo

Un CDP o Customer Data Platform es un software paquetizado en el que se unifica toda la información sobre los clientes, provenientes de cualquier canal, creando fichas únicas las cuales pueden ser utilizadas por cualquier departamento de la empresa, generando al mismo tiempo insights para crear campañas de marketing. Dentro de los CDPs, Tealium es probablemente el líder del mercado. ¿Quieres saber de la mano de Marco Lembo, Channel Manager EMEA de Tealium qué puede hacer esta tecnología? En esta entrevista te lo contamos.

Recientemente, en artyco nos certificamos como Partners oficiales de Tealium, en nuestra ruta hacia la excelencia en la gestión y aprovechamiento del dato para los negocios.

Tras analizar profundamente el mercado tecnológico al respecto, no tuvimos duda de que Tealium era el líder indiscutible de las plataformas de Customer Data, por su tecnología, su capacidad de integración con cualquier otra tecnología ya existente en una empresa, y por su capacidad de innovación en el futuro.

La apuesta fue hacia Tealium y una vez que hemos profundizado en ella, nos hemos dado cuenta de que no nos hemos equivocado.

Sin embargo, muy pocas empresas hoy día conocen qué es un CDP, así como las múltiples ventajas que este ofrece a las marcas. Para solucionar un poco este desconocimiento, desde artyco hemos entrevistado a Marco Lembo, Channel Manager EMEA de Tealium. Marco es un apasionado del dato, como nosotros, y lo refleja en las respuestas que nos ha ofrecido en la siguiente entrevista. La mejora de la experiencia de cliente, la personalización, y en definitiva, crear acciones de marketing próximas a lo que se denomina 1-to-1 es posible gracias a este entorno tecnológico.

 

Tealium, entrevista a Marco Lembo

 

– Marco, ¿podrías contarnos rápidamente qué es Tealium?

Marco Lembo: Tealium conecta los datos de clientes (de la red, dispositivos móviles, IOT y el mundo offline) para que las marcas puedan conectarse con sus clientes. El ecosistema de integración llave en mano de Tealium apoya a más de 1.200 proveedores y tecnologías de clientes y servidores, haciendo posible que las marcas creen una infraestructura de datos de clientes unificada y de tiempo real.

 

Debido a la gran cantidad de datos, las empresas se enfrentan a una gran variedad de problemas a la hora de gestionarlos, ¿cuáles son los principales problemas y cómo los resuelve Tealium?

ML: Las diferentes tecnologías crean silos y alejan a los clientes de las empresas, ya que cada tecnología tiene una visión fragmentada del cliente. Tealium rompe estos silos y une los datos para que se tenga una visión granular del cliente, para ponerlo en el centro de las tecnologías.

 

Uno de los principales heavy users de este ecosistema son los marketers, ¿cómo puede ayudar Tealium a los responsables de marketing?

ML: A través de una experiencia de cliente única en todos los puntos de contacto; una página web, una aplicación y publicidad personalizada en tiempo real; y una experiencia tan fluida y relevante que es como si estuvieras leyendo la mente de tus clientes.

 

– Un CDP como Tealium, además es una poderosa herramienta para los Data Analysts, ¿cómo ayuda la plataforma a estos profesionales?

ML: La plataforma de datos de clientes Tealium AudienceStream ayuda a las empresas a formar un perfil unificado del cliente para orquestar su experiencia, sus acciones e información. Empleando tecnología de resolución de identidad patentada y el mayor marketplace de conectores de integración de la industria, AudienceStream permite que las empresas comprendan el comportamiento de los clientes y les brinden experiencias relevantes y personalizadas en todos los canales como nunca fue posible. Permite que las organizaciones generen información rica sobre el cliente que se puede utilizar en toda la pila de tecnologías de marketing, aprovechando la infraestructura integrada de datos de clientes.

 

– Y desde el punto de vista tecnológico, ¿qué aporta Tealium a la empresa?

ML: La libertad de poder utilizar las mejores herramientas del mercado y poder conectarlas para sacar el máximo beneficio. Tealium gracias a sus más de 1.300 conectores se adapta a la tecnología que el cliente ya tiene instalada.

 

– Hoy día, todos estamos de acuerdo en que la Experiencia de Cliente es la gran batalla que ganar por todas las marcas, ¿qué puede hacer Tealium al respecto?

ML: Con los consumidores a cargo y exigiendo una experiencia fluida y sin fricciones, las formas tradicionales de interactuar con ellos no funcionarán. Y para las marcas que pueden responder son 3 veces más propensas a lograr un crecimiento de ingresos y ganancias superior al promedio. Tealium revoluciona el negocio digital actual con un enfoque universal de la orquestación de datos de clientes que abarca la red, los dispositivos móviles, el mundo offline e IOT. Con el poder para unificar los datos de clientes en una sola fuente de verdad.

 

– ¿Cómo ve Tealium la Customer Data Orchestration y cómo puede ayudar a conseguirlo?

ML: Al igual que ocurre con una sinfonía bellamente orquestada, la orquestación de datos de clientes se convierte en la partitura con la que se puede orquestar una visión 360 grados del cliente, que permita que los datos lleguen a múltiples equipos, herramientas y tecnologías de manera coherente y fluida. Esta información (o partitura) sobre el cliente posibilita que todos trabajen a partir del mismo conjunto de datos (o notas, en el ejemplo de la sinfonía), sin importar desde qué tecnología o departamento trabajen.

 

– Tealium es una gran oportunidad para cualquier empresa que quiera sacar verdadero provecho de los datos, ¿qué tipo de empresas están utilizando su plataforma?

ML: Con más de 1.000 empresas Enterprise, Tealium se ha convertido en una solución líder al nivel global.

 

– ¿Qué significa ser Partner de Tealium?

ML: Ser Partner de Tealium, significa añadir valor y recursos locales para que de manera conjunta logren ayudar al cliente en sacar el máximo resultado de los datos de las empresas.

 

– ¿Cuál cree que puede ser el potencial de una empresa como artyco, como Partner de Tealium?

ML: Artyco es una empresa Data Driven que tiene realmente bien asentado en su ADN la importancia de los datos para generar estrategias y acciones eficaces. Desde hace años lleva trabajando muy bien toda la parte del Data Management y Data Analytics con vistas a convertir esos datos en valor de negocio para sus clientes. Con Tealium, artyco se refuerza en ese poder ante el dato, disponiendo de una plataforma que facilita la integración de datos, su orquestación y la creación de perfiles únicos de clientes, lo cual ayuda enormemente a la hora de sacar conclusiones de una manera más rápida y acertada. Todo esto repercutirá inevitablemente en sus clientes, obteniendo mejor información para generar acciones más exitosas.

 

– Tealium es una compañía con una clara visión internacional, ¿qué presencia internacional tienen?

ML: Tealium opera en todo el mundo: EEUU, EMEA y APAC.

 

– ¿Qué previsiones tiene la empresa de cara al futuro?

ML: Se trata de ofrecer a las empresas las herramientas y la experiencia que necesitan para brindar la mejor experiencia al cliente, para que puedan prosperar. Continuaremos mejorando, adaptando y desarrollando nuestras soluciones tecnológicas para satisfacer las necesidades del cliente.

 

Tealium es sin duda, una herramienta innovadora y con un alto potencial, la cual va a dar mucho que hablar. Desde artyco estamos muy contentos por nuestra certificación y estamos deseando ayudar cada día a más compañías en todo lo relacionado con el cliente.

Si te interesa saber más, ponte en contacto con artyco y uno de nuestros consultores te asesorará de cómo podríamos empezar a poner en marcha en tu negocio un Customer Data Platform de calidad, como es el de Tealium. ¿Hablamos?

Emilio Fernández Lastra

Chief Marketing Officer

“Después de la hipoteca, el inbound marketing es la mejor
herramienta para asegurar una relación a largo plazo”

¿Te ha parecido interesante lo que has leido?

En artyco podemos ayudarte a conseguir tus objetivos

¿Hablamos?

Si, quiero

+34 916 404 150

hola@artyco.com

© Artyco comunicación y servicios - Todos los derechos reservados

© Artyco comunicación y servicios - Todos los derechos reservados

Qué es el Dirty Data

Qué es el Dirty Data

Qué es el Dirty Data

Dirty Data o datos sucios, es el término que se utiliza para denominar a aquella información que es errónea, inconsistente o incompleta. Incluso puede ser Dirty Data, todos aquellos datos mal relacionados, con campos vacíos o con información falsa. A priori podrías pensar que este tipo de datos no merecen un post, sin embargo, si te cuento que el impacto del Dirty Data en España se ha cifrado en 321 millones de euros de pérdidas, la cosa cambia, ¿verdad? En este post no sólo te ayudaré a entender mejor lo que son los datos sucios, sino que, además, te contaré cuáles son las principales causas, y su solución posible: el Data Cleaning.

Las plataformas de Big Data no tienen en cuenta el Dirty Data, es decir, funcionan incluso con datos erróneos, incompletos o inconsistentes, ofreciendo información y conclusiones equivocadas, las cuales originan desastrosas tomas de decisiones.

Sin embargo, en realidad, la gravedad depende el volumen de Dirty Data que hubiera en la plataforma. Según algunos estudios, el 82% de los datos almacenados por las organizaciones es Dirty Data. ¿Te parece demasiado? Imagina el daño que puede hacer a las conclusiones que de ellos pueda sacar tu equipo de Customer Intelligence.

Y es que según la firma Verve, el 60% de los consumidores mienten en algún dato a la hora de rellenar sus datos personales, y según la compañía Hocelot, cerca del 25% de los datos que tiene una compañía, podrían ser falsos.

¿De qué sirve disponer de las mayores fuentes de recogida de datos, así como de las infraestructuras más potentes para almacenarlos y la mejor analítica, si los datos que allí se guardan son falsos o erróneos?

Sin embargo, la solución es más compleja de lo que pueda parecer. Imagina una compañía de seguros que dispone de varias bases de datos con millones de filas en cada una de las bases, y al menos 100 columnas. Invertir tiempo y recursos en comprobar esos datos uno a uno, es imposible de realizar. Para que fuera factible, se requeriría un análisis específico con algoritmos que trataran de solventar los errores más comunes en la recogida de datos. Este algoritmo debería de contar, para ser más eficaz, con un grado de aprendizaje automático o Deep learning.

Gracias a este método se podría reducir bastante la suciedad de los datos, pero nunca se llegaría al margen de error del 0%. Para ayudar a obtener una base de datos lo más veraz posible, debemos trabajar otros aspectos, sin embargo, antes vamos a ver cuáles son las principales causas del Dirty Data, para así comprender mejor sus posibles soluciones.

 

Principales causas del Dirty Data

Causas del Dirty Data

Hay un ‘sinfín’ de causas de que aparezcan datos sucios en una base de datos o en una plataforma de Big Data, sin embargo, posiblemente los más comunes sean estos:

  • El volumen. Lógicamente, cuanto mayor volumen de datos, más probabilidades de que haya erróneos. Al aumentar el número de datos con la Era Digital, el número de datos sucios, también se ha visto incrementado en la misma proporción.
  • Fallos en el registro de los datos. La introducción de datos es clave. Al ser en muchos casos, realizado de forma manual por alguna persona, es muy posible que alguno de ellos acabe siendo grabado de manera errónea o con alguna errata o alteración. En la grabación de datos masiva, es fundamental disponer de un equipo profesional de Data Entry.
  • Existencia de silos de información. Muchas empresas aún no disponen de un único sitio en donde tener almacenada y disponer toda la información de la empresa. Este hecho hace que cuando se intenta unificar la información surjan incoherencias y datos duplicados.
  • Falta de información. Los registros con campos vacíos provocan que la información que manejamos sea parcial y por lo tanto provoquen decisiones equivocadas.
  • Datos falseados. Suele pasar con la información extraída de Internet. Muchos usuarios prefieren dar datos falsos ante el temor de poder ofrecer información verídica a una empresa, sin saber exactamente para qué los va a acabar utilizando. A continuación, te dejo un gráfico extraído de la empresa Verve, donde te muestra precisamente esto.

 

Datos falsos en Dirty Data

 

Tras leer esto, seguro que piensas que puede que dispongas de dirty data en tu base de datos, ¿verdad? Pues si es así, voy a contarte qué puede suponer esto a tu empresa.

 

Cómo afecta el Dirty Data a una empresa

Cómo afecta el Dirty Data a tu empresa

Por lo general, las empresas que más se verán afectadas por el Dirty Data, son las que ya están utilizando el Big Data. En esos casos, lo normal es que les incurra en:

  • Una pérdida de tiempo y recursos. Si dispones de demasiada información sucia en tu CRM por poner un ejemplo, a la hora de sacar conclusiones, segmentar a tus clientes o hacer previsiones, estas serán realizadas de manera más inexacta, repercutiendo en una visión errónea del cliente y una relación con ellos defectuosa. Este hecho repercutirá en que se tendrá que dedicar tiempo extra a ajustar esos mismos estudios, ya que habremos comprobado a posteriori que son falsos, dedicando a su vez, más recursos.
  • Una pérdida de ingresos netos. Si tienes pensado realizar una campaña de venta a través de tu Contact Center, disponer de unos datos falseados, erróneos o incompletos en tu base de datos, hará perder claramente clientes potenciales. Según un informe de la empresa Experian, el 77% de las empresas consideran que pierden cerca de un 12% de sus ingresos netos, por falta de datos de sus clientes.
  • Decisiones carentes de información. Uno de los mayores avances que han surgido entorno a Internet, la tecnología y los datos, es el poder realizar tomas de decisiones apoyadas en datos, o lo que se llama Data Driven. El Dirty Data puede influir de manera negativa en esa toma de decisiones, ya que estas serían desacertadas.

Y todo esto es debido a datos incompletos, duplicados, incorrectos, imprecisos, inconsistentes o incluso que incumplen las reglas de tu negocio.

Pero ¿cómo podemos solucionar este enorme problema? Vamos a ver ahora qué soluciones podemos poner en marcha para que este Dirty Data nos haga el menor daño posible.

 

Cómo solucionar el problema del Dirty Data

Soluciones para el Dirty Data

Siempre la mejor solución para cualquier problema es la prevención, sin embargo, ante este problema, la prevención es realmente complicada, debido fundamentalmente a la gran cantidad de datos o al Big Data. Este hecho, hace imposible crear un sistema fiable.

Una cierta solución, que no llega a ser de prevención, pero se le acerca bastante, es la atención a la calidad del dato. Gracias a ella, evitamos que se produzcan errores al introducir el dato en base de datos. Herramientas de Inteligencia artificial (IA) están comenzando a funcionar muy bien en estos sentidos, validando el dato en tiempo real y ayudando a la calidad de ese dato.

Sin embargo, hay un sistema que se impone sobre los otros dos: el método correctivo, a través del Data Cleaning.

Sin embargo, el sistema del Data Cleaning tiene algunas desventajas:

  • Son sistemas costosos.
  • Requiere mucho trabajo.
  • No se puede automatizar al 100%, ya que muchas veces se necesita de un equipo mixto para realizarlos (técnico y de negocio).

No obstante, lamento decirte que este es el único método para reducir al máximo el Dirty Data dentro de tu plataforma.

Vamos a ver cómo realizar un Data Cleaning exitoso a través de unas sencillas fases:

FASE #1. Detección. Lo primero que debes hacer, lógicamente, es detectar el Dirty Data, ya que no podemos limpiar, si no sabemos qué limpiar. Hay soluciones de Data Profiling que revelan campos vacíos o inconsistencias en los datos. También hay metodologías para asegurar la calidad del dato.

FASE #2. Corrección de los datos. Una vez detectados los errores, hay que subsanarlos, pero no todos son igual de fáciles de arreglar. Por ejemplo, una errata es fácil de solucionar, sin embargo, un dato falso ¿cómo lo corriges por el verdadero? En cuanto a campos vacíos, se pueden rellenar con el dato más probable, haciendo una media, si es dato es numérico, sin embargo, si se hace esto corremos es riesgo que influya en el posterior análisis.

FASE #3. Eliminación de duplicados. En estos casos nos podemos encontrar con que la información que le pudiera faltar a uno de los duplicados, está en la otra. Por tanto, es recomendable, antes de eliminar uno de ellos, juntar todos los datos en uno, y eliminar el duplicado, completando todo lo que fuera posible el uno con el otro.

 

Como has podido ver, muchas veces nos centramos en el almacenamiento, la gestión de los datos, incluso en métodos y metodologías para sacar conclusiones y conocimiento de los datos, lo cual es fundamental, pero nos olvidamos de la materia prima: el dato. Y es que, si el dato es malo, las conclusiones que saquemos de ellos, y por tanto las decisiones, serán malas. Tal y como se dice en el mundo de los datos “Garbage in, Garbage out”.

En artyco llevamos más de 25 años trabajando con los datos, sacando verdadero oro de cada uno de ellos. Te proponemos algo: “Gold in, Gold out” ¿te apuntas?

Emilio Fernández Lastra

Chief Marketing Officer

“Después de la hipoteca, el inbound marketing es la mejor
herramienta para asegurar una relación a largo plazo”

¿Te ha parecido interesante lo que has leido?

En artyco podemos ayudarte a conseguir tus objetivos

¿Hablamos?

Si, quiero

+34 916 404 150

hola@artyco.com

© Artyco comunicación y servicios - Todos los derechos reservados

© Artyco comunicación y servicios - Todos los derechos reservados

Qué es la arquitectura de datos

Qué es la arquitectura de datos

Qué es la arquitectura de datos

Arquitectura de datos son los modelos, políticas, reglas y estándares que nos indican de qué manera tenemos que almacenar, organizar e integrar los datos que recoge una compañía con el objetivo de que sean aprovechables y útiles. Ante la Era del Big Data y el Data Science en la que estamos, tras leer la definición de qué es la arquitectura de datos, parece que esta es fundamental, ¿verdad? En este post te voy a contar más en profundidad qué es, pero también cómo diseñar una arquitectura de datos o al menos qué debería de tener para que esta fuera alineada con los objetivos comerciales de la empresa. Vamos a por ello.

 

En la nueva era del Big Data y el Data Science, es de vital importancia para una empresa tener una arquitectura de datos centralizada, alineada con los procesos comerciales, que se adapta al crecimiento del negocio, y que evoluciona con los avances tecnológicos. Una arquitectura de datos exitosa proporciona claridad sobre cada aspecto de los datos, lo que permite a los científicos de datos trabajar con datos confiables de manera eficiente y resolver problemas comerciales complejos.

También prepara a una organización para aprovechar rápidamente las nuevas oportunidades de negocios al servirse de las tecnologías emergentes, así como mejorar la eficiencia operativa al administrar la entrega compleja de datos e información en toda la empresa.

A pesar de lo que pueda parecer, la arquitectura de datos es una disciplina relativamente nueva. El papel de Data Architect ha recaído, tiempo atrás, en analistas de negocio senior, desarrolladores de ETL y científicos de datos. Hoy día, estos perfiles conviven con otro ya más especializado en la labor de Data Architecture.

Debido a este hecho, quizás la arquitectura de los datos de la mayoría de las empresas hoy día, no sean las más adecuadas. De este modo, nos solemos encontrar con los siguientes errores frecuentes:

 

  • Las empresas que manejan por sí mismas los datos suelen tener varios departamentos de IT, que trabajan en silos con sus propios estándares y arquitectura de datos.
  • Las aplicaciones y los procesos se crean en función de los requisitos empresariales individuales, sin estándares de arquitectura de datos a seguir.
  • El arquitecto de datos tiene la función de centrarse únicamente en un número limitado de áreas técnicas y posee un conocimiento comercial limitado sobre los datos.
  • Los proyectos de IT se administran sin considerar la arquitectura de datos como parte de la fase de diseño, de este modo, los científicos e ingenieros de datos codifican su camino sin un proceso de gestión de datos coherente.

Debido a esto, no es difícil encontrar sistemas de datos desarticulados, brechas entre equipos y silos de información entre departamentos.

Estas situaciones conllevan un bajo rendimiento de los sistemas con muchas transferencias, mucho tiempo para solucionar problemas cuando surge un problema de datos de producción, una falta de responsabilidad para llegar a la solución correcta en todos los sistemas y una falta de capacidad para evaluar el impacto de un cambio.

Como colofón, el disponer de una arquitectura de datos desarticulada, causaría un enorme esfuerzo a la hora de analizar e investigar en el momento de realizar una migración o rediseño a una plataforma tecnológicamente superior.

¿Estás preparado para que profundicemos un poco más? Sigue leyendo y te contaré los pasos para poner en marcha una correcta arquitectura de datos.

 

Cómo diseñar correctamente una arquitectura de datos alineada con los objetivos comerciales de la empresa.

Como-diseñar-data-architecture

Una empresa que quiera sacar provecho de sus datos debe sí o sí tener muy bien diseñada la arquitectura de estos. Para ello, debe de seguir un proceso de análisis y estructuración, que le ayude a conseguir ese objetivo.

Para ello te recomiendo que sigas estos pasos:

 

#1. Diseña la arquitectura de datos al nivel conceptual, basándolo en procesos y operaciones comerciales.

 

En cualquier departamento de IT moderno, los procesos comerciales deberían de ser compatibles e impulsados por entidades de datos, flujos de datos y reglas comerciales aplicadas a los datos. Un arquitecto de datos, por lo tanto, necesita tener un profundo conocimiento del negocio, así como del sector.

Cumpliendo con esas bases, se puede comenzar a construir un plan de datos adecuado para el negocio. Es el momento de diseñar cada entidad de datos, así como cada flujo de datos que habría por debajo de cada proceso comercial.

Este es el momento para planificar las siguientes áreas:

 

  • Las entidades de datos centrales y los elementos de datos, como los de clientes, productos y ventas.
  • Los datos de salida que se necesitan.
  • Los datos de origen que se recopilarán y transformarán, o harán referencia para producir los datos de salida.
  • Cuál es la propiedad de cada entidad de datos y cómo se debe consumir y distribuir según los casos de uso de la empresa.
  • Políticas de seguridad que se aplicarán a cada entidad de datos.
  • Las relaciones entre las entidades de datos, como integridad de referencia, reglas de negocio o secuencia de ejecución.
  • Clasificación estándar de datos y taxonomía.
  • Estándares de calidad de datos, operaciones y acuerdos de nivel de servicio (SLA).

Este nivel conceptual de diseño consiste en las entidades de datos subyacentes que soportan cada función comercial. El plan es crucial para el diseño exitoso y la implementación de arquitecturas empresariales y de sistemas y sus futuras expansiones o actualizaciones.

 

#2. Diseñar la arquitectura de datos de nivel lógico

 

A esta fase se le llama en ocasiones, modelado de datos al considerar qué tipo de base de datos o formato de datos usar. Esta fase lo que hace, es conectar los requisitos comerciales a las plataformas y sistemas tecnológicos.

Sin embargo, la mayoría de las organizaciones tienen un modelado de datos diseñado solo dentro de una base de datos o sistema particular, dada la función aislada del modelador de datos.

Lo que se debe de hacer, por tanto, para desarrollar una arquitectura de datos exitosa, es dar con un enfoque integrado, considerando los estándares aplicables a cada base de datos o sistema, y los flujos de datos entre estos sistemas de datos.

Para ello, las siguientes 5 áreas deben diseñarse de manera sinérgica:

 

  1. Las convenciones de nomenclatura para entidades y elementos de datos deben aplicarse de manera coherente a cada base de datos. Además, la integridad entre la fuente de datos y sus referencias debe hacerse cumplir si los mismos datos tienen que residir en múltiples bases de datos.
  2. Las políticas de archivo y retención de datos a menudo no se consideran o establecen hasta cada etapa tardía de la producción, lo que causa el desperdicio de recursos, estados de datos inconsistentes en diferentes bases de datos y un bajo rendimiento de las consultas y actualizaciones de datos.
  3. Si bien el diseño conceptual ha definido qué componente de datos es información confidencial, el diseño lógico debe tener la información confidencial protegida en una base de datos con acceso limitado, replicación de datos restringida, tipo de datos particular y flujos de datos seguros para proteger la información.
  4. Las réplicas de datos excesivas pueden generar confusión, mala calidad de datos y bajo rendimiento. Cualquier réplica de datos debe ser examinada por el arquitecto de datos y aplicada con principios y disciplinas.
  5. La forma en que los datos fluyen entre diferentes sistemas de bases de datos y aplicaciones debe definirse claramente en este nivel.

 

#3. La gobernanza de datos como clave para el éxito continuo de la arquitectura de datos

 

La arquitectura de datos no es estática, sino que debe gestionarse, mejorarse y auditarse continuamente. La gobernanza de datos, es fundamental en este caso, ya que garantiza que la arquitectura de datos empresariales se diseñe e implemente correctamente a medida que se inicia cada nuevo proyecto.

Si quieres saber más sobre la gobernanza del dato, aquí te dejo un post sobre “Qué es el Data Governance”.

 

La arquitectura de datos, sin embargo, es un elemento vivo que tiene que estar en continua adaptación.

En artyco, como expertos en datos, la arquitectura de datos es fundamental para poder afrontar cualquier reto relacionado con la tecnología de la información. Si estás buscando tener una estructura perfectamente definida de tus datos, cuenta con nosotros. ¿Hablamos?

 

Emilio Fernández Lastra

Chief Marketing Officer

“Después de la hipoteca, el inbound marketing es la mejor
herramienta para asegurar una relación a largo plazo”

¿Te ha parecido interesante lo que has leido?

En artyco podemos ayudarte a conseguir tus objetivos

¿Hablamos?

Si, quiero

+34 916 404 150

hola@artyco.com

© Artyco comunicación y servicios - Todos los derechos reservados

© Artyco comunicación y servicios - Todos los derechos reservados