¿Está planeando crear un Centro de Excelencia de Ciencia de Datos en su empresa?

Si indaga entre la comunidad de expertos en datos, y al equipo de Lucient en particular, hallará de manera recurrente algunas pregunta fundamentales, como estas:

  • ¿Cuáles son las pautas más importantes a la hora de crear un centro de esta clase?
  • ¿Con qué roles profesionales debe contar?
  • ¿Qué distingue a un buen científico de datos de uno excelente?

El objetivo es detectar errores y anomalías con mayor rapidez, para poder tomar con seguridad decisiones de negocio a través de la interpretación de los datos, en lugar de confiar en la propia intuición.

En este punto, muy probablemente, usted ya habrá invertido en disponer de una buena infraestructura en la nube y de un equipo de ingenieros de datos. Es posible que también haya reflexionado ya sobre algunas de las preguntas a investigar y esté listo para empezar.

Supongamos que el objetivo central de la ciencia de datos es generar información a partir de datos correctos, mediante los algoritmos adecuados, para ponerla a disposición de las personas indicadas.

Más concretamente: el objetivo es detectar errores y anomalías con mayor rapidez, para poder tomar con seguridad decisiones de negocio a través de la interpretación de los datos, en lugar de confiar en la propia intuición.

Principales directrices

¿Qué se debe buscar cuando se construye un Centro de Excelencia de Ciencia de Datos?

A continuación, enumeramos cuatro características esenciales que debe poseer un centro de este tipo, de acuerdo con expertos en el sector, incluido el equipo de Ciencia de Datos de Lucient.

1. Dar prioridad a generalistas antes que a especialistas

Al principio, especialmente, es normal desconocer el conjunto completo de análisis derivados de la ciencia de datos y en qué dirección exacta deben enfocarse. En un entorno como este, los perfiles generalistas son ideales. Puede ser que necesiten un poco más de tiempo al comienzo, pero suelen ser más flexibles en cuanto a enfoque, lo que puede resultar en una ventaja cuando se empieza. También suelen ser más hábiles para comunicarse con las diferentes audiencias objetivo o partes involucradas lo cual resulta de suma importancia, sobre todo en la fase inicial.

No es aconsejable salir en busca del “unicornio” capaz de hacerlo todo. No hay que esperar a disponer de un conocimiento detallado sobre cada área. Un “no lo sé” demuestra que un profesional es consciente de sus lagunas de conocimiento. Sin embargo, nuestro perfil generalista debería tener al menos suficiente experiencia y conocimientos técnicos en suficientes áreas como para poder aplicarlos al proceso general que se va a abordar.

2. Crear un equipo autónomo

Por supuesto, hay muchas preguntas que aclarar antes de que nuestro equipo de Ciencia de Datos pueda ponerse en marcha. (¿Con qué datos debemos trabajar? ¿Qué proyectos hay que elegir? ¿Apoyo a las decisiones empresariales o software para la producción?) Una vez que se haya respondido a todas ellas, el equipo debería ser capaz de actuar de forma autónoma. De lo contrario, demasiada interlocución con otros departamentos podría hacer más lento el avance o bloquearlo innecesariamente.

Para que el proyecto siga avanzando, el equipo debería disponer de un amplio abanico de habilidades. Un equipo autosuficiente puede trabajar de forma más independiente y superar los obstáculos con mayor facilidad[DAS4] .

Los roles más importantes deberían ser los siguientes (aunque entraremos en mayor detalle más adelante):

Científicos de datos, centrados en el análisis de datos y las estadísticas.

Ingenieros de software, que garantizan una codificación eficiente y fácilmente actualizable.

Ingenieros de datos, que gestionan bases de datos e infraestructuras escalables.

– “Gestor de Producto (Product Manager) que especifican los requisitos necesarios y se coordinan con otros equipos.

3. Recoger los frutos a su alcance

Es mejor escoger un proyecto sencillo y manejable en lugar de uno excesivamente ambicioso. La detección de fraudes, por ejemplo. Resulta más fácil que plantearse “¿qué dejará satisfechos a nuestros clientes?”. Al llevar a cabo el proyecto, el equipo tendrá la oportunidad de aprender nuevos procedimientos y mecanismos. Y si el alcance queda delimitado de manera concisa, se evitará gran parte del impacto que puedan tener los inevitables problemas de arranque que se presenten.  Las posteriores correcciones y mejoras de beneficiarán también de un alcance inicial discreto.

Aunque suene obvio, también es importante que el proyecto tenga un final. Aunque por definición todo proyecto tiene un principio y un final, los científicos de datos tienden a empantanarse en los detalles, afinándolos una y otra vez. Al fin y al cabo, la Ciencia de Datos no delimita un final teórico a los potenciales refinamientos y la profundización en la comprensión de procesos. Aquí es donde se hace necesario un “Product Manager” con visión integral y capacidad de decisión. Cuanto antes terminemos un proyecto, antes sabremos lo que tenemos que mejorar.

Si debe acometer un proyecto grande, se recomienda dividirlo en subproyectos. Si se complica demasiado, busque soluciones intermedias: aquí puede apoyarse en Machine Learning para tomar decisiones.

4. Establecer las expectativas adecuadas

No es ninguna novedad  que las empresas y organizaciones se están digitalizando a ritmo acelerado y acumulan grandes cantidades de datos. Por una parte, esto es por supuesto beneficioso, porque pueden aprender de ellos, pero es posible que puedan sentirse abrumadas por el enorme caudal de datos que recogen.

Aquí es donde entra en juego la Ciencia de los Datos, con sus predicciones de optimización y automatización. Por lo general, no es necesario recurrir a algoritmos de “Machine Learning” de alta gama al principio. En la mayoría de los casos, basta con métodos estadísticos relativamente sencillos.

Los proyectos de ciencia de datos son difíciles de planificar. Gran parte tiene lugar a base de ensayo y error. Pero cuanto antes se empiece, más rápido madurarán los flujos de trabajo y los procesos. Y más posibilidades habrá de transformarse en una organización orientada hacia los datos.

En cualquier caso, se debe involucrar al mayor número posible de partes interesadas para explicar lo que se puede conseguir en la práctica con la Ciencia de Datos. Hay que hablar con todas las audiencias objetivo (vendedores, directivos, ingenieros) de manera que nos entiendan. Porque puede ser que se necesite cierto tiempo para construir una infraestructura de datos operativa antes de que se comiencen a ver los resultados. Ahí es donde la comunicación sobre el trabajo que se hace demuestra que vale su peso en oro.

Roles profesionales en un equipo de ciencia de datos

Ya hemos hablado de algunos de los roles necesarios para establecer un Centro de Excelencia de Ciencia de Datos con éxito. Tras consultar la bibliografía pertinente y con los expertos de Lucient, hemos cristalizado una lista que identifica los principales perfiles a incluir.

En este punto hay que destacar que no se trata de puestos que cada uno de ellos deba ser ocupados por una sola persona. En la práctica, es habitual que estas competencias se distribuyan tanto entre distintas personas como que una sola pueda cubrir múltiples funciones.

– El “Chief Analytics Officer/Chief Data Officer” es el líder técnico. Es el puente con otros departamentos especializados. Se puede decir que es quien tiene la visión de proyecto.

– El Analista de Datos, que se encarga de interpretar y analizar correctamente los datos.

– El Analista de Negocio, que tiene la experiencia técnica necesaria para encauzar el análisis de datos.

– El Científico de Datos, que utiliza la tecnología de “Machine Learning” y la minería de datos para buscar soluciones.

– El Ingeniero de Aprendizaje Automático (Machine Learning Engineer), que se centra en la parte práctica / arquitectura de software del modelo de datos.

– El Periodista de Datos (Data Journalist), que se especializa en contar una historia a partir de los datos adquiridos.

– El Arquitecto de Datos, encargado de diseñar una infraestructura de datos adecuada. Su conocimiento se centra en la nube.

– El Ingeniero de Datos mantiene la infraestructura en funcionamiento.

¿Qué distingue a los buenos científicos de datos de los mejores?

Ahora que hemos examinado brevemente las directrices más importantes para la creación de un Centro de Excelencia de Ciencia de Datos, pasamos a lo que distingue a los buenos Científicos de Datos de los mejores.

Voluntad de aprender

El desarrollo práctico del “Machine Learning” y la IA (Inteligencia Artificial) avanza rápidamente. Es primordial estar al tanto de los avances para adoptar e implementar las nuevas tecnologías de manera temprana, especialmente cuando se lidera un equipo de esta clase.

Centrarse en el impacto empresarial

La ciencia de datos no es l’art pour l’art (“el arte por el arte”). Lo hacemos para obtener un valor añadido para la empresa. Los mejores científicos de datos piensan en temas claves del negocio, utilizan los recursos de forma adecuada y no se atascan innecesariamente en [FE11] preguntas superfluas que no vayan a traer un verdadero retorno de la inversión.

Sólidos conocimientos de ingeniería de software

Los mejores científicos de datos también piensan como desarrolladores y enfocan su atención en el código que resulta aplicable en la práctica.

Gestión de las expectativas

Los mejores científicos de datos conocen los diferentes enfoques que manejan las diversas partes involucradas en el proyecto y saben cómo comunicarse con ellas.

En la nube, como en casa.

Un científico de datos no llegará lejos sólo con su cuaderno, desconectado de la nube. Los mejores se mueven con naturalidad en plataformas como Azure, AWS o Google Cloud.

Lucient tiene la experiencia y los conocimientos necesarios para crear Centros de Excelencia de Ciencia de Datos, e impulsarlos mediante la capacitación de personal y el análisis de los proyectos, así como con la vista puesta en el desarrollo de negocio.

Sabemos cómo comunicarnos con las audiencias objetivo y cómo mantenernos en vanguardia de la tecnología, como miembros activos de la comunidad de expertos en datos, y en estrecho contacto con los proveedores de servicios, sin perder tampoco de vista las necesidades económicas de las empresas.

¡Estamos deseando comenzar a transformar sus datos en conocimiento junto a usted!