Ciencia de datos. Preguntas frecuentes.
FAQ’S

¿Qué es la ciencia de datos?

La ciencia de datos es una disciplina que combina métodos científicos: la computación, las matemáticas, la estadística, el álgebra lineal y el cálculo; para extraer conocimiento o un mejor entendimiento de los datos. Es por ello, que algunos lo consideran una continuación de la estadística y de la minería de textos. Capaz de reflexionar sobre los efectos de sus propios métodos y apoyándose en la computación para mejorar el manejo de datos. De esta forma, incrementar el volumen sobre el que es capaz de trabajar.

Otros la definen como un concepto que engloba a la estadística, el análisis de datos y el aprendizaje automático (machine learning), y sus métodos relacionados; con el fin de entender y analizar los fenómenos reales a partir de sus datos.

Sin embargo, estos conocimientos de por sí no aseguran el éxito de la disciplina. Se requiere accesibilidad y un enfoque pragmático que genere recomendaciones y soluciones prácticas para cada proceso. A veces, apoyándose en los campos del saber o conocimiento del negocio que interviene. Tales como la lingüística, la topología, los sistemas de información geográfica, la bolsa de valores, la economía, etc. Aunque, persiste la tensión entre quienes creen que es necesario el conocimiento específico y los que creen que se puede hacer ciencia de datos de manera agnóstica; es decir, prescindiendo de estos conocimientos específicos del campo.

Para una definición más rigurosa, apóyese en el artículo de David Donoho, 50 years od Data Science

¿Cuál es el objetivo principal de esta disciplina?

Su objetivo principal es explotar los datos provenientes de distintas fuentes internas y externas. Esto lo hace desde la obtención de los datos, su limpieza, organización, transformación y disposición, su exploración y modelamiento, hasta las recomendaciones, prescripciones o predicciones. Esto último con el fin de develar patrones y tendencias que pueden subyacer ocultos. En consecuencia, estos hallazgos permiten optimizar desde los procesos de una organización hasta su productividad, identificando eficiencias en diferentes niveles.

¿Qué relación mantiene esta disciplina con el big data y la inteligencia artificial?

De su relación con el Big data

La ciencia de datos mantiene una estrecha relación con el big data, la inteligencia artificial, la minería de textos; además, de otros términos cada vez más populares.
En primer lugar, como disciplina, la ciencia de datos comprende desde conocimientos hasta técnicas en continúo desarrollo. Estas están destinadas a explotar el máximo valor que contiene la información. De esta forma, un científico de datos puede utilizar, por ejemplo, la minería de texto para conocer las palabras que mejor caracterizan un contenido; o para clasificar textos; o los comentarios que mueven a las personas a tomar la decisión de comprar un bien o servicio.  También, el big data cuando la cantidad de datos sobre los que se quiere trabajar son demasiados; lo que impide que puedan ser procesados por una computadora personal. En su lugar, debe recurrirse a sistemas como Hadoop o Spark.

De su relación con Inteligencia Artificial

En cuanto a la inteligencia artificial, es un tema sobre el que aún no hay consenso. En términos generales, puede decirse que la inteligencia artificial tiende a enfocarse en el desarrollo de sistemas inteligentes. Y, que en esa medida la ciencia de datos está a su servicio; aunque ésta también desarrolla sistemas que toman decisiones. En consecuencia, hay áreas de la inteligencia artificial de las que la ciencia de datos no se ocuparía. Aunque hay quienes plantean que tanto la inteligencia artificial como el aprendizaje automático (machine learning) son aplicaciones de la ciencia de datos; si bien, no son las aplicaciones típicas.

Puede decirse que la ciencia de datos se ocupa de problemas para los que se apoya en el big data y en el aprendizaje automático. Y que hay otro tipo de asuntos de los que se ocupa la inteligencia artificial. Asuntos novedosos para los que se apoya en algunos conocimientos y herramientas de la ciencia de datos; y para los cuales ella misma ha desarrollado los propios.

¿Qué son las iniciativas de ciencia de datos?

Iniciativas de datos para todos es el propósito que dio comienzo a Ciencia de datos. Soluciones para Pymes, Emprendedores. También para responsables de funciones muy valiosas como la de los Community Manager y los Estrategas digitales dentro y fuera de las organizaciones. También, por supuesto, para los profesionales de las ciencias sociales.

Nuestras iniciativas consisten en el uso inteligente de los datos, la información y los conocimientos; orientados de tal forma que proporcionen una base sólida para la toma de decisiones, buscando altos retornos de inversión. Es la forma cómo CDD quiere aportar valor a sus clientes; fortaleciendo y posicionando sus emprendimientos en el mercado a través del aporte de valor y un diferenciador.