microsoft data science: libro sobre sql server y la ciencia de datos

Microsoft data science

La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados,1​ lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.

microsoft data science

microsoft data science

El ganador del premio Turing, Jim Gray, imaginó la ciencia de datos como un “cuarto paradigma” de la ciencia (empírico, teórico, computacional y ahora basado en datos) y afirmó que “todo lo relacionado con la ciencia está cambiando debido al impacto de la tecnología de la información y el diluvio de datos”.

En este nuevo paradigma, los investigadores se apoyan de sistemas y procesos que son muy diferentes a los utilizados en el pasado, como son modelos, ecuaciones, algoritmos, así como evaluación e interpretación de resultados.

La ciencia de datos ha resultado para muchos una disciplina de reciente creación, pero en la realidad este concepto lo utilizó por primera vez el científico danés Peter Naur en la década de los sesenta como sustituto de las ciencias computacionales. En 1974 publicó el libro Concise Survey of Computer Methods 3​ donde utiliza ampliamente el concepto ciencia de datos, lo que permitió que se comenzara a utilizar más libremente entre el mundo académico.

En 1996 el término de Ciencia de Datos fue utilizado por primera vez en una conferencia, llamada “Ciencia de datos, clasificación y métodos relacionados” en una reunión de miembros de la IFCS (International Federation of Classification Societies).4​ En 1997, C.F. Jeff Wu dio una lectura llamada “¿Estadística = Ciencia de Datos?”, donde describió al trabajo estadístico como una trilogía conformada por recolección de datos, análisis y modelado de datos, y la toma de decisiones, haciendo la petición de que la estadística fuese renombrada como ciencia de datos y los estadísticos como científicos de datos.

En 2001, William S. Cleveland introdujo a la ciencia de datos como una disciplina independiente, extendiendo el campo de la estadística para incluir los “avances en computación con datos” en su artículo “Ciencia de datos: un plan de acción para expandir las áreas técnicas del campo de la estadística”. Cleveland estableció seis áreas técnicas que en su opinión conformarían al campo de la ciencia de datos: investigaciones multidisciplinarias, modelos y métodos para datos, computación con datos, pedagogía, evaluación de herramientas, y teoría.

En abril del 2002, el International Council for Science: Committee on Data for Science and Technology (CODATA) empezó la publicación del Data Science Journal,7​ enfocada en problemas como la descripción de sistemas de datos, su publicación en Internet, sus aplicaciones y problemas legales. Poco después, en enero del 2003, la Universidad de Columbia empezó a publicar The Journal of Data Science,8​ la cual ofreció una plataforma para que todos los profesionales de datos presentaran sus perspectivas e intercambiaran ideas.

En 2005, The National Science Board publicó “Colecciones de datos digitales de larga duración: Habilitando la investigación y la educación en el siglo XXI” definiendo a los científicos de datos como “científicos de computación e información, programadores de bases de datos y software, expertos disciplinarios, [. que son cruciales para la gestión exitosa de una colección digital de datos”, cuya actividad primaria es “realizar investigación creativa y análisis”.

VER LIBRO

Leave a Reply