Data Scientists – El rol mas buscado en el valle
En el mundo actual de la tecnología que nos rodea, donde la computación en la nube se va haciendo parte de nuestro día a día (quien no usa los servicios de Google, Facebook, Twitter, Dropbox, o Evernote); dónde hay cada vez una mayor cantidad de dispositivos que estan las 24 horas del día conectadas a internet (desde teléfonos, tabletas y TVs hasta automoviles), acercandonos aún más al concepto de la Internet of Things. En este mundo dónde estamos generando datos constantemente, en el mundo de la Big Data!; se esta haciendo cada vez más necesario un nuevo perfil de profesionales de la información que se conocen con el nombre de Data Scientists o Cientificos de Datos.
Este nuevo tipo de profesionales es uno de los perfiles más escasos y a su vez más buscados en Silicon Valley. Y a medida que las empresas vayan tomando conciencia de la importancia de la Big Data y todo su potencial de negocios, sin duda se haran aún más escasos!.
Pero, ¿Quienes son estos Data Scientists? y ¿Cúales son las habilidades que los caracterizan?…
Los Data Scientists son profesionales, generalmente con conocimientos multidisiplinarios, que poseen el entrenamiento y la curiosidad necesarias para realizar descubrimientos en el intrincado mundo de la Big Data. Ellos son capaces de darle forma a la enorme cantidad de datos desestructurados que generamos día a día y hacer su analisis posible. Se encargan de identificar potenciales fuentes de información, unirlas y depurar el conjunto de resultados; los Data Scientists ayudan a los encargados de tomar las decisiones a moverse de un analisis ad hoc de los datos hacia una constante conversación con ellos.
Los Data Scientists se encargan de encontrar patrones en los datos, hacer descubrimientos en base a ellos, y comunicar las implicaciones de lo que han aprendido a través de su analisis, para indicar nuevas oportunidades de negocios. Ellos aconsejan a los ejecutivos y gerentes de productos sobre las implicaciones de los datos para los productos, procesos y decisiones.
Si bien, una primera impresión, se imaginaría a los Data Scientists como personas con un fuerte perfil analitico y mucho conocimiento estadístico y matemático, esta impresión estaría por demás errada. Ellos se caracterizan más por su parte científica; una de las facetas dominantes de su personalidad es su intensa curiosidad, el deseo por ir más allá de la superficie de los problemas, encontrar las preguntas en lo más profundo de ellos, e ir depurandolas hasta crear un claro conjunto de hipotesis que puedan ser probadas con datos concretos. Es por esto, que algunos de los más renombrados Data Scientists en las principales empresas de tecnología del mundo, vienen de campos poco convencionales como la Física y las Ciencias Sociales.
Lo que motiva a los Data Scientists no es armar hermosos reportes con información estructurada, para eso ya existen los analistas financieros; lo que realmente motiva a los Data Scientists es crear nuevas cosas, no solo dar consejo; ellos quieren crear soluciones que funcionen y generen un impacto innovador para el negocio y los consumidores.
Una podría pensar a los Data Scientists como un híbrido entre hacker, analista, comunicador y consejero; personas que tengan el conocimiento técnico necesario para manejar y analizar grandes cantides de datos, pero que a su vez tengan la suficiente noción y entendimiento de los negocios y la habilidad para comunicar los datos de una forma efectiva. Una combinación realmente rara de darse, pero sumamente efectiva!.
En lo que hace al apartado técnico, una de las habilidades básicas que todo buen Data Scientists debería tener, es sin duda la habilidad de escribir código, programar. Un buen Data scientists debería ser eficiente con al menos un lenguaje de programación de alto rendimiento (como C, C++ o Java) y tener nociones sobre los principales lenguajes que se manejan en internet (HTML, CSS3, Javascript, PHP).
También debería poseer buenos conocimientos sobre probabilidad y estadística, aquí lenguajes de programación con R y Python, pueden resultar realmente útiles.
Y finalmente, debería poseer conocimientos sobre los principales frameworks para el manejo de la Big Data, como por ejemplo Hadoop; conocimientos sobre la infraestructura de la computación en la nube; y sobre las principales bases de datos, tanto SQL como NoSQL.
Hasta aquí este artículo, espero les haya gustado y sido útil…
Saludos!,