Los 11 recursos principales para la ciencia de datos y el aprendizaje automático

Los datos son el nuevo petróleo. Y Machine Learning es el fuego. Quien controle a estos dos controlará el mundo.

No, lo anterior no es una frase pomposa sacada de una novela distópica.

es una realidad

El nuevo orden mundial tiene que ver con recopilar grandes cantidades de datos relevantes y procesarlos en información útil, algo que la raza humana no ha podido hacer en la historia. Es el tipo de tecnología que permite a un país adelantarse a los demás y, finalmente, gobernar el mundo.

Como resultado, las naciones progresistas del mundo lo están tomando muy, muy en serio.

Una lucrativa elección de carrera

Dejando a un lado la intriga internacional, la ciencia de datos y el aprendizaje automático son un nuevo campo candente con una oportunidad increíble. La demanda está fuera de serie (por decirlo suavemente) y no hay suficientes científicos de datos. Ni siquiera los mediocres.

Es como si hubiéramos descubierto de repente muchos nuevos planetas habitables, y no hay suficientes personas para trasladarlos. Podría seguir y sonar como un disco rayado, pero creo que esta infografía hace el trabajo mucho mejor:

Fuente: insidebigdata.com

Entonces vemos que los salarios comienzan en $ 50,000 o más, y para los gerentes, pueden dispararse mucho más allá de $ 250,000.

Y no solo eso, la persona promedio en este planeta generará 1.7 MB de datos por segundo. Eso es más de 3500 TB de datos durante toda la vida útil, más datos de los que sabemos cómo manejar a partir de ahora, y mucho menos usar para análisis. Decir que el futuro es brillante sería perjudicar a este magnífico nuevo pasto.

¿Son difíciles la ciencia de datos y el aprendizaje automático?

¡Buena pregunta!

Desde mi experiencia, la respuesta es tanto «sí» como «no».

La inteligencia artificial (y, por extensión, el aprendizaje automático) es lo más difícil de hacer si está dispuesto a investigar y superar los límites. Para tal trabajo, incluso un Ph.D. en informática y matemáticas no es suficiente. Pero entonces, la persona promedio no tiene ni la ambición ni el tiempo para tal búsqueda.

En el otro extremo está lo que yo llamaría ciencia de datos aplicada y aprendizaje automático.

Es decir, toma herramientas, técnicas y algoritmos existentes y los aplica para resolver algunos problemas del mundo real. Esta parte requiere dedicación, percepción y pensamiento creativo (y el conocimiento de algunos conceptos matemáticos simples, que se aprenden rápidamente), pero en cuanto al verdadero conocimiento «técnico», es mucho más indulgente que lo que llama el trabajo de un ingeniero de software.

En otras palabras, no es pan comido, pero según la relación recompensa-esfuerzo, es una de las mejores inversiones que existen.

Ahora que ha endurecido su determinación de convertirse en científico de datos e ingeniero de aprendizaje automático, comencemos a explorar las mejores opciones que existen.

Aprendizaje automático (Google)

No mucha gente lo sabe, pero Google tiene un amplio, muy práctico y curso gratuito sobre aprendizaje automático. Según la empresa, es parte de su compromiso con el avance de las tecnologías AI/ML y mantener el conocimiento abierto.

Lo mejor de este curso es que no hay requisitos previos, pero prepárese para pasar más tiempo explorando los conceptos de estadística por su cuenta.

Quiero decir, no es necesario, pero si no tiene experiencia en estadísticas avanzadas, las explicaciones de este curso pueden no ser suficientes. Otro inconveniente es que este curso introduce el aprendizaje automático a través de TensorFlow, que es una implementación de ML desarrollada por Google. Entonces, en cierto modo, Google tiene como objetivo promover sus API para Machine Learning, pero considerando el valor que ofrece este curso, no veo cómo eso debería ser un obstáculo.

En todo caso, TensorFlow es una de las maneras fáciles de ingresar a ML y goza de una gran popularidad (para ver una comparación de los marcos de IA, consulte esto).

Ciencia de los datos

El nombre Harvard inspira asombro, al igual que este curso.

Lo primero es lo primero: no es un curso de «vamos a ponernos sucios» rápido en el que andas de puntillas por Machine Learning escribiendo un fragmento aquí o un script aquí. Este curso es un bautismo de fuego severo que exige mucho trabajo y una importante inversión de tiempo.

El curso viene con videos gratuitos, código (alojado en GitHub) y soluciones para ejercicios de laboratorio, por lo que prácticamente, no está restringido por nada si quiere tomarlo.

¿Público ideal?

Tú… no estoy bromeando.

Diría que son profesionales que trabajan con una educación matemática decente, aunque ya no les interesen las matemáticas (los hábitos de inferencia y demostración son lo más necesario). Pero, una vez más, tenga cuidado: puede pensar que es bueno, pero este curso se sentirá como tener las uñas endurecidas para el desayuno: los problemas de práctica son lo suficientemente desafiantes como para hacerlo llorar, pero entonces, eso podría ser exactamente lo que necesita. ¡que estas buscando!

Aprendizaje automático

Entra en un bar lleno de científicos de datos y pregunta quién es Andrew Ng, y recibirás una paliza de tu vida.

En los círculos de ciencia de datos y aprendizaje automático, Andrew Ng ha alcanzado un estatus divino, gracias a su curso excepcional en Coursera: Aprendizaje automático.

Y si duda de las credenciales de Andrew Ng, dejaré que esto hable por sí mismo:

Es un curso pago, ya que es parte del plan de precios de Coursera, pero el compromiso financiero y la determinación no son los únicos requisitos previos. Este es un curso largo ya que Andrew se sumerge profundamente en las matemáticas detrás de todo lo relacionado con ML y disecciona algoritmos populares. Pero afortunadamente, es un curso completo, y serás guiado paso a paso hacia las profundidades más oscuras y te traerán de regreso.

¡Lo recomiendo encarecidamente, principalmente porque presumir el certificado de finalización de este curso se ha convertido en algo hoy en día!

Ciencia de datos aplicada

Las especializaciones en Coursera consisten en una serie de cursos que tienen como objetivo llevarlo de cero a competente en un concepto en particular. Si está buscando un curso completo, serio pero amigable sobre ciencia de datos y aprendizaje automático con Python, no puedo recomendar este especialización suficiente.

Al final del curso, obtienes un certificado.

Campamento de datos

Campamento de datos ofrece muchos cursos de ciencia de datos, que también incluyen varias habilidades y trayectorias profesionales. Desde la manipulación de datos hasta el aprendizaje automático, obtendrá habilidades de científico de datos para desarrollar su carrera en Python y R que lo ayudarán a tener éxito en el campo de la ciencia de datos.

Con el contenido del tamaño de un byte de DataCamp, puede aprender a su propio ritmo. Estos cursos le brindan experiencia práctica a través de la cual avanzará en sus habilidades de ciencia de datos.

Puede comenzar con la versión gratuita y evaluar el curso mirando el primer capítulo.

edX

Aprenda de MITx, Harvardx, IBM, RICEx, UCSanDiegox y GTx en el plataforma edX.

Todos ellos tienen un plan de estudios integral que lo ayuda a poseer habilidades de científico de datos. Estos programas son los más adecuados para aquellos que tienen experiencia en estadística o informática.

Si no está buscando un programa, puede elegir uno a la carta. En edX, encontrará más de 200 cursos relacionados con la ciencia de datos, que cubren Python, R, Excel, probabilidad, estadísticas, aprendizaje automático, visualización de datos y muchos más.

codecademia

Codecademy es otra plataforma que es uno de los mejores sistemas que te ayuda a aprender a codificar. Creen en «Aprender haciendo» y tienen muchos proyectos de práctica y pruebas en su plataforma.

los curso de ciencia de datos ofrecido por Codecademy incluye SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn y muchas más bibliotecas.

Toda la trayectoria profesional contiene 26 cursos que son más que suficientes para ayudarlo a convertirse en un científico de datos exitoso.

Este curso de datos:

  • Le brinda un conocimiento profundo de la ciencia de datos.
  • Proporciona una hoja de ruta fácil de seguir
  • Lo prepara para el trabajo al ayudarlo a obtener suficiente experiencia práctica

Udemy

Udemy no necesita presentación.

Bootcamp de Python para ciencia de datos y aprendizaje automático en Udemy es uno de los cursos más populares con más de 85K+ calificación de 4.6 y ha sido tomado por más de 370K estudiantes en todo el mundo.

A continuación se detallan los temas tratados en este curso:

A continuación se presentan las características/entregables de este curso:

  • 25 horas de videos bajo demanda
  • Acceso completo de por vida
  • 13 artículos y cinco recursos descargables
  • Acceso en Móvil y TV
  • Certificado de Finalización
  • 30 días de garantía de devolución de dinero

Entonces, si prefiere un curso económico, este sería el más adecuado para comenzar.

IA de Google

¿Le interesaría aprender aprendizaje automático de los expertos en aprendizaje automático de Google?

Bueno, entonces necesitas consultar los cursos sobre IA de Google.

Esta plataforma tiene cursos y contenido de aprendizaje automático y ciencia de datos para estudiantes, ingenieros de software, científicos de datos e incluso investigadores. Estos cursos son gratuitos.

Para empezar, Curso intensivo de aprendizaje automático en Google AI debería ser tu curso de referencia. Este es un curso de ritmo rápido con una introducción práctica usando las API de TensorFlow. A continuación los detalles de este curso:

Esta plataforma también tiene cursos específicos sobre temas importantes de aprendizaje automático como agrupamiento, sistemas de recomendación, pruebas y depuración en aprendizaje automático, separación de datos e ingeniería de funciones en el aprendizaje automático. En caso de que ya conozcas los conceptos básicos del aprendizaje automático, estos cursos serán de valor agregado.

audacia

Udacity también es una plataforma de aprendizaje electrónico muy popular que tiene una gran cantidad de cursos sobre tecnologías de tendencia. Tiene varios programas líderes en la industria creados y reconocidos por las principales empresas de todo el mundo, como AT&T, AWS, Google, IBM.

Uno de los programas en Udacity es para Data Science – Escuela de Ciencias de la Información. Este programa lo ayuda a obtener trabajos de analista de datos, científico de datos, ingeniero de datos y analista de negocios. Un curso sobre científico de datos en este programa es crucial y cubre conceptos sobre aprendizaje automático, aprendizaje profundo e ingeniería de software. Debe tener conocimientos básicos de aprendizaje automático para optar por este curso.

En caso de que conozca la programación de Python pero sea nuevo en el aprendizaje automático, hay otro programa en Udacity: Escuela de IA. Este programa tiene cursos que comienzan con los conceptos básicos de aprendizaje automático.

Aprendizaje profundo

Este curso es una bendición y es mi recomendación favorita en esta lista si eres programador.

Lo diría de nuevo: si eres un programador.

Eso es porque este curso no dedica tiempo a enseñarle los conceptos básicos de la programación. La descripción del curso lo dice en términos muy claros (el énfasis es original):

Asumimos que todos los que toman este curso tienen al menos un año de experiencia en programación. El curso usa python como lenguaje de enseñanza, por lo que si aún no conoce python, asumimos que dedicará tiempo a aprender; para un programador experimentado, debería encontrar que python es un lenguaje bastante fácil de aprender.

Entonces, si ya conoce Python (si no aprende aquí), o puede sentirse cómodo rápidamente, este es el curso perfecto para los pragmáticos que desean construir sistemas reales y utilizables sin preocuparse demasiado por los fundamentos teóricos de los algoritmos.

Incluso podría decir que es para los caldereros impacientes (¡como yo!) que odian la ceremonia y la monotonía.

Y oh, ¿mencioné que es 100% gratis y tiene una gran comunidad?

Conclusión

¡Uf!

Esta fue una lista difícil de compilar. No porque no hubiera suficientes buenas fuentes, ¡sino porque había demasiadas!

El aprendizaje automático es un dominio que ha explotado literalmente y está resolviendo problemas difíciles con mucha elegancia, por lo que hay cientos de cursos en línea, gratuitos y de pago, la mayoría de los cuales son realmente buenos. Pero esto también puede ser una fuente de confusión, por lo que he intentado reducirlo a once para diferentes tipos de alumnos según su nivel de experiencia.

¡Espero que haya ayudado!