Ressources en Machine Learning

Yasmine Maricar
3 min readAug 1, 2018

Bonjour à tous,

J’ai décidé d’écrire un premier petit article à destination de ceux qui souhaitent s’initier/aller plus loin en Machine Learning et ne savent pas forcément par où commencer.

Je vous présente donc une petite liste de ressources pour débuter dans ce domaine.

Dans le domaine de l’apprentissage automatique et de la science des données, il nous faut tout d’abord de solides bases en mathématiques (algèbre linéaire, statistiques/probabilités et optimisation mathématique sont de mise).

I ) Les notions de mathématiques et statistiques

Pour les probas et les stats, vous pouvez passer cette étape (2 moocs intéressants) :

https://lagunita.stanford.edu/courses/course-v1:OLI+ProbStat+Open_Jan2017/info

https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winter2016/info

D’autres ressources utiles provenant de Stanford :

  1. Convex Optimisation : http://cs229.stanford.edu/section/cs229-cvxopt.pdf
  2. Probability Theory : http://cs229.stanford.edu/section/cs229-prob.pdf
  3. Linear Algebra (!) : http://cs229.stanford.edu/section/cs229-linalg.pdf

Je vous renvoie à cet article détaillé pour plus d’informations concernant les mathématiques utiles pour la data science :

https://elitedatascience.com/learn-math-for-data-science

En réalité, vous pouvez très bien commencer les cours cités ci-après et qui rentrent dans le vif du sujet, sans avoir au préalable compilé les ressources citées, car les cours sont destinés aux personnes débutantes, et des petits rappels vous seront sans doute donnés. Je vous recommande de commencer les cours suivants si vous avez déjà quelques bases en mathématiques, et vous référer aux sources ci-dessus si vous avez besoin de revoir certains points/vous rafraîchir la mémoire.

II ) Cours en ligne

https://www.datacamp.com/courses/intro-to-python-for-data-science : ce cours permet une introduction à Python et la Data Science.

Il serait utile pour vous d’avoir de bonnes bases en Python et des connaissances en R qui est également assez utilisé en data science et peut être bien à maitriser.

Les deux cours principaux que je vous recommande sont ceux d’Andrew Ng, chercheur en IA et ancien professeur à Stanford (il a entre autres travaillé pour Google et Baidu dans ce domaine).

Andrew est très pédagogue et ses cours sont vraiment bien :)

  1. Machine Learning : https://www.coursera.org/learn/machine-learning
  2. Deep Learning : https://www.coursera.org/specializations/deep-learning -> meilleur pour directement commencer des projets liés à de la Computer Vision avec des réseaux de neurones !

Je vous recommande aussi les cours interactifs de Datacamp et Kaggle pour le Machine Learning (notebooks incrustés dans la page pour coder, et guidé) :

  1. DATACAMP tutorials : https://www.datacamp.com/
  2. Kaggle Learn : https://www.kaggle.com/learn/overview
  3. plateforme de learning Google : https://ai.google/education#?modal_active=none

PS : vous pouvez accéder au contenu du cours gratuitement en appuyant sur « auditeur libre » quand vous vous inscrivez à chaque cours.

III) Plateformes de compétition et échanges de la communauté

Rien de mieux que de faire des projets pour apprendre, je vous recommande d’essayer de faire les projets de Kaggle (c’est une plateforme web organisant des compétitions en science des données. Sur cette plateforme, les entreprises proposent des problèmes en science des données et offrent un prix aux data scientists offrant les meilleures performances. ) référencés comme étant éducatifs, pour commencer :

Un tutoriel datacamp autour du Dataset Titanic sur Kaggle : https://www.datacamp.com/community/open-courses/kaggle-python-tutorial-on-machine-learning

Les compétitions « getting started » sur Kaggle :

https://www.kaggle.com/competitions?sortBy=grouped&group=general&page=1&pageSize=20&category=gettingStarted

Les communautés data science sont nombreuses sur meetup.com, des meetups sont souvent organisés sur Paris. (n’hésitez pas à voir mes groupes sur mon profil et vous inscrire aux prochains meetups qui vous intéressent : https://www.meetup.com/fr-FR/Paris-Datageeks/members/199484445/ )

Il y a également des groupes facebook ou Twitter ou encore Quora qui peuvent accueillir des échanges autour de la data science.

IV) Ressources complémentaires (compilation)

Sites de data scientists utiles : https://machinelearningmastery.com/

un « stackoverflow » de la data : https://www.kdnuggets.com/

J’espère que ce post vous aura été utile, il y a encore beaucoup de ressources disponibles sur internet, à vous de jouer en vous lançant dans des projets data !

--

--

Yasmine Maricar

AI/ML Tech Lead @Electronic Arts | Ex AI Cloud Architect @Microsoft | DS/ML Expert | NLP/NLU/NLG | XAI | Writer & Artist