Chord diagrams vous connaissez?

Chord Diagram

Je suis sûre que vous avez déjà vu ce type de graphiques qu’on appelle Chord diagram. Ils ont un air assez sophistiqué et ça change un peu des visualisations classiques : histogrammes, pie chart et cie… Mais bon encore faut-il savoir quand et comment les utiliser.

Lire la suite de « Chord diagrams vous connaissez? »

Arbre de décision, comment ça marche?

Illustration arbre de décision

L’arbre de décision (decision tree en anglais) c’est un algorithme de machine learning facile et interprétable, idéal quand on débute en Data Science. Nous allons voir quels sont ses avantages et inconvénients, quand l’utiliser avec des explications simples sur son fonctionnement.

Lire la suite de « Arbre de décision, comment ça marche? »

Comment créer un échantillon représentatif ?

Comment réaliser un échantillon représentatif, quelle méthode utiliser?

Echantillonnage.pngAvec les technologies Big Data il n’est plus nécessaire d’échantillonner les données, on peut utiliser directement des algorithmes distribués sur des données massives.

Est ce qu’il faut pour autant oublier les bonnes vieilles méthodes d’échantillonnage? Of course not! Il y a bien d’autres contextes pour lesquels vous serez amenés à échantillonner. Par exemple pour extraire un échantillon de client pour faire des tests sur un produit, une offre, un email, ou pour réaliser une enquête de satisfaction, un sondage, …

L’échantillonnage, un seul objectif avoir un échantillon représentatif de la population. Comment s’y prendre?

Lire la suite de « Comment créer un échantillon représentatif ? »