Mise en classe

Aide mémoire

Aide mémoire pour la mise en classe de données avec Pandas.

Éléments de base concernant Pandas: voir aide mémoire Pandas.

Ce document suppose que vous travaillez avec un tableau de donnée dans la variable df.

Méthodes de mise en classe

Pandas propose deux fonctions pour faire des mises en classe :

  • pd.cut() : pour la mise en classe avec amplitude fixe ainsi que la mise en classe manuelle.
  • pd.qcut() : pour la mise en classe avec effectifs fixes.

Amplitude fixe

Pour mettre en classe les valeurs dans la colonne valeurs en 4 catégories :

pd.cut(df["valeurs"], bins=4)

Classes manuelles

Pour spécifier vos propres classes, il faut donner une liste au paramètre bins.

pd.cut(df["valeurs"], bins=[4,6,8,10])

Effectifs fixes

pd.qcut(df["valeurs"], q=4)

Labels

Les deux fonctions de mise en classe cut et qcut peuvent remplacer les valeurs des intervalles par des labels avec le paramètre labels. Exemple avec une mise en classe avec effectifs fixes.

pd.qcut(df["valeurs"], q=4, labels=["faible", "moyen", "élevé", "très élevé"])