Mise en classe
Aide mémoire
Aide mémoire pour la mise en classe de données avec Pandas.
Éléments de base concernant Pandas: voir aide mémoire Pandas.
Ce document suppose que vous travaillez avec un tableau de donnée dans la variable df.
Méthodes de mise en classe
Pandas propose deux fonctions pour faire des mises en classe :
pd.cut(): pour la mise en classe avec amplitude fixe ainsi que la mise en classe manuelle.pd.qcut(): pour la mise en classe avec effectifs fixes.
Amplitude fixe
Pour mettre en classe les valeurs dans la colonne valeurs en 4 catégories :
pd.cut(df["valeurs"], bins=4)Classes manuelles
Pour spécifier vos propres classes, il faut donner une liste au paramètre bins.
pd.cut(df["valeurs"], bins=[4,6,8,10])Effectifs fixes
pd.qcut(df["valeurs"], q=4)Labels
Les deux fonctions de mise en classe cut et qcut peuvent remplacer les valeurs des intervalles par des labels avec le paramètre labels. Exemple avec une mise en classe avec effectifs fixes.
pd.qcut(df["valeurs"], q=4, labels=["faible", "moyen", "élevé", "très élevé"])