Manipulation de données

Exercices sur l’exploration et la manipulation de données avec pandas.

Objectifs

  • Explorer et manipuler des données

Chargement des données

Question

  1. Quelle est la population Suisse en 2000 ?
Note

Essayer d’utiliser la méthode .sum() pour additionner une colonne.

Astuce
print(f"Population en 2000: {pop["Pop_2000"].sum()}")
  1. De combien d’habitants la population Suisse a-t-elle augmenté entre 2000 et 2023 ?
Note

Le resultat de la méthode .sum() peut être utilisé dans une opération mathématique.

Astuce
accroissement = pop["Pop_2023"].sum() - pop["Pop_2000"].sum()

print(f"Accroissement de la population entre 2000 et 2023: {accroissement}")
  1. Quels sont les trois cantons qui ont le plus augmenté en population entre 2000 et 2020 ?
Note

Créer une nouvelle colonne qui calcule l’accroissement entre 2000 et 2020 pour chaque canton, puis trier les valeurs.

Note

La méthode .sort_values() peut être utilisée pour trier les valeurs d’une colonne.

Astuce
pop["Accr00_20"] = pop["Pop_2020"] - pop["Pop_2000"]

pop.sort_values("Accr00_20", ascending=False).head(3)[["Canton", "Accr00_20"]]
  1. Proportiellement, quel canton a le plus augmenté en population entre 2000 et 2020 ?
Note

Créer une nouvelle colonne qui calcule l’accroissement relatif entre 2000 et 2020 pour chaque canton, puis trier les valeurs.

Astuce
pop["Accr00_20_rel"] = (pop["Pop_2020"] - pop["Pop_2000"]) / pop["Pop_2000"] * 100

pop.sort_values("Accr00_20_rel", ascending=False).head(1)[["Canton", "Accr00_20_rel"]]
  1. Entre 2000 et 2010, quels sont les cantons dont la population a diminué ? De quel pourcentage ?
Note

Créer deux nouvelles colonnes qui calculent l’accroissement absolu et relatif entre 2000 et 2010 pour chaque canton, puis filtrer les cantons dont l’accroissement est négatif.

Note

Rappel de la synthaxe pour filtrer les données:
df[df["colonne"] < valeur]

Astuce
pop["Accr00_10"] = pop["Pop_2010"] - pop["Pop_2000"]
pop["Accr00_10_rel"] = pop["Accr00_10"] / pop["Pop_2000"] * 100

pop[pop["Accr00_10"] < 0].sort_values("Accr00_10")[["Canton", "Accr00_10"]]

pop[pop["Accr00_10"] < 0].sort_values("Accr00_10_rel")[["Canton", "Accr00_10_rel"]]