Pandas
Aide mémoire
Aide mémoire pour la bibliothèque Pandas.
La bibliothèque Pandas est une bibliothèque Python qui permet de manipuler des données tabulaires.
Pour charger la bibliothèque Pandas :
import pandas as pd # Charger la bibliothèqueCharger les données
df = pd.read_csv("fichier.csv") # Charger un fichier CSV
df = pd.read_csv("https://url.com/fichier.csv") # Charger un fichier CSV depuis une URLAfficher les données
df.head() # Affiche les 5 premières lignes
df.tail() # Affiche les 5 dernières lignes
df.shape # Affiche le nombre de lignes et de colonnes
df.columns # Affiche les noms des colonnes
df.info() # Affiche les informations sur les colonnes
df["colonne"] # Affiche la colonne
df[["colonne1", "colonne2"]] # Affiche les colonnesFiltrer les données
df[df["colonne"] == "valeur"] # Filtre les lignes en fonction d'une valeur
df[df["colonne"].isin(["valeur1", "valeur2"])] # Filtre les lignes en fonction d'une liste de valeurs
df[df["colonne"].str.contains("valeur")] # Filtre les lignes en fonction d'une chaîne de caractères
df[df["colonne"] == df["colonne"].max()] # Filtre les lignes en fonction de la valeur maximale d'une colonne
df[df["colonne"] == df["colonne"].min()] # Filtre les lignes en fonction de la valeur minimale d'une colonneManipuler les données
df["nouvelle_colonne"] = df["colonne1"] + df["colonne2"] # Additionne deux colonnes existantes
df["nouvelle_colonne"] = df["colonne1"] * 2 # Multiplie une colonne par un nombre
df["nouvelle_colonne"] = df["colonne1"].str.replace("valeur1", "valeur2") # Remplace une valeur par une autre