Colonna Somma Panda

Colonna Somma Panda



“Questo articolo dimostrerà come sommare tutte o determinate colonne in un Pandas DataFrame usando Python. La funzione DataFrame.sum() verrà utilizzata insieme ad alcuni parametri utili nei numerosi esempi di questo tutorial.

Al termine di questo tutorial, potresti sapere come:







    • Trova la somma della colonna dataframe in Pandas.
    • Aggiunta delle colonne dataframe insieme
    • Aggiungi colonne a un Dataframe Pandas che soddisfa la condizione specificata.
    • Determina la somma dopo aver raggruppato i dati del dataframe.

Come determinare la somma delle colonne del frame di dati?

La funzione 'dataframe.sum()' in Pandas restituisce la somma totale per l'asse specificato. Se l'input è un asse dell'indice, la funzione aggiunge i valori di ciascuna colonna individualmente, quindi fa lo stesso per ogni colonna, restituendo una serie che memorizza la somma dei dati/valori in ciascuna colonna. Inoltre, supporta il calcolo della somma del dataframe ignorando i valori mancanti.



Sintassi: DataFrame.sum(asse = Nessuno, skipna = Nessuno, livello = Nessuno, solo_numerico = Nessuno, conteggio_min = 0, **kwargs)



Dove,





asse: {colonne (1), indice (0)}

ordine: Ignora i valori NA/null durante il calcolo del risultato.



livello: Se l'asse specificato è gerarchico (un multiindice), contare fino a un determinato livello di indice prima di convertirlo in una serie.

solo_numerico: Sono accettabili solo colonne float, int e boolean. Se Nessuno, prova a usare tutto; in caso contrario, solo dati numerici. Per le serie, non implementato.

conteggio_min: Il numero di valori possibili necessari per completare l'operazione. Il risultato sarà NA se sono presenti meno valori non NA di min_count.

Ritorna: DataFrame (se il livello specificato) o Series.

Esempio n. 01: determinare la somma di una colonna Dataframe e di tutte le colonne

Abbiamo richiesto prima un dataframe con i tipi di dati validi, cioè int, float, ecc., colonna o colonne per le quali possiamo trovare la somma dei dati. Il dataframe verrà creato utilizzando la funzione pd.DataFrame().


Abbiamo creato il dataframe richiesto da un dizionario Python all'interno della funzione pd.DataFrame(). Nel dataframe sopra creato, ci sono quattro colonne 'Nome', 'giorno1', 'giorno2' e 'giorno3'. Su quattro colonne, le tre colonne cioè 'giorno1', 'giorno2' e 'giorno3' sono colonne numeriche con i valori dei dati (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) e (7, 4, 3, 5, 6, 2, 1, 4) rispettivamente. Possiamo trovare solo la somma per queste tre colonne. La somma di entrambe le serie (cioè una colonna) e di un intero dataframe può essere determinata utilizzando il metodo sum(). Iniziamo insegnando come sommare tutti i dati in una colonna Panda.


Per determinare la somma, abbiamo utilizzato il metodo sum() nella colonna 'day2'. La funzione ha restituito il valore di somma di 28. In modo simile, possiamo determinare la somma di ciascuna colonna di Dataframe. Il semplice utilizzo del metodo sum() sull'intero dataframe consentirà di ottenere ciò.


Come si vede, la somma della colonna “giorno1” è 31; per “giorno2” il valore della somma è 28, mentre per la colonna “giorno3” il valore della somma è 32.

Esempio n. 02: utilizzo della funzione sum() per sommare insieme i valori della colonna del frame di dati

Come puoi vedere dall'output dell'esempio precedente, la funzione non ha restituito i dati della colonna del frame di dati effettivi che costituivano la somma. Tuttavia, assegnando il metodo 'DataFrame.sum()' a una colonna DataFrame, puoi accedere a tutte le colonne di DataFrame, inclusa la colonna sum. Innanzitutto, creiamo un altro dataframe per questo esempio.


Utilizzando pd.DataFrame() è stato creato il nostro dataframe. Abbiamo creato il dataframe con tre colonne: articolo, prezzo e tasse. L'elemento della colonna contenente i valori della stringa ('penna', 'marcatore', 'righello', 'gomma', 'matita', 'appunti', 'cucitrice', 'spilli'), il prezzo della colonna che memorizza i valori (20, 15, 10, 3, 5, 30, 35, 10) e la colonna “imposta” è composta da valori (8, 5, 3, 3, 4, 10, 5, 2). Ora sommiamo i valori delle colonne prezzo e tasse e memorizziamo i risultati in una nuova colonna mantenendo le colonne dataframe originali.


Come si può notare insieme alla nuova colonna “totale”, vengono restituite dalla funzione anche le colonne originali del dataframe dato. La colonna 'totale' memorizza la somma dei valori delle colonne 'prezzo' e 'imposta' rispetto a ciascun dato 'articolo'.

Esempio n. 03: utilizzo della funzione sum() per determinare la somma delle colonne dataframe specificate

Per sommare insieme più colonne del dataframe, possiamo specificare un elenco con le etichette delle colonne e quindi applicare il metodo sum() sull'elenco per trovare la somma. Come negli esempi precedenti, creeremo prima il dataframe.


Abbiamo creato il nostro dataframe con quattro colonne 'studenti', 'voti1', 'voti2' e 'voti3'. La colonna 'studenti' memorizza i dati ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') e la colonna 'marks1' che memorizza i valori (8, 9, 6, 8, 10, 7, 9, 9), mentre le colonne “marks2” e “marks3” memorizzano i valori numerici (6, 6, 8, 6, 7, 9, 10, 9 ) e (7, 6, 9, 7, 8, 7, 10, 10) rispettivamente.


Innanzitutto, abbiamo creato un oggetto elenco con le etichette di colonna 'studenti', 'voti1' e 'voti3'. Quindi il metodo sum() viene applicato all'elenco. La funzione ha sommato i valori delle colonne voti1 e voti3 solo perché la colonna 'studenti' non è numerica, quindi la funzione sum() non riesce a trovare la somma per i valori della colonna 'studenti'. Abbiamo memorizzato la somma dei valori delle colonne “marks1” e “marks3” nella colonna “sum”.

Esempio n. 04: aggiungi colonne di Pandas Dataframe che soddisfano una condizione specificata

In questo esempio, aggiungeremo i valori delle colonne specificate se soddisfano la condizione specificata.


Ci sono 5 colonne nel dataframe appena creato, ovvero 'azienda', 'week1_sales', 'week2_sales', 'week3_sales' e 'branch'. Supponiamo ora di non voler aggiungere il valore dell'ultima colonna quando stiamo aggiungendo o trovando la somma dei valori delle righe dataframe date. Diciamo che volevamo solo aggiungere i valori delle colonne con la parola 'settimana' nelle loro etichette. È possibile creare un elenco di comprensione per determinare se la parola 'settimana' è presente o meno nell'etichetta di una colonna.


Ora abbiamo recuperato le colonne con la parola 'settimana' nelle loro etichette. Possiamo riassumere le colonne contenenti la parola 'settimana' usando l'argomento asse=1 nella funzione sum().


In questo modo, possiamo sommare in sicurezza i dati tra le colonne per riga senza includere colonne non desiderate.

Esempio n. 5: determinare la somma dopo aver raggruppato i dati del frame di dati

Possiamo anche trovare la somma delle colonne dataframe dopo aver raggruppato i dati di una o più colonne. Il metodo groupby() verrà utilizzato per raggruppare i dati in categorie all'interno della colonna. Creiamo un dataframe in modo da poter raggruppare i dati di una delle sue colonne.


Ora raggrupperemo i dati nella colonna 'età' e sommeremo i valori delle colonne 'punteggio1' e 'punteggio2' per ciascuna categoria del gruppo.


Possiamo vedere che sommando i dati nel dataframe dopo aver prima raggruppato i valori dei dati per età si ottiene una somma per colonna a seconda dei gruppi di età.

Conclusione

In questo tutorial, abbiamo cercato di insegnarti come calcolare la somma tra frame di dati utilizzando il metodo della somma di Pandas. Negli esempi di questo post abbiamo discusso dell'aggiunta di valori per riga e colonna. Inoltre, hai imparato come aggiungere colonne in modo condizionale e come sommare i valori dopo aver raggruppato la colonna del frame di dati. Ora potresti essere in grado di sommare insieme le colonne del frame di dati o sommare i valori all'interno della colonna del frame di dati da solo.