Reindicizzare i panda

Reindicizzare I Panda



'Nei 'panda', possiamo archiviare molte informazioni in forma tabellare, nota anche come DataFrame. I 'panda' ci facilitano con il metodo 'DataFrame()' per costruire il DataFrame. Il DataFrame contiene indici e possiamo anche modificare gli indici del DataFrame utilizzando le funzioni 'panda'. Il metodo che utilizziamo per reindicizzare il DataFrame è il metodo 'reindex()'. Questo metodo aiuta a modificare i valori di indice della riga e i valori di indice delle colonne. Utilizzando questo metodo, possiamo modificare l'indice predefinito di DataFrame e, inoltre, possiamo modificare l'indice che abbiamo impostato durante la creazione di DataFrame. Useremo il metodo 'reindex()' nei nostri esempi 'panda' in questo tutorial e spiegheremo questo concetto in modo approfondito qui.'

Esempio n. 01

Lo strumento 'Spyder' ci aiuta a sviluppare il codice 'panda' qui in questo tutorial e iniziamo il nostro codice con la parola chiave 'import', che aiuterà nell'importazione della funzione 'panda'. Inseriamo 'pandas as pd' dopo aver digitato 'import'. Successivamente, creiamo il DataFrame digitando 'pd.DataFrame()'. Scriviamo questo 'pd' qui perché 'DataFrame()' è il metodo dei 'panda'. Il “value_df” è il nome della variabile in cui è salvato il DataFrame. Aggiungiamo 'RandomName', che è il nome della colonna, e 'RandomName' contiene 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander e Samuel'.







Poi, abbiamo “Valore_1”, in cui abbiamo inserito “16, 29, 24, 35, 44, 50, 69, 74 e 88”. Poi viene 'Valore_2' e abbiamo aggiunto '25, 38, 42, 56, 54, 65, 78, 89 e 99'. Ora, il 'Valore_3' viene dopo e vi posizioniamo '36, 48, 52, 69, 74, 75, 87, 91 e 69'. Dopo questa è presente la colonna “Valore_4”, dove abbiamo inserito “52, 64, 72, 88, 82, 95, 97, 21 e 39”. L'ultima colonna è la colonna 'Valore_5' qui e in questa colonna i valori che abbiamo aggiunto sono '66, 78, 82, 99, 34, 45, 57, 61 e 89'. Successivamente, utilizziamo la funzione 'print()' in cui viene aggiunto 'Values_df'. Verrà stampato sul terminale.




Dopo aver premuto 'Shift+Invio', possiamo facilmente ottenere il risultato dei nostri codici nell'app 'Spyder'. Qui, questo codice restituisce il DataFrame con l'indice predefinito. Ora applicheremo il metodo 'reindex()' per reindicizzare questo DataFrame in 'panda'.




La funzione 'reindex()' viene utilizzata qui per reindicizzare il valore dell'indice della riga. Nel DataFrame sopra, puoi vedere che i valori di indice predefiniti della riga vengono visualizzati e ora stiamo applicando il metodo 'reindex()' per reindicizzare quegli indici di riga. Posizioniamo il nome di DataFrame e quindi il metodo 'reindex()' in cui posizioniamo quei valori di indice che vogliamo aggiungere al DataFrame sopra. Mettiamo “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H e ind_I” nella funzione “reindex()”. Quindi, gli indici di queste righe verranno aggiornati su DataFrame quando eseguiamo questo codice.






I valori dell'indice della riga vengono visualizzati in questo risultato e puoi notare che i valori di DataFrame non vengono visualizzati qui e sono stati visualizzati i valori 'NaN'. Ciò è dovuto al fatto che i nuovi valori di indice non corrispondono ai valori di indice precedenti di DataFrame. Quando il nuovo indice e il vecchio indice non corrispondono, viene visualizzato 'Nan' lì. Questi valori 'NaN' vengono visualizzati per impostazione predefinita quando si cambia l'indice e non corrisponde all'indice precedente.



Esempio n. 02

Ora stiamo modificando i valori dell'indice di colonna del 'Value_df', che abbiamo precedentemente creato nell'esempio 1. Dopo aver stampato il 'Value_df', inseriamo la variabile 'column' e vi aggiungiamo alcuni valori. Aggiungiamo 'a_1, b_1, c_1, d_1 ed e_1'. Ora, vogliamo regolare questi valori come indice delle colonne, quindi, per questo, utilizziamo il metodo 'reindex()' e inseriamo il nome della variabile 'colonna' in cui sono memorizzati i nuovi valori dell'indice di colonna e imposta anche 'asse' su 'colonne', quindi aggiornerà l'indice dell'asse della colonna. Inseriamo il metodo 'reindex()' in 'print()', quindi verrà visualizzato anche sul terminale.


Poiché abbiamo utilizzato il metodo 'reindex()', i valori dell'indice di colonna presenti nel primo DataFrame vengono aggiornati e vengono aggiunti nuovi valori nel DataFrame aggiornato. Puoi anche notare che tutti i valori di DataFrame vengono convertiti in 'NaN' perché entrambi i valori di indice delle colonne sono diversi.

Esempio n. 03

'Programming_data' in questo codice contiene 'P_Languages', dove abbiamo aggiunto 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java e JavaScript'. Quindi, abbiamo 'Ore' in cui posizioniamo '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs e 6_hrs'. Successivamente viene inserito il “P_Code” e inseriamo “11523, 12423, 12321, 11456, 11454, 12267, 13106 e 14123”. Aggiungiamo la variabile 'p_index' e mettiamo 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G e Pro_H'.

Questi valori verranno utilizzati come valori di indice delle righe. Cambiamo 'Programming_data' nel DataFrame 'Programming_df'. Aggiungiamo anche 'p_index' a questo DataFrame utilizzando il metodo 'index'. Mettiamo 'Programming_df' e quindi il metodo 'index' e assegniamo 'p_index' a questo. Ora, i valori di indice sopra riportati vengono aggiunti come valori di indice delle righe a DataFrame. Stampiamo anche “Programming_df”.

Successivamente, aggiungiamo alcuni nuovi valori di indice nella variabile 'nuovo_indice', e questi sono 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 e P_8'. Poiché vogliamo aggiornare i valori di indice delle righe, utilizziamo il metodo 'reindex()' e mettiamo 'new_index' come parametro di questa funzione e memorizziamo anche il DataFrame aggiornato in 'newProgramming_df' e posizioniamo 'newProgramming_df' in ' print()” per la visualizzazione.


I valori dell'indice vengono aggiornati e possiamo anche dire di aver reindicizzato il DataFrame che abbiamo creato. Tutti i valori di DataFrame vengono anche convertiti in 'NaN' perché entrambi i valori di indice sono diversi.

Esempio n. 04

Al momento stiamo modificando i valori di indice 'Programming_df's' delle colonne, che abbiamo precedentemente sviluppato nell'esempio 3. Posizioniamo la variabile 'colonna' e inseriamo nuovi valori in essa. I 'P_Code, P_Languages, Hours e New' vengono aggiunti alla variabile 'column'. Quindi, utilizziamo di nuovo il metodo 'reindex()' in cui impostiamo la variabile 'colonna', che aggiornerà i valori dell'indice della colonna precedente e aggiungerà questi nuovi valori dell'indice della colonna a DataFrame.

Qui, puoi notare che i nuovi valori che abbiamo aggiunto in 'colonna' sono gli stessi che abbiamo aggiunto nel DataFrame sopra, ma la sequenza è diversa, quindi cambierà la sequenza delle colonne e regolerà tutte le colonne mentre menzionato nella variabile 'colonna'. Inoltre, aggiungiamo un altro valore di indice che non è presente nel DataFrame sopra, che è 'Nuovo' qui, quindi i valori 'NaN' appariranno in questa colonna.


La sequenza delle colonne viene modificata qui e tutti i valori vengono visualizzati come è presente nelle colonne del DataFrame originale e la colonna 'Nuovo' nel DataFrame aggiornato contiene tutti i valori 'NaN' perché questa colonna non è presente nel DataFrame originale.

Conclusione

Abbiamo presentato questo tutorial che ci aiuta a comprendere in dettaglio la nozione di 'panda reindex'. Abbiamo discusso di come reindicizzare una colonna di DataFrame e i valori di indice della riga. Abbiamo spiegato che la funzione 'reindex()' di 'panda' viene utilizzata per fare ciò. Abbiamo fatto diversi esempi in cui abbiamo modificato i valori di indice delle righe di DataFrame e anche i valori di indice dell'indice di colonna di DataFrame. Abbiamo reso i risultati di tutti i codici che abbiamo fatto qui in questo tutorial e li abbiamo anche spiegati in modo approfondito.