Pandas Dataframe Unico

Pandas Dataframe Unico



La libreria Python più popolare utilizzata nella scienza dei dati si chiama Pandas. Offre ai programmatori Python strumenti di analisi dei dati ad alte prestazioni, intuitivi e di facile utilizzo. Una volta comprese le funzioni fondamentali e come utilizzarle, Panda è un potente strumento per alterare i dati. In 'panda' i metodi standard per la memorizzazione dei dati in forma tabellare sono i DataFrames. Possiamo utilizzare alcuni metodi 'panda' per ottenere i valori univoci nella colonna 'panda' di DataFrame. Quando abbiamo bisogno di ottenere valori univoci nelle colonne di DataFrame e non vogliamo la duplicazione di valori nella colonna di DataFrame 'panda', possiamo utilizzare i metodi forniti da 'panda' per farlo. Diamo un'occhiata a tali metodi in questa guida, insieme ad alcuni esempi e output per ottenere valori univoci nella colonna 'panda' di DataFrame.

Metodi per ottenere valori univoci nelle colonne di DataFrame 'panda'.

Possiamo utilizzare due metodi per ottenere i valori univoci nelle colonne di DataFrame 'panda'. Eliminiamo i valori duplicati e otteniamo solo i valori univoci nelle colonne di DataFrames. I metodi che i 'panda' forniscono per svolgere questo compito sono:







  • Utilizzando il metodo unique().
  • Utilizzando il metodo drop_duplicactes().

Ora utilizzeremo entrambi i metodi nei codici 'panda' per ottenere i valori univoci nelle colonne di DataFrame 'panda'.



Esempio n. 01

L'app 'Spyder' viene utilizzata qui per generare questi codici 'panda' per utilizzare quei metodi che ci aiutano a ottenere i valori univoci nelle colonne 'panda' di DataFrame. Prima di creare il DataFrame, dobbiamo importare i moduli “panda”, che sono necessari per il codice “panda”. Usando il termine 'import' e inserendo 'pandas as pd', importiamo questi moduli.



Ora, con l'ausilio di “pd”, possiamo ottenere velocemente le funzioni oi metodi dei “panda”. Quindi mettiamo i 'Subject_data' in cui aggiungiamo 'Nome' e nel 'Nome', stiamo aggiungendo i dati del nome che sono 'Roman, William, Peter, Smith, John, Milli, Thomas e James'. Quindi, aggiungiamo i dati del soggetto in 'Subj' che sono 'Matematica, Economia, Scienza, Matematica, Statistica, Statistica, Statistica e Computer'. Quindi, convertiamo questo 'Subject_data' nel 'Subject_df' DataFrame utilizzando il metodo 'pd.DataFrame()'. Posizioniamo 'Subject_df' nel metodo 'print()' in modo che venga visualizzato sul terminale.





Ora, vogliamo ottenere i valori univoci nella colonna 'Subj' di DataFrame 'panda'. A questo scopo, utilizziamo qui il metodo 'unique()' e aggiungiamo il nome della colonna e anche il nome del DataFrame come mostrato di seguito. Aggiungiamo questo metodo in 'print()' in modo che il risultato venga visualizzato anche sul terminale.



Ora stiamo premendo 'Shift + Invio' per ottenere il risultato di questo codice e viene visualizzato sul terminale ed è mostrato anche qui, che contiene DataFrame con tutti i valori. Questo è il DataFrame originale che abbiamo aggiunto nel codice e sotto mostra i valori univoci della colonna 'Subj'. Elimina i valori duplicati e visualizza i valori univoci della colonna 'Subj' di DataFrame.

Esempio n. 02

Creiamo la “Sample_list” che contiene alcune informazioni. Inseriamo 'Layla, 21, 28, 31, 14 e 39' che apparirà come prima colonna quando convertiremo questo elenco nel DataFrame. Quindi, aggiungiamo 'Lusy, 31, 25, 34, 26 e 21' come seconda riga di DataFrame. Dopo questo, abbiamo 'Peter, 38, 20, 20, 35 e 24' e 'Layla 38, 23, 39 24, 23' che saranno la terza e la quarta riga di DataFrame. Inseriamo anche altri tre dati che sono “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” e anche “Pietro, 21, 21, 31, 21, 29” .

Ora stiamo convertendo 'Sample_list' in 'DF_Sample' che è il nome del DataFrame qui inserendo la funzione 'pd.DataFrame()'. Inoltre, impostiamo il nome delle colonne di questo DataFrame e questi nomi sono 'Nome, Ass_1, Ass_2, Ass_3, Ass_4 e Ass_5'. Quindi, utilizziamo 'print()' che aiuta a visualizzare il DataFrame 'DF_Sample'. Ora stiamo usando un altro metodo in questo esempio per ottenere i valori univoci nella colonna di DataFrame. Questo metodo è il metodo 'drop_duplicates()' di 'panda'.

Nel metodo 'drop_duplicates()', impostiamo il nome della colonna in cui vogliamo ottenere i valori univoci nella colonna di DataFrame. Stiamo ottenendo valori univoci della colonna 'Nome' eliminando i valori duplicati in questa colonna con l'aiuto del metodo 'drop_duplicates()' e anche renderizzando questi valori univoci usando la funzione 'print()' qui.

I nomi duplicati vengono eliminati e i valori univoci vengono visualizzati dopo aver applicato il metodo 'drop_duplicates()'. Puoi notare che il nome 'Layla' appare in tre celle della colonna 'Nome'. Ma quando il metodo 'drop_duplicates()' viene applicato a questa colonna, tutti i valori duplicati vengono eliminati e sullo schermo viene visualizzato un nome 'Layla'. Dopo aver eliminato i valori duplicati, è apparso il nuovo DataFrame che contiene i valori univoci in questa colonna 'Nome'. In questo modo, possiamo eliminare i valori duplicati e ottenere il valore univoco nella colonna di DataFrame con l'aiuto del metodo 'drop_duplicates()'.

Esempio n. 03

Lo stesso DataFrame viene utilizzato di nuovo e ora stiamo applicando il metodo 'unique()' qui. Con il metodo 'unique()' posizioniamo il nome della colonna e il nome del DataFrame su cui vogliamo applicare questo metodo 'unique()' per ottenere i valori univoci. Questo renderà solo i valori univoci di quella colonna e non mostrerà questi valori sotto forma di DataFrame.

Qui, il DataFrame contiene sette valori nella colonna 'Nome', ma quando applichiamo il metodo 'unique()' a questa colonna, sono apparsi solo quattro valori e questi sono i valori univoci di quella colonna. Non esegue il rendering di valori duplicati.

Esempio n. 04

Il DataFrame che creiamo in questo esempio è 'F_G_df'. Inseriamo “My_fruits” e “my_Vegs” in questo DataFrame. La colonna 'I miei_frutti' contiene 'Mela, arancia, mela, pera, litchi, mela, mela, pera e mela'. Successivamente, abbiamo 'My_Vegs' che contiene i nomi delle verdure che sono 'Chilli, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic e Ginger'. Questo DataFrame contiene solo due colonne.

Ora stiamo ottenendo i valori univoci in entrambe le colonne con l'aiuto del metodo 'unique()'. Citiamo il nome del DataFrame. Quindi, inserisci la colonna prima del nome della colonna. Successivamente, utilizziamo il metodo append(). In questa append, posizioniamo nuovamente il nome di DataFrame e il nome della seconda colonna e posizioniamo il metodo 'unique()'. Questo otterrà i valori univoci di entrambe le colonne, quindi aggiungerà i valori univoci di entrambe le colonne e li visualizzerà sullo schermo.

Viene eseguito il rendering di DataFrame contenente prima tutti i valori. Successivamente, viene applicato il metodo 'unique()' e di seguito vengono visualizzati i valori univoci di entrambe le colonne. In questo codice, otteniamo i valori univoci nelle colonne multiple di DataFrame utilizzando il metodo 'unique()'.

Conclusione

La spiegazione completa per ottenere i valori univoci nella colonna di DataFrame si trova in questa guida. Abbiamo discusso i metodi 'unique()' e 'drop_duplicates()' che ci aiutano a ottenere i valori univoci della colonna di DataFrame. Abbiamo esplorato come utilizzare questi metodi nel codice 'panda' utilizzando questi metodi qui nei nostri codici. Abbiamo illustrato diversi esempi in questa guida e ti abbiamo mostrato come ottenere i valori univoci di una colonna utilizzando il metodo 'unique()' e il metodo 'drop_duplicates()'. Abbiamo anche esplorato come ottenere i valori univoci in più colonne utilizzando il metodo 'unique()' in questa guida.