Colonna Pandas Insert()

Colonna Pandas Insert



“Python fornisce un'ampia gamma di strutture dati e operazioni per la gestione di dati numerici e di serie temporali. Il DataFrame che abbiamo creato o importato in Pandas può essere utilizzato per una varietà di scopi. È anche possibile regolare le colonne nel frame di dati, insieme all'origine dati. I panda semplificano molte delle attività noiose e dispendiose in termini di tempo associate all'elaborazione dei dati. Esistono quattro modi per aggiungere una colonna a un DataFrame in Pandas, ma in questo articolo utilizziamo la funzione 'insert()' della colonna del panda.

Dopo aver creato o caricato il nostro dataFrame in Pandas, ci sono una varietà di cose che potremmo voler realizzare. Ad esempio, potremmo continuare a manipolare i dati, ad esempio, modificando le colonne nel frame di dati. Successivamente, dobbiamo capire come includere le colonne in un frame di dati Se la maggior parte dei dati proviene da un fornitore di dati, ma alcuni dati provengono da un altro. Una colonna può essere facilmente aggiunta a un DataFrame Pandas.







Metodo Pandas insert()

L'ultima colonna del frame di dati è generata da una funzione diversa. Utilizzando il metodo 'insert()' di DataFrame, puoi aggiungere colonne tra le colonne correnti anziché aggiungerle nella parte inferiore del DataFrame panda. Ci offre la possibilità di aggiungere una colonna ovunque scegliamo, piuttosto che semplicemente alla conclusione. Inoltre, offre molti modi per aggiungere i valori per le colonne. Quando è necessario aggiungere una colonna in una posizione o indice specificati, la funzione panda 'insert()' è utile.



Sintassi per la colonna Pandas insert()



Esempio 1: inserimento di una colonna in un frame di dati utilizzando il metodo insert() di Pandas

Inizia con il primo esempio dell'articolo, in cui spiegheremo come inserire una colonna in un frame di dati. Usando lo strumento 'spyder', possiamo provare questo codice. Innanzitutto, generiamo un frame di dati chiamato 'corso'. Abbiamo due colonne in questo frame di dati, 'course_title' e 'fee'. Nella colonna 'titolo_corso' abbiamo un elenco di corsi 'python', 'java', 'orientato agli oggetti' e 'PHP'. Nella seconda colonna 'tariffa' abbiamo l'elenco delle tasse del corso che è '30000', '25000', '15000' e '22000'. Visualizzando il nostro dataFrame, 'corso', utilizzando 'pd. DataFrame”.





Successivamente, discuteremo della funzione principale del codice, che è la colonna 'insert()' di panda. È un metodo efficiente per includere un nuovo elenco nel frame di dati. È possibile aggiungere la nuova colonna in qualsiasi punto specificato utilizzando il metodo di inserimento. Questo metodo consente anche l'aggiunta manuale di una colonna a un frame di dati, ma l'adattabilità è minore.

Durante l'inserimento significa che il DataFrame di origine viene aggiornato direttamente durante il processo e non viene creato alcun nuovo DataFrame. In questo caso, abbiamo aggiunto una nuova colonna al nostro frame di dati con il nome 'Time_duration' utilizzando la funzione 'insert()'. L'elenco dei valori che abbiamo in questa colonna sono '6_mesi', '3_mesi', '3 mesi' e '6_mesi'. Abbiamo una colonna 'Time_duration' con un indice definito come '2' nel programma sottostante. Poiché l'indice specificato, al DataFrame verrebbe assegnato un intervallo che inizia da 0 e aumenta gradualmente, quindi significa che questa colonna viene visualizzata come terza colonna nel frame di dati. DataFrame aggiunge una nuova colonna denominata 'Time _duration' utilizzando la funzione 'pd.insert()'.



E ora, discutiamo l'output del programma dall'alto. Il suo output mostra un frame di dati che ha tre colonne. La colonna aggiuntiva viene aggiunta alla fine del frame di dati. Utilizzando il metodo 'pd.DataFrame.insert()', puoi aggiungere una colonna tra le altre colonne invece di aggiungerle alla fine del DataFrame panda. 'Time_ duration' è una nuova colonna che abbiamo aggiunto utilizzando 'insert' funzione. La posizione '2' si riferisce alla terza colonna nel DataFrame poiché la posizione inizia da 0. La colonna viene aggiunta all'ultimo posto nel frame di dati.

Esempio 2: aggiunta di colonne a un frame di dati utilizzando la funzione insert() di Pandas

Useremo il metodo 'insert()' per aggiungere nuove colonne al frame di dati. Invece di aggiungere colonne aggiuntive alla fine dei panda, puoi inserirle tra le colonne esistenti. Per generare un frame di dati simile all'esempio precedente, abbiamo preso tre colonne e assegnato loro dei valori. Nella prima colonna, 'Nome', abbiamo un elenco di nomi che includono 'Emma', 'Ella', 'Smith' e 'Maxwell'. Nella seconda colonna “Età” della lista dei valori abbiamo “29”, “36”, “39”, e “33”.

Successivamente, stiamo stampando una dichiarazione 'DataFrame'. Mostreremo il frame di dati sotto l'istruzione 'frame di dati'. Stiamo creando un'altra colonna per il frame di dati Pandas utilizzando la funzione 'insert()'. È necessario creare un elenco in modo che possa essere aggiunto come nuova colonna al set di dati fornito. Il metodo 'assign()' dei panda DataFrame può anche essere impiegato per aggiungere più colonne. Stiamo inserendo una nuova colonna utilizzando “df. inserire'. La colonna aggiuntiva denominata 'Sesso' mostra il sesso come 'Maschio' o 'Femmina'.

Stampiamo semplicemente un'altra istruzione, 'New Dataframe'. Un nuovo data frame verrà ora presentato sotto la dichiarazione “New Dataframe”, contenente la colonna aggiuntiva che abbiamo aggiunto con il “pd. inserisci()”. La colonna con un nome simile non può essere aggiunta utilizzando la funzione “insert()”. Nel caso in cui esista già una colonna nel frame di dati, per impostazione predefinita viene generato un errore di valore.

In questo output, la colonna che abbiamo creato utilizzando la funzione 'insert()' viene aggiunta al frame di dati. Il suo output mostra due frame di dati; il primo dataFrame è stato creato utilizzando 'pd.data frame', in cui abbiamo due colonne, 'Nome' e 'Età'. La nuova colonna 'genere' che abbiamo aggiunto utilizzando la funzione 'insert()' è mostrata nel secondo frame di dati visualizzato di seguito. Questo frame di dati dimostra che ci sono tre colonne con alcuni dati al loro interno. L'indice ha una dimensione '2', il che significa che ha voci da '0 a 3'. La nuova colonna che abbiamo assegnato a questo frame di dati ha una posizione di indice di '3'.

Conclusione

Un'operazione di analisi e aggiornamento dei dati comunemente usata è l'aggiunta di colonne a DataFrame. Tuttavia, Pandas ti offre numerose opzioni per completare l'attività offrendo quattro diversi metodi; tuttavia, utilizziamo solo una tecnica, che è la colonna 'insert()' di panadas, nel nostro articolo. Una delle parti più difficili dell'estensione di un DataFrame con nuove colonne è l'indicizzazione. Descriviamo rapidamente entrambi gli esempi. Per prima cosa abbiamo creato un frame di dati intitolato corso e aggiunto le colonne 'titolo del corso' e 'tariffa' e assegnato valori a questa colonna. Usando la funzione 'insert()', aggiungiamo quindi una nuova colonna allo stesso frame di dati indicando la sua posizione come '2' nell'indice. Nel secondo esempio vengono mostrati due dataFrame. Abbiamo creato due colonne ed elencato alcuni valori nel primo frame di dati. Quindi, utilizzando la funzione insert(), abbiamo inserito una nuova colonna nel data frame denominata 'Gender', anch'essa posizionata come '2' nell'indice; ora, ha visualizzato di nuovo la tabella, come mostrato nel secondo esempio sopra.

Dopo aver imparato le tecniche di cui sopra, possiamo facilmente aggiungere nuove colonne a DataFrame.