Ottieni un numero di colonne in R DataFrame

Ottieni Un Numero Di Colonne In R Dataframe



In R, ottenere il numero di colonne è un'operazione di base richiesta in molte situazioni quando si lavora con DataFrames. Durante il subsetting, l'analisi, la manipolazione, la pubblicazione e la visualizzazione dei dati, il conteggio delle colonne è un'informazione cruciale da conoscere. Pertanto, R fornisce diversi approcci per ottenere il totale delle colonne del DataFrame specificato. In questo articolo, discuteremo alcuni degli approcci che ci aiutano a ottenere il conteggio delle colonne del DataFrame.

Esempio 1: utilizzo della funzione Ncol()

La ncol() è la funzione più frequente per ottenere il totale delle colonne dei DataFrame.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Numero di colonne nel Data Frame :', n)

In questo esempio, per prima cosa creiamo un DataFrame 'df' con tre colonne etichettate come 'y1', 'y2' e 'y3' utilizzando la funzione data.frame() in R. Gli elementi in ciascuna colonna vengono specificati utilizzando la funzione c() che crea un vettore di elementi. Quindi, utilizzando la variabile 'n', viene utilizzata la funzione ncol() per determinare il totale delle colonne nel DataFrame 'df'. Infine, con il messaggio descrittivo e la variabile 'n', la funzione cat() fornita stampa i risultati sulla console.



Come previsto, l'output recuperato indica che il DataFrame specificato ha tre colonne:







Esempio 2: contare le colonne totali per il dataframe vuoto

Successivamente, applichiamo la funzione ncol() al DataFrame vuoto che ottiene anche i valori delle colonne totali ma quel valore è zero.

df_vuoto <- data.frame()

n <- ncol(vuoto_df)

cat('---Colonne nel Data Frame :', n)

In questo esempio, generiamo il DataFrame vuoto, 'empty_df', chiamando data.frame() senza specificare colonne o righe. Successivamente, usiamo la funzione ncol() che viene utilizzata per trovare il conteggio delle colonne nel DataFrame. La funzione ncol() è impostata qui con il DataFrame 'empty_df' per ottenere le colonne totali. Poiché il DataFrame 'empty_df' è vuoto, non ha colonne. Quindi, l'output di ncol(empty_df) è 0. I risultati vengono visualizzati dalla funzione cat() che viene distribuita qui.



L'output mostra il valore '0' come previsto perché DataFrame è vuoto.

Esempio 3: utilizzo della funzione Select_If() con la funzione Length()

Se vogliamo recuperare il numero di colonne di qualsiasi tipo specifico, dovremmo usare la funzione select_if() insieme alla funzione length() di R. Vengono utilizzate queste funzioni che vengono combinate per ottenere il totale delle colonne di ogni tipo . Il codice per utilizzare queste funzioni è implementato nel seguente:

biblioteca (dplyr)

x1<-LETTERE[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Estate','Inverno'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

DF1

length(select_if(df1,is.numeric))

In questo esempio, per prima cosa carichiamo il pacchetto dplyr in modo da poter accedere alla funzione select_if() e alla funzione length(). Quindi, creiamo le quattro variabili: 'x1', 'x2', 'x3' e 'x4', rispettivamente. Qui, 'x1' contiene le prime 10 lettere maiuscole dell'alfabeto inglese. Le variabili 'x2' e 'x3' vengono generate utilizzando la funzione rpois() per creare due vettori separati di 10 numeri casuali con parametri 2 e 5, rispettivamente. La variabile “x4” è un vettore fattore con 10 elementi che vengono campionati casualmente dal vettore c (“Estate”, “Inverno”).

Quindi, tentiamo di creare il DataFrame 'df1' in cui tutte le variabili vengono passate nella funzione data.frame(). Infine, invochiamo la funzione length() per determinare la lunghezza del DataFrame 'df1' creato utilizzando la funzione select_if() dal pacchetto dplyr. La funzione select_if() seleziona le colonne da un DataFrame 'df1' come argomento e la funzione is.numeric() seleziona solo le colonne che contengono valori numerici. Quindi, la funzione length() ottiene il totale delle colonne selezionate da select_if() che è l'output dell'intero codice.

La lunghezza della colonna è mostrata nel seguente output che indica le colonne totali del DataFrame:

Esempio 4: utilizzo della funzione Sapply()

Al contrario, se vogliamo solo contare i valori mancanti delle colonne, abbiamo la funzione sapply(). La funzione sapply() itera su ogni colonna del DataFrame per operare in modo specifico. La funzione sapply() viene prima passata con DataFrame come argomento. Quindi, richiede l'operazione da eseguire su quel DataFrame. L'implementazione della funzione sapply() per ottenere il conteggio dei valori NA nelle colonne DataFrame è fornita come segue:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

In questo esempio, generiamo il DataFrame 'new_df' con tre colonne: 'c1', 'c2' e 'c3'. Le prime colonne, “c1” e “c3”, contengono i valori numerici inclusi alcuni valori mancanti che sono rappresentati da NA. La seconda colonna, “c2”, contiene i caratteri compresi alcuni valori mancanti, anch'essi rappresentati da NA. Quindi, applichiamo la funzione sapply() al DataFrame 'new_df' e calcoliamo il numero di valori mancanti in ogni colonna utilizzando l'espressione sum() all'interno della funzione sapply().

La funzione is.na() è l'espressione specificata nella funzione sum() che restituisce un vettore logico che indica se ciascun elemento nella colonna è mancante o meno. La funzione sum() somma i valori TRUE per contare il numero di valori mancanti in ogni colonna.

Pertanto, l'output visualizza i valori NA totali in ciascuna delle colonne:

Esempio 5: utilizzo della funzione Dim()

Inoltre, vogliamo ottenere le colonne totali insieme alle righe del DataFrame. Quindi, la funzione dim() fornisce le dimensioni del DataFrame. La funzione dim() prende l'oggetto come argomento di cui vogliamo recuperare le dimensioni. Ecco il codice per utilizzare la funzione dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

punti=c(8, 10, 7, 4))

debole(d1)

In questo esempio, per prima cosa definiamo il DataFrame 'd1' che viene generato utilizzando la funzione data.frame() in cui sono impostate due colonne 'team' e 'points'. Successivamente, invochiamo la funzione dim() sul DataFrame 'd1'. La funzione dim() restituisce il numero di righe e colonne del DataFrame. Pertanto, quando eseguiamo dim(d1), restituisce un vettore con due elementi, il primo dei quali riflette il numero di righe nel DataFrame 'd1' e il secondo rappresenta il numero di colonne.

L'output rappresenta le dimensioni del DataFrame dove il valore '4' indica le colonne totali e il valore '2' rappresenta le righe:

Conclusione

Abbiamo ora appreso che il conteggio del numero di colonne in R è un'operazione semplice e importante che può essere eseguita sul DataFrame. Tra tutte le funzioni, la funzione ncol() è la più conveniente. Ora, abbiamo familiarità con i diversi modi per ottenere il numero di colonne dal DataFrame dato.