Ordina il DataFrame in R

Ordina Il Dataframe In R



L'ordinamento dei DataFrame in R è un'operazione cruciale nell'analisi e nella manipolazione dei dati. Significativamente, R offre molta flessibilità nell'ordinamento dei dati in base a più colonne e nell'ordinamento in ordine crescente o decrescente. In R, l'ordinamento dei DataFrame può essere eseguito utilizzando una varietà di metodi e funzioni. In questo articolo, esamineremo varie funzioni che ci aiutano a ordinare il DataFrame in uno qualsiasi degli ordini specificati.

Esempio 1: ordinamento del DataFrame utilizzando il metodo Order() in R

La funzione order() in R viene utilizzata per ordinare i DataFrame in base a una o più colonne. La funzione order ottiene gli indici delle righe ordinate per riorganizzare le righe del DataFrame.

emp = dati. telaio ( nomi = C ( 'Andy' , 'Segno' , 'Bonnie' , 'Carolina' , 'John' ) ,

età = C ( ventuno , 23 , 29 , 25 , 32 ) ,

stipendio = C ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

gatto ( ' \N \N Dataframe ordinati per nomi in ordine crescente \N ' )

ordinato_asc = emp [ con ( emp , ordine ( nomi ) ) , ]

stampa ( ordinato_asc )

Qui definiamo il DataFrame 'emp' con tre colonne contenenti valori diversi. La funzione cat() viene distribuita per stampare l'istruzione per indicare che il DataFrame 'emp' in base alla colonna 'nomi' in ordine crescente verrà ordinato. Per questo, usiamo la funzione order() in R che restituisce le posizioni di indice dei valori in un vettore ordinato in ordine crescente. In questo caso, la funzione with() specifica che la colonna 'nomi' deve essere ordinata. Il DataFrame ordinato viene memorizzato nella variabile 'sorted_asc' che viene passata come argomento nella funzione print() per stampare i risultati ordinati.







Di conseguenza, i risultati ordinati della colonna DataFrame per 'nomi' in ordine crescente vengono visualizzati di seguito. Per ottenere l'operazione di ordinamento in ordine decrescente, possiamo semplicemente specificare il segno negativo con il nome della colonna nella precedente funzione order():





Esempio 2: ordinamento del DataFrame utilizzando i parametri del metodo Order() in R

Inoltre, la funzione order() accetta gli argomenti decrescenti per ordinare il DataFrame. Nell'esempio seguente, specifichiamo la funzione order() con l'argomento per ordinare in ordine crescente o decrescente:





df = dati. telaio (

id = C ( 1 , 3 , 4 , 5 , 2 ) ,

corso = C ( 'Pitone' , 'Giava' , 'C++' , 'MongoDB' , 'R' ) )

stampa ( 'Ordinato in ordine decrescente per ID' )

stampa ( df [ ordine ( df$id , decrescente = VERO ) , ] )

Qui, per prima cosa dichiariamo la variabile 'df' in cui la funzione data.frame() è definita con tre diverse colonne. Successivamente, usiamo la funzione print() in cui stampiamo un messaggio per indicare che il DataFrame verrà ordinato in ordine decrescente in base alla colonna 'id'. Successivamente, distribuiamo nuovamente la funzione print() per eseguire l'operazione di ordinamento e stampare i risultati. All'interno della funzione print(), chiamiamo la funzione 'order' per ordinare il DataFrame 'df' in base alla colonna 'course'. L'argomento 'decreasing' è impostato su TRUE per l'ordinamento in ordine decrescente.

Nell'illustrazione seguente, la colonna 'id' di DataFrame è disposta in ordine decrescente:



Tuttavia, per ottenere i risultati dell'ordinamento in ordine crescente, dobbiamo impostare l'argomento decrescente della funzione order() con FALSE come mostrato di seguito:

stampa ( 'Ordinato in ordine crescente per ID' )

stampa ( df [ ordine ( df$id , decrescente = FALSO ) , ] )

Lì, otteniamo l'output dell'operazione di ordinamento del DataFrame dalla colonna 'id' in ordine crescente.

Esempio 3: Ordinamento del DataFrame utilizzando il metodo Arrange() in R

Inoltre, possiamo anche usare il metodo arrange() per ordinare un DataFrame per colonne. Possiamo anche ordinare in ordine crescente o decrescente. Il seguente codice R dato utilizza la funzione arrange():

biblioteca ( 'dplir' )

alunno = dati. telaio (

Id = C ( 3 , 5 , 2 , 4 , 1 ) ,

segni = C ( 70 , 90 , 75 , 88 , 92 ) )

stampa ( 'Aumentare l'ordinamento degli ordini per ID' )

stampa ( organizzare ( alunno , Id ) )

Qui, carichiamo il pacchetto 'dplyr' di R per accedere al metodo arrange() per l'ordinamento. Quindi, abbiamo la funzione data.frame() che contiene due colonne e imposta DataFrame nella variabile 'studente'. Successivamente, distribuiamo la funzione arrange() dal pacchetto 'dplyr' nella funzione print() per ordinare il DataFrame specificato. La funzione arrange() accetta il DataFrame 'studente' come primo argomento, seguito dall''Id' delle colonne in base a cui ordinare. La funzione print() alla fine stampa il DataFrame ordinato sulla console.

Possiamo vedere dove la colonna 'Id' è ordinata in sequenza nel seguente output:

Esempio 4: ordinamento del DataFrame per data in R

Il DataFrame in R può anche essere ordinato in base ai valori della data. Per questo, la funzione ordinata deve essere specificata con la funzione as.date() per formattare le date.

data dell'evento = dati. telaio ( evento = C ( '3/4/2023' , '2/2/2023' ,

'10/1/2023' , '29/03/2023' ) ,

oneri = C ( 3100 , 2200 , 1000 , 2900 ) )

data dell'evento [ ordine ( COME . Data ( evento_data$evento , formato = '%d/%m/%Y' ) ) , ]

Qui abbiamo un DataFrame “event_date” che contiene la colonna “event” con le stringhe di data nel formato “mese/giorno/anno”. Dobbiamo ordinare queste stringhe di data in ordine crescente. Usiamo la funzione order() che ordina il DataFrame in base alla colonna 'event' in ordine crescente. Realizziamo ciò convertendo le stringhe di data nella colonna 'event' nelle date effettive utilizzando la funzione 'as.Date' e specificando il formato delle stringhe di data utilizzando il parametro 'format'.

Pertanto, rappresentiamo i dati ordinati in base alla colonna della data 'evento' in ordine crescente.

Esempio 5: ordinamento del DataFrame utilizzando il metodo Setorder() in R

Allo stesso modo, il setorder() è anche un altro metodo per ordinare il DataFrame. Ordina il DataFrame prendendo l'argomento proprio come il metodo arrange(). Il codice R per il metodo setorder() è dato come segue:

biblioteca ( 'tabella dati' )

d1 = dati. telaio ( ID ordine = C ( 1 , 4 , 2 , 5 , 3 ) ,

orderItem = C ( 'mela' , 'arancia' , 'kiwi' , 'Mango' , 'banana' ) )

stampa ( impostare l'ordine ( d1 , orderItem ) )

Qui, impostiamo prima la libreria data.table poiché setorder() è la funzione di questo pacchetto. Quindi, utilizziamo la funzione data.frame() per creare il DataFrame. Il DataFrame è specificato con solo due colonne che usiamo per ordinare. Successivamente, impostiamo la funzione setorder() all'interno della funzione print(). La funzione setorder() accetta il DataFrame 'd1' come primo parametro e la colonna 'orderId' come secondo parametro in base al quale viene ordinato il DataFrame. La funzione “setorder” riorganizza le righe della tabella dati in ordine crescente in base ai valori nella colonna “orderId”.

Il DataFrame ordinato è l'output nella seguente console di R:

Esempio 6: ordinamento del DataFrame utilizzando il metodo Row.Names() in R

Il metodo row.names() è anche un modo per ordinare il DataFrame in R. Row.names() ordina i DataFrame in base alla riga specificata.

df < - dati. telaio ( squadra = C ( 'X' , 'X' , 'E' , 'E' , 'CON' ) ,

punto = C ( 91 , 80 , 86 , 83 , 95 ) )

riga. nomi ( df ) < - C ( 'UN' , 'D' , 'C' , 'E' , 'B' )

df [ ordine ( riga. nomi ( df ) ) , ]

Qui, la funzione data.frame() è stabilita all'interno della variabile 'df' dove le colonne sono specificate con i valori. Quindi, i nomi delle righe del DataFrame vengono specificati utilizzando la funzione row.names(). Successivamente, chiamiamo la funzione order() per ordinare il DataFrame in base ai nomi di riga. La funzione order() restituisce gli indici delle righe ordinate che vengono utilizzate per riorganizzare le righe del DataFrame.

L'output mostra il DataFrame ordinato per righe in ordine alfabetico:

Conclusione

Abbiamo visto le diverse funzioni per ordinare i DataFrame in R. Ciascuno dei metodi ha un vantaggio e necessita dell'operazione di ordinamento. Possono esserci più metodi o modi per ordinare il DataFrame in linguaggio R, ma i metodi order(), arrange() e setorder() sono i più importanti e facili da usare per l'ordinamento.