Elenco dei 10 migliori libri e descrizioni di data science per il generalista

Elenco Dei 10 Migliori Libri E Descrizioni Di Data Science Per Il Generalista



La scienza dei dati è il campo di studio che gestisce grandi quantità di dati utilizzando metodi, processi, algoritmi e sistemi scientifici per trovare schemi invisibili, ricavare informazioni significative, prendere decisioni aziendali nelle aziende e utilizzarle anche in istituzioni non commerciali. Le istituzioni non commerciali includono settori per la sanità, i giochi, il riconoscimento delle immagini, i sistemi di raccomandazione, la logistica, il rilevamento delle frodi (istituti bancari e finanziari), la ricerca su Internet, il riconoscimento vocale, la pubblicità mirata, la pianificazione delle rotte aeree e la realtà aumentata. La scienza dei dati è un sottoinsieme dell'intelligenza artificiale. I dati utilizzati per l'analisi possono provenire da molte fonti diverse e sono presentati in vari formati. Alcuni dei dati di origine possono essere standardizzati; altri potrebbero non essere standardizzati.

Per dirla in altro modo, vengono utilizzate diverse metodologie per raccogliere i dati (plurale di datum). Quindi, la conoscenza (preziose conclusioni) viene estratta dai dati raccolti. Nel processo, dopo che i dati sono stati raccolti, viene effettuata la ricerca su di essi (dati) per ottenere nuovi dati (risultati) da cui i problemi vengono risolti.







La scienza dei dati come disciplina (principale) esiste a livello di laurea triennale e magistrale all'università. Tuttavia, solo poche università al mondo offrono la scienza dei dati al Bachelor o al Master. A livello di laurea triennale, lo studente si laurea con una laurea in Data Science. È come una laurea generica. A livello di laurea magistrale, lo studente parte con una laurea post-laurea in Data Science, specializzandosi in Data Analytics, Data Engineering o come Data Scientist.



Potrebbe sorprendere il lettore, e forse sfortunatamente, che Machine Learning, Modeling, Statistics, Programming e Databases siano conoscenze prerequisite per studiare la Data Science a livello di laurea triennale nonostante siano corsi universitari rispettati a pieno titolo, studiati in altre discipline a livello di laurea triennale o magistrale. Nonostante ciò, quando uno studente va in un'università per studiare Data Science a livello di laurea, tutti questi corsi saranno comunque studiati, insieme o prima dei corsi propri, per Data Science.



La scienza dei dati per la laurea triennale o le sue specializzazioni come analisi dei dati, ingegneria dei dati o come scienziato dei dati sono ancora in fase di sviluppo; sebbene abbiano raggiunto uno stadio in cui vengono applicati nelle industrie dopo essere stati studiati (all'università). La scienza dei dati è una disciplina relativamente molto nuova, nel complesso.





Ricorda che dovresti prima essere un generalista prima di diventare uno specialista. Le distinzioni tra i programmi specialistici non sono ancora chiare. Le distinzioni tra i programmi generalisti e specialistici non sono ancora chiare.

Poiché la scienza dei dati è una disciplina relativamente nuova, i libri prescritti in questo documento si basano sulla copertura dei contenuti e non sulla pedagogia (quanto bene insegna il libro). E sono per il programma di laurea (generalista). Ci sono diversi corsi generalisti.



La lista

Per maggiori dettagli ed eventuali acquisti con carta di credito, viene fornito un collegamento ipertestuale per ciascuno dei libri. Nessuno dei libri copre tutti i corsi generalisti.

Matematica essenziale per la scienza dei dati: calcolo, statistica, teoria della probabilità e algebra lineare

Scritto da: Hadrien Jean

  • Editore: Hadrien Jean
  • Data di pubblicazione: dopo il 30 settembre 2020
  • Lingua: inglese
  • Numero di pagine: ‎più di 400

Il contenuto di questo libro può essere visto come il corso di matematica per Data Science. Sebbene non sia consigliabile imparare la scienza dei dati da solo, un diplomato che vuole imparare la scienza dei dati da solo dovrebbe iniziare con questo libro.

Contenuto: Calcolo; Statistica e Probabilità; Algebra lineare; Scalari e Vettori; Matrici e Tensori; Span, dipendenza lineare e trasformazione dello spazio; Sistemi di equazioni lineari; Autovettori e Autovalori; Scomposizione di un valore singolo.

https://www.essentialmathfordatascience.com/

Una guida di buon senso alle strutture dati e agli algoritmi: migliora le tue abilità di programmazione di base / 2a edizione

Scritto da: Jay Wengrow

  • Editore: Libreria pragmatica
  • Data di pubblicazione: 15 settembre 2020
  • Lingua: inglese
  • Dimensioni: 7,5 x 1,25 x 9,25 pollici
  • Numero di pagine: ‎508

Questo libro si occupa di algoritmi e strutture di dati utilizzati in Data Science. Supponendo che qualcuno stia imparando Data Science da solo dopo essersi diplomato al liceo, allora questo è il prossimo libro da leggere dopo aver letto il precedente libro di matematica. I programmi di esempio sono forniti in JavaScript, Python e Ruby.

Contenuto: perché le strutture dati sono importanti; Perché gli algoritmi sono importanti; O si! Notazione O grande; Velocizzare il tuo codice con Big O; Ottimizzazione del codice con e senza Big O; Ottimizzazione per scenari ottimistici; Grande O nel codice di tutti i giorni; Ricerca velocissima con tabelle hash; Creazione di codice elegante con pile e code; Ricorsione ricorsiva con ricorsione; Imparare a scrivere in Ricorsivo; Programmazione Dinamica; Algoritmi ricorsivi per la velocità; Strutture dati basate su nodi; Velocizzare tutte le cose con alberi di ricerca binari; Mantieni le tue priorità dritte con gli heap; Non fa male provare; Connettere tutto con i grafici; Affrontare i vincoli di spazio; Tecniche per l'ottimizzazione del codice

Scienza dei dati più intelligente: successo con dati di livello aziendale e progetti di intelligenza artificiale / 1 st La modifica

Scritto da: Neal Fishman, Cole Stryker e Grady Booch

  • Editore: Wiley
  • Data di pubblicazione: 14 aprile 2020
  • Lingua: inglese
  • Numero di pagine: ‎286

Contenuto: scalare la scala dell'IA; Inquadramento Parte I: Considerazioni per le organizzazioni che utilizzano l'intelligenza artificiale; Inquadramento Parte II: considerazioni per lavorare con dati e intelligenza artificiale; Uno sguardo indietro sull'analisi: più di un martello; Uno sguardo al futuro sull'analisi: non tutto può essere un chiodo; Affrontare le discipline operative sulla scala AI; Massimizzare l'uso dei tuoi dati: essere guidati dal valore; Valutazione dei dati con analisi statistiche e abilitazione di un accesso significativo; Costruire per il lungo termine; Fine del viaggio: un'intelligenza artificiale per l'IA.

Machine Learning: A Probabilistic Perspective (serie Adaptive Computation and Machine Learning) Illustrated Edition

Scritto da: Kevin P.Murphy

  • Editore: MIT Press
  • Data di pubblicazione: 24 agosto 2012
  • Lingua: inglese
  • Dimensioni: 8,25 x 1,79 x 9,27 pollici
  • Numero di pagine: ‎1104

Questo libro va bene per i principianti. Ancora una volta, come tutti gli altri libri prescritti in questo documento, questo libro non copre tutto il necessario per il programma generalista che, purtroppo, non è ancora finalizzato (anche i programmi specialistici non sono ancora finalizzati). Il tipico principiante qui è un diplomato di scuola superiore con una laurea in matematica e informatica.

Contenuti: Introduzione (Machine learning: cosa e perché?, Apprendimento non supervisionato, Alcuni concetti di base nell'apprendimento automatico); Probabilità; Modelli generativi per dati discreti; modelli gaussiani; Statistiche bayesiane; Statistiche frequentiste; Regressione lineare; Regressione logistica; Modelli lineari generalizzati e famiglia esponenziale; Modelli grafici diretti (reti di Bayes); Modelli di miscela e algoritmo EM; modelli lineari latenti; Modelli lineari sparsi; noccioli; processi gaussiani; Modelli di funzioni di base adattive; Markov e modelli di Markov nascosti; modelli dello spazio degli stati; Modelli grafici non orientati (campi aleatori di Markov); Inferenza esatta per modelli grafici; inferenza variazionale; Più inferenza variazionale; inferenza Montecarlo; inferenza della catena di Markov Monte Carlo (MCMC); Raggruppamento; Apprendimento della struttura del modello grafico; modelli di variabili latenti per dati discreti; Apprendimento approfondito.

Data Science for Business: cosa devi sapere sul data mining e sul pensiero analitico dei dati / 1a edizione

Scritto da: Tom Fawcett e Foster Provost

  • Editore: O'Reilly Media
  • Data di pubblicazione: 17 settembre 2013
  • Lingua: inglese
  • Dimensioni: 7 x 0,9 x 9,19 pollici
  • Numero di pagine: ‎413

Contenuto: pensiero analitico dei dati; Problemi aziendali e soluzioni di data science; Introduzione alla modellazione predittiva: dalla correlazione alla segmentazione supervisionata; Adattamento di un modello ai dati; Overfitting e sua prevenzione; Somiglianza, Vicini e Cluster; Pensiero analitico decisionale I: cos'è un buon modello?; Visualizzazione delle prestazioni del modello; Prove e probabilità; Rappresentare ed estrarre il testo; Pensiero analitico decisionale II: verso l'ingegneria analitica; Altri compiti e tecniche di scienza dei dati; Scienza dei dati e strategia aziendale; Conclusione.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Statistiche pratiche per data scientist: oltre 50 concetti essenziali che utilizzano R e Python / 2a edizione

Scritto da: Peter Bruce, Andrew Bruce e Peter Gedeck

  • Editore: O'Reilly Media
  • Data di pubblicazione: 2 giugno 2020
  • Lingua: inglese
  • Dimensioni: 7 x 0,9 x 9,1 pollici
  • Numero di pagine: ‎368

Contenuto: analisi esplorativa dei dati, distribuzioni di dati e campioni, esperimenti statistici e test di significatività, regressione e previsione, classificazione, apprendimento automatico statistico, apprendimento non supervisionato.

Il libro del perché: la nuova scienza di causa ed effetto

Scritto da: Judea Pearl, Dana Mackenzie

  • Editore: libro di base
  • Data di pubblicazione: 15 maggio 2018
  • Lingua: inglese
  • Dimensioni: 6,3 x 1,4 x 9,4 pollici
  • Numero di pagine: ‎432

Mentre molti libri di Data Science usano il puro settore commerciale per l'illustrazione, questo libro usa l'industria medica e altre discipline per l'illustrazione.

Contenuto: Introduzione: Mind over Data; La scala della causalità; Dai bucanieri alle cavie: la genesi dell'inferenza causale; Dalle prove alle cause: il reverendo Bayes incontra il signor Holmes; Confondere e deconfondere: o, uccidere la variabile in agguato; Il dibattito pieno di fumo: chiarire l'aria; Paradossi a bizzeffe!; Oltre l'adattamento: la conquista dell'intervento sul monte; Controfattuali: mondi minerari che avrebbero potuto essere; Mediazione: la ricerca di un meccanismo; Big Data, Intelligenza Artificiale e Grandi Domande.

Costruisci una carriera nella scienza dei dati

Scritto da: Emily Robinson e Jacqueline Nolis

  • Editore: Manning
  • Data di pubblicazione: 24 marzo 2020
  • Lingua: inglese
  • Dimensioni: 7,38 x 0,8 x 9,25 pollici
  • Numero di pagine: ‎354

Contenuto: Introduzione alla scienza dei dati; Trovare il tuo lavoro di scienza dei dati; Stabilirsi nella scienza dei dati; Crescere nel tuo ruolo di Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Scienza dei dati per manichini / 2a edizione

Scritto da: Lillian Pierson

  • Editore: For Dummies
  • Data di pubblicazione: 6 marzo 2017
  • Lingua inglese
  • Dimensioni: 7,3 x 1 x 9 pollici
  • Numero di pagine: ‎384

Questo libro presuppone che il lettore abbia già le conoscenze pre-richieste di matematica e programmazione.

Contenuto:  avvolgere la testa intorno alla scienza dei dati; Esplorare pipeline e infrastrutture di ingegneria dei dati; Applicazione di approfondimenti basati sui dati al business e all'industria; Apprendimento automatico: apprendimento dai dati con la tua macchina; Matematica, probabilità e modellazione statistica; Utilizzo del clustering per suddividere i dati; Modellazione con istanze; Creazione di modelli che gestiscono dispositivi Internet delle cose; Seguendo i principi della progettazione della visualizzazione dei dati; Utilizzo di D3.js per la visualizzazione dei dati; Applicazioni basate sul Web per la progettazione della visualizzazione; Esplorare le migliori pratiche nella progettazione di dashboard; Creazione di mappe da dati spaziali; Utilizzo di Python per la scienza dei dati; Utilizzo di Open Source R per la scienza dei dati; Utilizzo di SQL nella scienza dei dati; Fare scienza dei dati con Excel e Knime; Scienza dei dati nel giornalismo: inchiodare le cinque W (e una H); Approfondire la scienza dei dati ambientali; Data Science per guidare la crescita nell'e-commerce; Utilizzo della scienza dei dati per descrivere e prevedere l'attività criminale; Dieci risorse fenomenali per i dati aperti; Dieci strumenti e applicazioni gratuiti per la scienza dei dati.

Estrazione di enormi set di dati / 3 rd La modifica

Scritto da: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editore: Cambridge University Press
  • Data di pubblicazione: 13 febbraio 2020
  • Lingua inglese
  • Dimensioni: 7 x 1 x 9,75 pollici
  • Numero di pagine: ‎565

Questo libro presuppone inoltre che il lettore abbia già le conoscenze pre-richieste di matematica e programmazione.

Contenuto: estrazione di dati; MapReduce e il nuovo stack software; Algoritmi che utilizzano MapReduce; Trovare oggetti simili; Flussi di dati minerari; Analisi dei collegamenti; Articoli frequenti; Raggruppamento; Pubblicità sul Web; Sistemi di Raccomandazione; Estrazione di grafici di reti sociali; Riduzione della dimensionalità; Apprendimento automatico su larga scala.

Conclusione

Le distinzioni tra i programmi specialistici non sono ancora chiare. Anche le distinzioni tra i programmi generalisti e specialistici non sono ancora chiare. Tuttavia, dopo aver letto l'elenco di libri fornito, il lettore sarà nella posizione di apprezzare meglio i ruoli speciali di analista di dati, ingegneria dei dati e scienziato dei dati, e quindi andare avanti.