Teks lengkap 4912 Kata-kata, perkiraan waktu belajar 15 menit
Sumber: Unsplash
Tahun baru telah tiba, dan inilah waktunya untuk menyesuaikan tujuan tahun baru untuk diri Anda sendiri. Tahun ini, jenis bendera apa yang kamu rencanakan untuk dirimu sendiri, bukan, apakah itu tujuannya?
Baca lebih banyak buku dan koran, kurangi makanan ringan dan lebih banyak tidur?
Baik belajar atau bepergian, selalu ada satu jiwa dan raga di jalan?
Untuk semua orang, buku adalah makanan spiritual yang esensial.
Membaca = mengisi daya.
Hari ini, Xiaoxin telah mengumpulkan 25 e-book gratis terbaik di bidang ilmu data. Masing-masing dari 25 buku ini tidak direkomendasikan ke Xiaoxin oleh pionir, mentor, atau instruktur ilmu data, atau dirujuk oleh Xiaoxin saat mengerjakan proyek tertentu. Saya yakin ini akan sangat membantu Anda!
Karena banyak teman yang belajar Python, untuk itu kebanyakan buku yang disusun kali ini adalah pemrograman berbasis Python.
1. Pengantar Ilmu Data Non Teknologi
"Seni Ilmu Data" oleh Roger D. Peng dan Elizabeth Matsui
Pendahuluan: Buku ini menjelaskan tentang proses menganalisis data. Penulis memiliki pengalaman yang luas dalam mengelola analis data dan melakukan analisis data mereka sendiri.Buku ini merangkum pengalaman mereka dengan cara yang dapat diterapkan pada praktisi dan manajer.
"Buku Pegangan Ilmu Data" oleh Carl, Max, Henry dan Will
Pendahuluan: Buku Pegangan Sains Data adalah kompilasi dari wawancara mendalam dengan 25 ilmuwan data terkemuka, yang berbagi wawasan, cerita, dan saran mereka dalam buku ini.
Roger D. Peng dan Hilary Parker "Percakapan Tentang Ilmu Data"
Pendahuluan: Roger Peng dan Hilary Parker meluncurkan podcast "Not So Standard Deviations" pada tahun 2015, yang didedikasikan untuk membahas cerita latar belakang dan kehidupan sehari-hari para ilmuwan data di dunia akademis dan industri. Buku ini mengumpulkan banyak percakapan mereka tentang ilmu data dan cara kerjanya (dan terkadang tidak berhasil) di dunia nyata.
Sumber: Unsplash
2. Pemrograman Python untuk ilmu data
Ashwin Pajankar dan Sushant Garg "Pemrograman Berorientasi Objek dengan Python"
Pendahuluan: Buku ini adalah panduan sederhana dan jelas untuk pemrograman berorientasi objek dengan Python 3. Buku lain dalam genre serupa menggunakan gaya dan contoh penulisan yang kompleks untuk memperkenalkan pembaca ke OOP dengan Python 3. Namun, buku ini menggunakan bahasa sederhana untuk menjelaskan konsep. Sasarannya adalah pelajar menengah yang sudah tahu Python.
Gunakan "Otomatiskan Hal yang Membosankan dengan Python" dari Al-Sweigart
Pendahuluan: Setelah Anda menguasai dasar-dasar pemrograman, Anda akan belajar bagaimana menggunakan Python untuk menyelesaikan program yang biasanya membutuhkan waktu berjam-jam untuk menulis dalam hitungan menit.
"Buku Pegangan Ilmu Data Python" oleh Jake VanderPlas
Pendahuluan: Ilmuwan dan pemroses data yang terbiasa dengan membaca dan menulis kode Python akan menemukan referensi desktop yang komprehensif ini sangat cocok untuk menangani masalah sehari-hari: memanipulasi, mengubah dan membersihkan data; memvisualisasikan berbagai jenis data; dan menggunakan data untuk membangun model statistik atau pembelajaran mesin . Sangat sederhana, ini adalah referensi yang diperlukan untuk komputasi ilmiah dengan Python.
Scott Grant "Learn Python, Break Python" (Pelajari Python, Break Python)
Pendahuluan: "Belajar Python, Hancurkan Python" dimulai dengan pengenalan populer tentang pemrograman. Perlahan, melalui contoh dan latihan, dan perkenalkan elemen program yang lebih kompleks untuk menetapkan tingkat yang sesuai, dan tunjukkan di mana mereka dapat digunakan dan bagaimana memecahkannya. Dengan mengumpulkan pengetahuan dengan cara ini, kami berharap dapat memberikan kenyamanan bagi pembaca yang merasa nyaman ketika mencoba hal baru dan mengambil risiko, singkatnya, buku ini berharap pembaca dapat terbiasa dengan pemrograman.
Steven Bird, Ewan Klein, dan Edward Loper "Pemrosesan Bahasa Alami dengan Python"
Pendahuluan: Buku ini memberikan pengenalan singkat tentang pemrosesan bahasa alami, yang mendukung berbagai teknologi bahasa, dari teks prediktif dan pemfilteran email hingga peringkasan dan terjemahan otomatis. Dengan menggunakannya, Anda dapat mempelajari cara menulis program Python dengan banyak koleksi teks tidak terstruktur. Pembaca dapat menggunakan berbagai struktur data bahasa untuk mendapatkan kumpulan data yang kaya penjelasan dan memahami algoritme utama untuk menganalisis konten dan struktur komunikasi tertulis.
Ben G Weber "Ilmu Data dalam Produksi" (Ilmu Data dalam Produksi)
Pendahuluan: Dari perusahaan rintisan hingga perusahaan bernilai triliunan dolar, ilmu data memainkan peran penting dalam membantu organisasi memaksimalkan nilai datanya. Buku ini dirancang untuk praktisi analitik yang ingin membuat produk data dan mengembangkan keterampilan sains data terapan di berbagai lingkungan cloud.
"Data-Driven" oleh HilaryMason dan DJ Patil
Pendahuluan: Contoh bagaimana Google, LinkedIn, dan Facebook menggunakan data mereka, dan contoh bagaimana Wal-Mart, UPS, dan organisasi lain menggunakan sumber daya sebelum data besar muncul. Bagaimanapun, di abad ke-21, membangun budaya data adalah kunci kesuksesan.
Sumber: Unsplash
Tiga, penambangan data
"A Programmers Guide to Data Mining" karya Ron Zacharsk (A Programmers Guide to Data Mining)
Pendahuluan: Jika Anda seorang programmer yang tertarik dengan data mining, maka langkah pertama, Anda mungkin tertarik dengan panduan praktis untuk pemula. Inilah yang disediakan buku ini. Panduan ini mengikuti pendekatan "belajar dengan melakukan".
"Social Media Mining" oleh Cambridge University Press
Pendahuluan: Penambangan media sosial mengintegrasikan media sosial, analisis jaringan sosial, dan penggalian data, dan menyediakan platform yang nyaman dan stabil bagi siswa, praktisi, peneliti, dan manajer proyek untuk memahami dasar dan potensi penambangan media sosial. Buku ini memperkenalkan masalah unik yang ditimbulkan oleh data media sosial, dan mengusulkan konsep dasar, masalah yang muncul, dan algoritme efektif dari analisis jaringan dan penggalian data. Buku ini cocok untuk digunakan dalam program sarjana dan pascasarjana tingkat lanjut dan kursus singkat profesional.Buku ini berisi latihan dari berbagai tingkat kesulitan untuk membantu meningkatkan pemahaman dan membantu menerapkan konsep, prinsip dan metode dalam berbagai skenario penambangan media sosial.
4. Matematika dan Statistik
"Pengantar Pembelajaran Statistik" oleh Gareth James, Daniela Witten, Trevor Haste, dan Robert Tibshirani.
Pendahuluan: Buku ini ditujukan untuk mahasiswa tingkat sarjana, magister dan doktoral tingkat tinggi yang bukan jurusan matematika. Buku ini juga berisi beberapa laboratorium R, yang menjelaskan secara rinci bagaimana menerapkan berbagai metode dalam kehidupan nyata, menyediakan sumber daya yang berharga bagi ilmuwan data praktis.
"Think Stats" dari Allen B. Downey
Pendahuluan: "Pemikiran Statistik" menekankan beberapa teknik sederhana yang dapat digunakan untuk mengeksplorasi kumpulan data nyata dan menjawab pertanyaan menarik. Buku ini melakukan studi kasus menggunakan data yang diperoleh dari National Institutes of Health. Pembaca didorong untuk menggunakan kumpulan data nyata untuk pekerjaan proyek.
"Elemen Pembelajaran Statistik" oleh Gareth James, Daniela Witten, Trevor Haste dan Robert Tibshirani
Pendahuluan: Meskipun metodenya adalah statistik, fokusnya adalah pada konsep daripada matematika. Sejumlah besar contoh dikutip dalam artikel, memanfaatkan sepenuhnya grafik warna. Buku ini adalah sumber daya yang berharga bagi para ahli statistik dan siapa saja yang tertarik dengan data mining ilmiah atau industri. Buku ini mencakup berbagai macam, dari pembelajaran yang diawasi (prediksi) hingga pembelajaran tanpa pengawasan. Topiknya meliputi jaringan saraf, mesin vektor pendukung, pohon klasifikasi, dan metode pengangkatan - ini adalah diskusi komprehensif pertama tentang topik ini di buku mana pun.
Allen B. Downey "Bayesian Statistics Made Simple" (Bayesian Statistics Made Simple)
Pendahuluan: Kebanyakan buku tentang statistik Bayesian menggunakan notasi matematika dan menggunakan konsep matematika seperti kalkulus untuk mengungkapkan pendapat. Buku ini menggunakan kode Python sebagai pengganti simbol matematika, dan pendekatan diskrit daripada matematika kontinu. Hasilnya, integral dalam buku matematika menjadi penjumlahan, dan kebanyakan operasi pada distribusi probabilitas adalah siklus sederhana.
Cam Davidson Pilon "Pemrograman Probabilistik dan Metode Bayesian untuk Peretas" (Pemrograman Probabilistik dan Metode Bayesian untuk Peretas)
Pendahuluan: Metode Bayesian yang dirancang untuk peretas pertama kali memperkenalkan inferensi Bayesian dari perspektif komputasi / pemahaman, dan kemudian dari perspektif matematika. Tentunya sebagai buku pengantar, hanya bisa dianggap sebagai buku pengantar saja. Bagi orang yang telah terlatih dalam matematika, mereka dapat menggunakan teks lain yang dirancang oleh analisis matematika untuk memuaskan rasa ingin tahu yang timbul oleh buku ini. Bagi mereka yang tidak memiliki latar belakang matematika, atau mereka yang tidak tertarik dengan matematika tetapi hanya mempraktikkan metode Bayesian, artikel ini seharusnya cukup dan menarik.
"Inferensi Statistik Zaman Komputer" oleh Bradley Efron dan Trevor Haste
Pendahuluan: Buku ini membimbing pembaca melalui revolusi analisis data setelah kelahiran komputasi elektronik pada tahun 1950-an. Mulai dari teori inferensi klasik-bayes, frekuensiist, nelayan- tiap bab membahas sederet topik yang berpengaruh: analisis kelangsungan hidup, regresi logistik, bayes empiris, pemotongan pisau dan otonomi Metode, hutan acak, jaringan saraf, rantai Markov Monte Carlo, penalaran setelah pemilihan model, dll. Buku ini menggabungkan metodologi dan algoritme dengan inferensi statistik, dan akhirnya berspekulasi tentang arah statistik dan ilmu data di masa depan.
Sumber: Unsplash
Lima, pembelajaran mesin
"Pembelajaran Mesin Praktis dengan Scikit-Learn dan TensorFlow" oleh Aurélien Géron
Pendahuluan: Penulis Aurélien Géron membantu pembaca secara intuitif memahami konsep dan alat untuk membangun sistem cerdas dengan menggunakan contoh spesifik, teori minimal, dan dua kerangka kerja Python yang dapat digunakan untuk produksi: scikitlearn dan TensorFlow. Pembaca akan mempelajari serangkaian teknik, dimulai dengan regresi linier sederhana, dan kemudian memasuki jaringan neural dalam.
"Memahami Pembelajaran Mesin: Dari Teori ke Algoritma" oleh Shai Shalev Shwartz dan Shai Ben David
Pendahuluan: Buku ini membahas kompleksitas komputasi pembelajaran, serta konsep konveksitas dan stabilitas; contoh algoritma penting, termasuk penurunan gradien stokastik, jaringan saraf dan pembelajaran keluaran terstruktur; dan konsep teoritis yang muncul, seperti metode Bayesian PAC Dan berdasarkan batas kompresi.
"Pembelajaran Penguatan: Pengantar" oleh Richard S. Sutton dan Andrew G. Barto
Pendahuluan: Dalam pembelajaran penguatan, Richard Sutton dan Andrew Barto memberikan gambaran yang jelas dan sederhana tentang konsep kunci dan algoritma di lapangan. Edisi kedua telah sangat diperluas dan diperbarui, tema-tema baru telah diusulkan, dan tema-tema lain telah diperbarui.
"Pembelajaran Mendalam" oleh Massachusetts Institute of Technology Press
Pendahuluan: Buku teks pembelajaran mendalam adalah sumber daya yang dirancang untuk membantu siswa dan praktisi memasuki bidang pembelajaran mesin, terutama bidang pembelajaran mendalam.
"Machine Learning Yearning" oleh deeplearning.ai
Pendahuluan: Kecerdasan buatan mengubah banyak industri. "Curang Pelatihan Pembelajaran Mesin" adalah e-book gratis dari Wu Enda yang mengajarkan Anda cara membuat proyek pembelajaran mesin. Fokus buku ini bukanlah untuk mengajarkan algoritma ML, tapi bagaimana membuat algoritma ML bekerja.
Enam, visualisasi data
"Tips dan Trik D3" oleh MalcolmMaclean
Pendahuluan: Lebih dari 600 halaman tip dan trik untuk menggunakan d3.js, d3.js adalah salah satu alat visualisasi data terkemuka di web. Tujuannya adalah untuk memulai dan memajukan pekerjaan. Buku ini mencakup lebih dari 50 contoh kode yang dapat diunduh.
Sumber: Unsplash
Tujuh, analisis
"Elemen Gaya Analisis Data" oleh Jeffrey Leek
Pendahuluan: Fokus buku ini adalah pada rincian analisis data, yang tidak ditemukan dalam kursus dan buku teks statistik tradisional. Buku ini berguna sebagai pendamping mata kuliah pengantar ilmu data atau analisis data. Buku ini juga menjadi alat referensi yang berguna bagi mereka yang perlu membaca dan mengomentari analisis data.
Komentar Suka Ikuti
Mari berbagi manfaat pembelajaran dan pengembangan AI
Jika mencetak ulang, silakan tinggalkan pesan di latar belakang dan ikuti spesifikasi pencetakan ulang
- Core Voice Hari Ini | Pembukaan Air Taxi! Hyundai dan Uber bersama-sama merilis pesawat listrik konsep
- Bagaimana cara menggunakan PySpark untuk menggunakan model pembelajaran mesin untuk memprediksi data streaming?