Data Analyst NanoDegree – Udacity
Dibuat/disponsori oleh:
Kaggle, Tableau, Mode (dulu Udacity, Facebook, Tableau, mongoDB)
Format
Durasi:
Rata-rata selesai dalam 370 jam
6 bulan.
Mulai 26/08/2017, program ini terdiri dari dua termin yang masing-masing panjangnya tetap (fixed) 3 bulan (dengan asumsi komitmen 10 jam/minggu).
Biaya:
$199/bulan (diskon 50% kalau selesai dalam 12 bulan)
Pada tanggal 26 Agustus 2017 biaya untuk kursus ini jadi berubah total. Sekarang menjadi total USD $1200 per program, tanpa ada diskon (!)
Rating oleh murid:
(4.5 dari 5 oleh 1331 review)
Catatan: ini adalah rating untuk harga lama yang $199/bulan.
Persyaratan
- Python programming
- Statistika akan diajarkan di kursus ini
Bahasa
Python dan R
Silabus:
Program NanoDegree ini berbasis proyek, artinya tugas utama dalam kursus adalah menyelesaikan proyek-proyek pemrograman. Materi video (dalam bentuk MOOC seperti biasa) tentu tetap ada sebagai pengantar ilmunya.
Untuk silabus tugas/proyek bisa didownload di sini (PDF) (silabus versi lama di sini), dan isinya kurang lebih adalah sbb (maaf tidak saya terjemahkan karena copas):
- Intro Project: Analyze Bay Area Bike Share Data (10 hrs) :
- Introduce you to the key steps of the data analysis process:
- Use basic Python code to clean a dataset for analysis
- Analyze trends shown in the visualizations and report your conclusions
- Project: Compute Statistics from Card Draws (20 hrs):
- Demonstrate your knowledge of descriptive statistics
- Create and interpret histograms, bar charts, and frequency plots
- Distributions, probabilities
- Project: Investigate a Dataset (30 hrs)
- In this project, you’ll choose one of Udacity’s curated datasets and investigate it using NumPy and pandas. You’ll complete the entire data analysis process, starting by posing a question and finishing by sharing your findings.
- Identify the key steps in the data analysis process
- Complete an analysis of Udacity student data using pure Python, with minimal reliance on additional libraries
- Project: Wrangle OpenStreetMap Data (60 hrs)
- In this project, you’ll use data munging techniques, such as assessing the quality of the data for validity, accuracy, completeness, consistency and niformity, to clean the OpenStreetMap data for a part of the world that you care about.
- Understand how to parse CSV files and XLS with XLRD
- Use JSON and Web APIs
- Parse XML & HTML
- Scrape websites for relevant data
- Understand how data is structured in SQL
- Project: Explore and Summarize Data (50 hrs)
- In this project, you’ll use R and apply exploratory data analysis techniques to explore a selected data set for distributions, outliers, and anomalies.
- Define and identify the importance of exploratory data analysis (EDA)
- Install RStudio and packages
- Properly apply relevant techniques for exploring the relationship between any two variables in a data set
- Project: Test a Perceptual Phenomenon (20 hrs)
- In this project, you’ll use descriptive statistics and a statistical test to analyze the Stroop effect, a classic result of experimental psychology
- Project: Identify Fraud from Enron Email (50 hrs)
- Implement the Naive Bayes algorithm to classify text
- Implement Support Vector Machines (SVMs) to generate new features independently on the fly
- Implement decision trees as a launching point for more sophisticated methods like random forests and boosting
- Wrestle the Enron dataset into a machine-learning-ready format in preparation for detecting cases of fraud
- Use regression algorithms to make predictions and identify and clean outliers from a dataset
- Use the k-means clustering algorithm for pattern-searching on unlabeled data
- Project: Make an Effective Visualization (20 hrs)
- In this project, you’ll create a data visualization, using Tableau, from a data set that tells a story or highlights trends or patterns in the data.
Setelah saya cari secara manual, saya temukan materi kursusnya adalah sebagai berikut:
- Intro to Descriptive Statistics
- Intro to Inferential Statistics
- Statistics
- Intro to Data Analysis
- Data Analysis Process
- NumPy and Pandas for 1D Data
- NumPy and Pandas for 2D Data
- Investigate a Dataset
- Data Wrangling with MongoDB
- Data Extraction Fundamentals
- Data in More Complex Formats
- Data Quality
- Working with MongoDB
- Analyzing Data
- Case Study – OpenStreetMap Data
- Data Analysis with R
- What is EDA?
- R Basics
- Explore One Variable
- Explore Two Variables
- Explore Many Variables
- Diamonds and Price Predictions
- Intro to Machine Learning
- Welcome to Machine Learning
- Naive Bayes
- Support Vector Machines
- Decision Trees
- Choose your own Algorithm
- Datasets and Questions
- Regressions
- Outliers
- Clustering
- Feature Scaling
- Data Visualization in Tableau
- A/B Testing
Komentar
Catatan: review ini saya buat dalam rangka membuat Rancangan Lengkap Program Belajar Data Science Mandiri. Ulasan dan penilaian saya hanya berdasar pada silabus dan ulasan orang lain dari berbagai sumber, karena saya belum mengikuti kursus ini.
Sesuai dengan judulnya, kursus ini sepertinya mengajarkan materi yang lengkap agar kita bisa menjalankan semua tugas DS end-to-end, mulai dari mempersiapkan data sampai membuat prediksi dan bahkan mengkomunikasikan pekerjaan kita. Dan bagusnya, pengajarannya langsung bertitik berat ke praktek, sehingga selesai kursus kita bisa langsung terjun ke dunia nyata.
Sebagian besar materi sepertinya dalam bahasa Python, tapi ada bagian bahasa R-nya juga sih. Atau mungkin juga programnya bisa memakai kedua bahasa ini.
Kursus ini mendapat rating yang bagus dari murid dan juga reviewer lain.
Update 26/08/2017: dengan tiba-tiba sekali Udacity merubah biaya kursus ini, dari yang tadinya $199/bulan dengan diskon menjadi $1200 per paket tanpa diskon, atau rata-rata naik 2 kali lipat untuk isi yang sama.
Rating Saya
Catatan: saya belum mengikuti program ini
Tips
Materi dari kursus ini dapat kita ikuti secara gratis dari Udacity, tapi tanpa praktek pemrograman (ikuti tautan di silabus di atas). Mungkin kita bisa selesaikan materinya dengan mengikuti versi gratisnya dulu untuk mengurangi waktu mengikuti program nanodegreenya.
Review Lain
- REVIEW: Udacity Data Analyst Nanodegree: “Udacity’s Data Analyst Nanodegree gives you the foundational skills you need for a career in data science. Post-graduation, you’ll be able to target your strengths and weaknesses, and supplement your learning where necessary. Plus, you’ll leave with a handful of portfolio-ready projects. I loved it, as did others.”