Introduction to Data Science in Python
Oleh
University of Michigan
Penilaian Saya
(4 dari 5)
Format
Kursus online (MOOC) dengan kuis interaktif dan tugas pemrograman.
Kursus ini adalah bagian dari Applied Data Science in Python Specialization.
Tingkat
Menengah
Biaya
Anda bisa pilih mau ikut yang gratis atau yang berbayar:
- Gratis:
- bisa mengakses semua materi, tapi tidak diberi akses ke kuis dan tugas pemrograman yang dinilai
- $49/bulan:
- dengan mengikuti Applied Data Science in Python Specialization (lihat ulasan saya)
- bisa mengakses semua materi
Saya sarankan ikut yang berbayar, karena keunggulan kursus ini ada di tugas pemrograman, dan kalau ikut gratis maka tugas pemrograman tidak akan dinilai.
Durasi
4 minggu
-
- Dengan asumsi rata-rata komitmen belajar 3-6 jam per minggu
- Dengan belajar full-time saya bisa selesaikan dalam 4 hari.
Total Durasi Video
Kurang dari 2 jam
Penilaian oleh Situs Lain
Coursera: (rating 4.5 oleh 3047 murid) (lihat review)
Persyaratan
Sudah lancar memakai Python
Mau belajar dan mampu mencari referensi sendiri di Internet.
Statistik inferensial (lihat Ulasan MOOC: Intro to Inferential Statistics – Udacity) dan deskriptif (lihat MOOC Review: Intro to Descriptive Statistics (@Udacity)).
Lingkup Materi
- Minggu 1: Pengenalan Python, mulai dari awal (tipe data, fungsi), fitur-fitur yang berhubungan dengan ilmu data (membaca file CSV), sampai tingkat lanjut (list comprehension, map(), lambda).
- Minggu 2: Numpy dan Panda (series, dataframes, querying, indexing, fillna)
- Minggu 3: advanced Panda (merging dataframes, group by, scales, pivot table, date)
- Minggu 4: sedikit statistik (distribusi dan testing hipotesis).
Untuk lebih detil silakan lihat silabus di bawah.
Walaupun materinya banyak, tapi semua diberikan dengan cepat. Pengajar seolah-olah hanya membaca program yang dia ketik saja, tanpa informasi tambahan lain. Tapi bagi saya cukup sih. Dari poin-poin yang diutarakan, saya bisa mencari sendiri referensinya kalau penjelasan yang diberikan kurang jelas.
Materi di minggu ke empat sangat sedikit. Misalnya, kita diberi tahu tentang hypotesis testing, tapi materi itu tidak dijelaskan dengan detil, padahal nanti kita harus melakukannya di tugas pemrograman. Makanya disyaratkan kita sudah tahu statistika inferensial dulu sebelumnya.
Rating untuk lingkup materi:
Pengajaran
Video. Tiap minggu durasi video yang diberikan hanyalah sekitar 30 menit saja, dan isinya adalah penjelasan cepat dari kode-kode Python. Dari ulasan para murid yang lain, banyak yang komplain kalau pengajar hanya membaca kode saja tanpa memberikan penjelasan yang lebih panjang.
Jupyter notebook. Ini adalah nilai yang sangat plus, yaitu materi (terutama kode) yang diajarkan juga diberikan dalam bentuk Jupyter notebook, sehingga Anda bisa coba-coba dan bereksperimen sendiri. Sayang setelah minggu kedua, hanya kode yang ditaruh di notebook. Penjelasannya sendiri hanya ada di video. Saya sendiri sering ketika melihat video, saya pause videonya untuk mencoba kode yang dijelaskannya dari notebook.
Kuis. Ada dua macam kuis. Pertama kuis kecil yang menyelingi video materi, dan kedua kuis bernilai yang diberikan di akhir minggu pertama yang nanti akan berkontribusi untuk menentukan kelulusan Anda (hanya untuk yang mengikuti secara berbayar). Menurut saya kuis-kuisnya cukup bermutu, terutama kuis kecilnya yang biasanya cukup sulit sehingga membuat kita harus mikir atau mencari jawabannya di Internet.
Tugas pemrograman. Lihat di bawah.
Slide presentasi. Ada PDF yang berisi slide presentasi tiap minggu yang bisa diunduh, tapi menurut saya tidak banyak membantu, karena materi slidenya sangatlah minim. Mungkin hanya ada kurang dari 10 lembar, dalam satu minggu! Tapi rasanya tidak terlalu masalah, karena ada Jupyter notebook.
Rating untuk pengajaran:
Pemrograman
Secara umum, kursus ini adalah tentang pemrograman, jadi sudah pasti ada banyak materi tentang pemrograman yang diberikan, dan yang utama adalah di tugas pemrogramannya.
Tugas pemrograman sangat bermutu! Tidak seperti MOOC lain yang tugas pemrogramannya relatif mudah, tugas pemrograman di sini ternyata lumayan sulit, yang membuat Anda harus teliti dalam membaca pertanyaan dan mencari sendiri referensi yang dibutuhkan dari Internet. Kesulitannya bukan hanya pada teknis pengerjaannya yang sulit, tapi juga dari spesifikasi pertanyaan yang kadang kurang jelas (speknya terlalu pendek misalnya). Tapi menurut saya ini bagus sih, karena mencerminkan situasi di dunia nyata.
Bagusnya, sistem penilaian dilakukan secara otomatis menggunakan auto-grader sehingga Anda tidak perlu menunggu lama untuk mengetahui tugas Anda benar atau tidak.
Saya sangat puas dengan tugas pemrogramannya.
Rating untuk pemrograman:
Dukungan
Ada forum untuk diskusi yang isinya lumayan membantu untuk mencari informasi tambahan kalau kita mentok di suatu tugas. Walaupun forumnya tidak terlalu ramai, tapi ada staff yang bertugas menjawab pertanyaan di situ. Respon pertanyaan kurang dari 24 jam.
Rating untuk dukungan:
Ulasan
Terus terang saya mengikuti kursus ini awalnya sebagai sambilan saja, karena saya sedang mengambil Data Analyst NanoDegree di Udacity (lihat review pendahuluan saya). Sambil menunggu tugas saya di-review (bisa memakan waktu 2 hari), dan karena materi untuk modul berikutnya masih dikunci sampai jadwalnya tiba, maka iseng-iseng saya mengambil Applied Data Science in Python Specialization di Coursera. Toh murah juga, hanya $49/bulan, dan saya mengharap bisa menyelesaikannya tidak lebih dari sebulan.
Awal melihat videonya, perhatian saya langsung tertuju pada beda gaya bicara pengajar kursus ini (Dr Brooks) dengan gaya yang di Data Analyst ND (DAND) Udacity. Kalau di DAND, kata-katanya agak bergaya marketing, misalnya “you will be fully supported“, “join our career development programme“, “by the time you finish this course you’ll master data analyst“. Sedang gaya di kursus ini ya nyantai saja, hanya materinya yang dipresentasikan, tanpa diberi bumbu-bumbu “marketing”. Saya langsung merasa lebih nyaman dengan cara ini.
Cara pembawaan materi juga beda. Kalau yang DAND, memang materinya dibuat dengan lebih profesional, diberikan dengan detil, tiap hal diberi video penjelasannya, dsb. Bagus sih untuk yang pemula banget. Tapi bagi saya, jadinya selain terlalu lelet, juga materinya jadinya nggak bisa terlalu banyak. Jadinya kebanyakan di materi dua minggu pertama saya skip-skip saja videonya, dan langsung saya kerjakan bagian tugasnya.
Sedangkan yang kursus ini justru kebalikannya. Materi yang diberikan di video sekilas banget, pengajar memberikan informasi tentang suatu item sambil menuliskan kodenya di layar. Sehingga satu item topik yang kalau di DAND bisa dibahas bermenit-menit, di sini cuma beberapa detik saja paling. Saking cepatnya alur penjelasan, bahkan ada video yang saya pause tiap dia selesai ngomong satu kalimat, karena saya mau melihat kodenya dan mencari infonya di Google!
Tapi saya justru suka! Dengan begini maka kursusnya bisa kita selesaikan secepat atau selambat yang kita inginkan. Jadi saya anggap kursus ini hanya memberikan topik-topik apa yang penting untuk dipelajari, lalu kita sendiri yang harus mendalaminya dengan cari infonya di tempat lain, tanpa harus menonton keseluruhan video.
Apalagi ketika mengerjakan tugas pemrogramannya, saya semakin suka dengan kursus ini. Jangan salah, tugas pemrogramannya cukup menantang! Tidak hanya bikin kita mikir, tapi juga rasanya kebanyakan cara penyelesaiannya kita harus cari sendiri di Internet. Paling tidak butuh lebih dari tiga sampai lima jam untuk menyelesaikan masing-masing tugas pemrograman mingguan.
Akhirnya saya bisa menyelesaikan kursus ini dalam empat hari, atau rata-rata dalam sehari saya bisa menyelesaikan materi untuk satu minggu, termasuk tugas. Sangat puas dengan tugasnya, dan akan segera mengikuti kursus berikutnya di program specialization ini.
Dan akhirnya saya batalkan keikutsertaan saya di Data Analyst NanoDegree-nya Udacity. Dengan harga $499 dan $699 per termin, biaya segitu ternyata sangat tidak sepadan dengan ilmu yang diberikan. Lagi pula sistem pemberian materi yang terjadwal secara fixed, tidak memungkinkan kita untuk menyelesaikan dengan lebih cepat (karena suatu materi sudah ada jadwalnya kapan diberikan). Rasanya sangat malas untuk menunggu dua minggu sampai materi berikutnya dibuka kuncinya. Apalagi kalau harus menghabiskan tiga bulan untuk menyelesaikan tiap terminnya. Terlalu banyak buang waktu. Dan uang sih. Syukur saya dapat full refund, karena saya membatalkannya dalam kurang dari 7 hari sejak program dimulai. Dari uang yang dikembalikan untuk termin satu saja, akhirnya saya belikan tujuh buku ilmu data dan pembelajaran mesin terbaik yang saya temukan di Amazon. Dan bahkan setelah dipotong biaya kirim yang sangat mahal (saya pilih global priority agar cepat sampai), toh uangnya masih nyisa juga. 🙂
Kembali ke ulasan kursus ini, saya merekomendasikan kursus ini, asal persyaratannya (lihat di atas) Anda penuhi.
Silabus
Minggu 1: Python
- Video: Introduction to Specialization
- Reading: Syllabus
- Video: About the Professor: Christopher Brooks
- Video: Data Science
- Reading: 50 years of Data Science, David Donoho (optional)
- Video: The Coursera Jupyter Notebook System
- Notebook: Week 1 Lectures Jupyter Notebook
- Video: Python Functions
- Video: Python Types and Sequences
- Video: Python More on Strings
- Video: Python Demonstration: Reading and Writing CSV files
- Video: Python Dates and Times
- Video: Advanced Python Objects, map()
- Video: Advanced Python Lambda and List Comprehensions
- Video: Advanced Python Demonstration: The Numerical Python Library (NumPy)
- Reading: Week 1 Slides
Minggu 2: Numpy dan Panda
- Video: Introduction
- Notebook: Week 2 Lectures Jupyter Notebook
- Video: The Series Data Structure
- Video: Querying a Series
- Video: The DataFrame Data Structure
- Video: DataFrame Indexing and Loading
- Video: Querying a DataFrame
- Video: Indexing Dataframes
- Video: Missing Values
- Discussion Prompt: The Ethics of Using Hacked Data
- Reading: Week 2 Slides
- Notebook: Assignment 2
Minggu 3: Advanced Panda
- Notebook: Week 3 Lectures Jupyter Notebook
- Video: Merging Dataframes
- Video: Pandas Idioms
- Video: Group by
- Video: Scales
- Video: Pivot Tables
- Video: Date Functionality
- Discussion Prompt: Goodhart’s Law
- Reading: Week 3 Slides
- Notebook: Assignment 3
Minggu 4: Statistics and Hypotesis Testing
- Notebook: Week 4 Lectures Jupyter Notebook
- Video: Introduction
- Video: Distributions
- Video: More Distributions
- Video: Hypothesis Testing in Python
- Discussion Prompt: The End of Theory
- Discussion Prompt: Science Isn’t Broken: p-hacking activity
- Reading: Week 4 Slides
- Notebook: Assignment 4 – Project
Cuplikan
Berikut cuplikan video dari sesi pelajaran agar Anda lebih bisa membayangkan suasana pelajarannya. Anda bisa klik di videonya untuk mengikuti sendiri sesinya.