Perjalanan saya dalam belajar data science dari nol akan saya dokumentasikan di tulisan ini. Tulisan ini akan saya update begitu saya menemukan hal baru dari data science. Mungkin anda akan menemukan hal yang bertolak belakang atau hal yang tidak konsisten di dalam tulisan ini. Tapi biarlah hal itu menjadi pembelajaran bagi kita semua. Hingga saat ini saya mempelajari data science dengan bahan-bahan dari internet. Saya juga akan memasukkan link dari bahan-bahan online yang saya pelajari. Jika anda berniat untuk belajar data science dari nol maka anda sudah datang ke tempat yang tepat.
Lahirnya Profesi Data Science
Data science menjadi salah satu pilihan karir yang menjanjikan di 2020 dan di masa mendatang (Medium). Hal ini didukung oleh meningkatnya ketersediaan data yang meningkat sangat pesat. IDC (International Data Corporation) memprediksi Compound Annual Growth Rate (CAGR) sebesar 23% pada kurun waktu 2020-2025. Data is new oil, itu yang terjadi saat ini. Data saintis lah yang akan mengekstrak minyak itu.
Tapi seperti halnya Big Data, Data Science juga menjadi buah bibir semua orang tetapi hanya sedikit yang benar-benar memahami apa itu data science. Saya juga awalnya latah ikut-ikutan membicarakan data science, sampai akhirnya saya sampai kepada tahap saya berniat akan belajar data science dari nol.
Yang paling menarik bagi saya jujur saja adalah gaji yang ditawarkan. Selain itu karena ini adalah bidang karir yang terbilang masih baru maka kesempatan untuk masuk ke bidang ini masih terbuka lebar. Itu yang ada di pikiran saya. Dan ternyata saya salah, meskipun saya sudah menyangka bahwa akan sangat sulit mempelajari data science, saya masih tetap kesulitan. Selain harus memahami bagaimana cara bekerja dengan data, seorang data saintis juga dituntut untuk memahami konteks dari data.
Persiapan saya belajar data science dari nol
Belajar Statistik
Langkah pertama saya belajar data science dari nol adalah dengan mempelajari kembali statistik. Terus terang dulu saat saya di bangku kuliah, statistik adalah mata kuliah yang membuat saya penasaran sekaligus pusing. Sayangnya saat itu saya tidak mendapatkan inti dari ilmu statistik. Saya lulus tanpa pemahaman yang baik tentang statistik. Untuk memperbaiki pemahaman saya maka saya mengikuti online course di coursera yang berjudul Understanding Clinical Research: Behind the Satistic. Online course ini gratis, namun jika ingin mendapatkan sertifikatnya harus berlangganan. Saya memilih tidak mendapatkan sertifikat.
Selain mengikuti online course dari coursera saya juga menonton beberapa video youtube tentang statistik. Berikut beberapa video youtube rekomendasi saya:
Mempelajari statistik penting sekali dilakukan untuk menguasai data science. Karena dari data science kita mempelajari prediksi yang memang didasarkan pada rumpun ilmu statistik. Dengan memantapkan pemahaman tentang statistik anda akan lebih mudah memahami istilah yang digunakan selama belajar data science dari nol.
Descriptive Statistic, Predictive Statistic dan Prescriptive Statistic
Supaya lebih semangat belajarnya saya akan memberikan teaser dari nikmatnya memahami statistik. Dulu saya hanya berpikir bahwa statistik hanya bersifat deskriptif saja. Ternyata saya salah. Dengan statistik kita juga bisa memprediksi suatu kejadian. Nah kejadiannya itu bisa bermacam-macam. Misalnya peluang berhasil atau tidaknya suatu strategi yang akan kita jalankan. Ini salah satu contoh prediktif statistik.
Bisa juga preskriptif statistik atau memberikan solusi terhadap suatu masalah. Jujur saya masih dalam proses memahami ini. Tetapi benar bahwa kita bisa mengambil keputusan terhadap masalah tertentu berdasarkan statistik. Alih-alih kita menebak-nebak berdasarkan perasaan dengan statistik kita bisa memperhitungkan keputusan yang kita ambil.
Belajar Data
Sebenarnya saya tidak secara langsung berniat untuk belajar data science, tetapi sebenarnya saya ingin balajar tentang Business Analytic dan Business Intelligent. Maka dari itu saya mempelajari Power BI dan Tableau. Setelah saya mengetahui ternyata business analytic lebih banyak membicarakan tentang business operation dan lain-lain, kurang cocok dengan saya yang tidak memiliki background bisnis. Saya mendapatkan banyak ilmu dari mempelajari business analytic. Salah satunya adalah pemahaman tentang data. Bagaimana mengelola database dan lain-lain
Selain dua tools yang saya sebutkan di atas, saya juga belajar untuk menggunakan Google Data Studio (GDS). Ada beberapa keuntungan dalam menggunakan GDS antara lain karena saat ini hampir semua orang mempunyai akun google dan software yang berbasis Web. Jadi tidak perlu diinstal seperti halnya Tableau dan Power BI. Aplikasi berbasiw web ini juga lebih ringan jika dibandingkan dengan Tableau atau Power BI.
Mempelajari data science
Setelah saya cukup percaya diri dengan pemahaman statistik saya maka saya beranjak ke langkah selanjutnya yaitu ke data science itu sendiri. Saya memulai dengan mengambil spesialisasi di coursera juga yaitu Clinical Data Science Specialization. Spesialisasi ini terdiri dari 5 course, dan masing-masing course terdiri dari 5 minggu. Di course ini saya mempelajari aspek teknis dari data science seperti data wrangling (extract, transform, dan load) dan lain sebagainya. Saya masih belum menyelesaikan semua course yang ada di specialization ini. Pada course yang tersedia kita juga dibeerikan dataset untuk latihan supaya kita benar-benar bisa memahami materi yang diberikan
Belajar SQL
Hal baru yang saya temukan saat belajar data science dari nol adalah Structured Query Language (SQL). Gampangnya SQL adalah versi advance dari spreadsheet atau yang biasa kita kenal dengan Ms Excel. Dengan SQL kita bisa mengolah data dengan sangat praktis dan cepat. Apalgi jika data yang kita olah dalam jumlah ribuan record. Saat ini saya baru mempelajari BigQuery atau ekosistem SQL yang dibuat oleh Google.
Kesimpulan
Di era yang serba data ini sudah seyogianya kita juga mengerti dengan data. Pada awalnya saya memang berharap agar suatu saat dengan belajar data science ini saya bisa meningkatkan taraf hidup saya. Tetapi setelah saya masuk ke dalam dunia data science ternyata banyak sekali manfaat yang kita dapatkan. Pemahaman tentang data science membantu saya memahami fenomena yang terjadi di internet misalnya. Bagaimana internet bisa memprediksi apa yang kita inginkan. Dan hal ini tidak hanya bisa digunakan untuk hal negatif. BIsa juga digunakan untuk hal positif misalnya untuk menguji suatu obat.
Data science adalah irisan dari multi disiplin ilmu. Jadi terbuka bagisiapa saja yang ingin mengakselerasi disiplin ilmu yang sudah dikuasai dengan data science.
Bagaimana dengan anda? sudah siapkah belajar data science dari nol?
Trackbacks/Pingbacks