Statistical Learning
Statistical Learning
Proses bekerja dengan dataset dan mengembangkan predictive modeling juga merupakan tugas dalam statistik. Seorang ahli statistik mungkin secara "konvensional" menyebut aktivitas tersebut sebagai statistik terapan. Statistik adalah subbidang matematika, dan warisan ini memberikan fokus metode yang didefinisikan dengan baik dan dipilih dengan cermat. Kebutuhan untuk memahami tidak hanya mengapa model tertentu dipilih, tetapi juga bagaimana dan mengapa prediksi spesifik dibuat. Dari perspektif ini, seringkali model skill itu penting, tetapi kurang penting dibandingkan kemampuan interpretasi model tersebut. Namun demikian, ahli statistik modern telah merumuskan perspektif baru sebagai subbidang statistik terapan yang disebut statistical learning. Ini mungkin setara dengan statistik predictive modeling di mana model skill penting, tetapi mungkin penekanan yang lebih kuat diberikan untuk pemilihan dan pengenalan model learning.
Statistical learning refers to a set of tools for modeling and understanding complex datasets. It is a recently developed area in statistics and blends with parallel developments in computer science and, in particular, machine learning. (Halaman vii, An Introduction to Statistical Learning with Application in R, 2013)
Kita bisa melihat bahwa ada perbedaan antar gagasan antara bidang dan subbidang dalam statistik. Praktisi machine learning harus menyadari machine learning dan pendekatan berbasis statistik untuk masalah tersebut. Ini sangat penting mengingat penggunaan terminologi yang berbeda di kedua domain. Dalam kursus online statistik Rob Tibshirani, seorang ahli statistik, beliau memberikan glosarium yang memetakan istilah dalam statistik dengan istilah dalam machine learning berikut :
Machine Learning | Statistik |
---|---|
Jaringan, Graf | Model |
Bobot (Weight) | Parameter |
Learning | Fitting |
Generalization | Test Set Performance |
Supervised Learning | Regression / Classification |
Unsupervised Learning | Density Estimation, Clustering |
Ini menyoroti kebutuhan yang lebih dalam bagi praktisi machine learning untuk fokus pada predictive modeling dan tetap open minded untuk metode, ide, dan terminologi, terlepas dari bidang asalnya. Ini mungkin berlaku untuk bidang modern seperti bioinformatika dan ekonometrik tetapi lebih berlaku untuk bidang statistik yang terkait erat dan jauh lebih "tua".
Tidak ada komentar:
Posting Komentar