Selasa, 27 Juli 2021
Permutasi dan Kombinasi
Addition Rule Aturan Penjumlahaan
Mutualy Exclusive Events
The Addition Rule | Aturan Penjumlahan
Conditional Probability & Multiplication Rule
Apa itu Conditional Probability?
Independent Event
Dependent Event
The Multiplication Rule
Konsep Dasar Probability & Counting
Apa itu Probability?
Terminologi
- Hasil dari suatu pencobaan (trial) dikenal sebagai outcome.
- Himpunan dari seluruh kemungkinan outcome pada suatu probability experiment dikenal sebagai sample space
- Bagian dari sample space dikenal dari event.
- Event bisa terdiri dari satu atau lebih outcomes.
Probability Experiment
Tree Diagram
Event
- Event umumnya mempresentasikan dengan huruf kapital seperti A, B, dan C.
- Suatu event yang terdiri dari sebuah outcome dikenal sebagai event sample.
Fundamental Counting Priciple
- Pemanfaatan tree diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.
- Sebagai alternatif, kita bisa memanfaatkan fundamental counting priciple untuk mengetahui jumlah kemungkinan outcomes dari dua atau lebih event yang muncul secara berurutan.
Types of Probability
- Probability dapat dituliskan dengan format pecahan, sesimal, atau presentase.
- Probability untuk kemunculan event E dapat dituliskan sebagai P(E).
- Classical (Theoritical) Probability
- Empirical (Statictica) Probability
- Subjective Probability
Classical (Theoritical) Probability
Empirical (Statictica) Probability
Subjective Probability
Senin, 26 Juli 2021
Measure of Position dalam Statistika
Apa itu Measure of Position?
- Quartile
- Percentile
- Standard Core
Quatile (Kuartil)
Percentile (Persentil)
- P25 menunjuk posisi yang sama dengan Q1
- P50 menunjuk posisi yang sama dengan Q2
- P75 menunjuk posisi yang sama dengan Q3
Deteksi Outlier dengan Percentile
- Lebih kecil dari P5
- Lebih besar dari P95
Measure of Variation dalam Statistika
Apa itu Measure of Variation?
- Range
- Variance
- Standard Deviation
Range (Jangkauan)
Variance (Variansi)
Standard Deviation (Simpangan Baku)
Kelemaha utama dari Varience adalah nilai yang dihasilkan tidak lagi memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.
Jumat, 23 Juli 2021
Measure of Central Tendency dalam Statistika
Apa itu Measure of Central Tendency?
Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.
Mean
Mean dari suatu dataset merupakan penjumlahaan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut.
Mean: Contoh
Median
Median dari suatu dataset merupakan nilai yang berada ditengah dengan mengacu pada nilai dataset yang sudah terurut.
Median: Contoh
Mode
Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.
Mode: Contoh
Kelebihan dan kekurangan Mean
* Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.
* Mean sangat rentan terhadap outlier.
* Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.
Outlier pada Dataset
Weighted Mean
Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.
Bentuk Distribusi (1/2)
Bentuk Distribusi (2/2)
Kamis, 22 Juli 2021
Visualisasi Data dalam Statistika
Pengantar
Beberapa teknik visualisasi data yang akan diperlajari:
* Stem and Leaf Plot
* Dot Plot
* Pie Chart
* Bar Plot
* Scatter Plot
* Time Series Chart
* Visual Data dengan Python
Stem and Leaf Plot{1/2}
Stem and Leaf Plot{2/2}
Dot Plot
Pie Chart
Bar Plot
Scatter Plot
Time Series Chart
Distribusi Frekuensi dalam Statistika
Distribusi Frekuensi (Frequency Distribution)
Definisi
* Distribusi frekuensi adalah bentuk pengolahaan data di mana data dikelompokkan ke dalam beberapa kelas berdasarkan interval tertentu.
* Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi dari kelas.
Frequency Distribution: Contoh
Membuat Distribusi Frekuensi
Mengenal midpoint, relative frequency, dan cummulative frequency
Visualisasi Data: Histogram
Visualisasi Data: Frequency Polygon
Visualisasi Data: Ogive
PENGUMPULAN DATA
Pengumpulan Data(Data Collection)
Census
Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan.
Sampling
Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik.
Dibutuhkan teknik sampling yang tepat untuk mendapat sample yang representatif terhadap populasinya.
Sampling eror
Karena sample merupakan sub bagian dari populasi, maka selisih perbedaan nilai antara data sample dan data populasi akan selalu ada. Perbedaan atau selisih nilai ini dikenal dengan istilah sampling eror. Bahkan dengan teknik sampling sebaik apapun, sampling eror ini tidak dapat dihindarkan.
Sampling: with/without Replacement
Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih darisatu kali sebagai anggota sample.
Sampling without replacement: Menjamin satu anggota populasi hanya dapat terpilih satu kali saja sebagai anggota sample.
Teknik Sampling(Sampling Techniques)
Teknik sampling dalam bidang statistika:
* Simple Ramdom Sampling
* Stratified Sampling
* Cluster Sampling
* Systematic Sampling
* Convenience Sampling
Sampling Technique: Simple Random Sampling
Simple random sampling merupakan teknik pengumpulan data yang dilakukan secara acak dimana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.
Sampling Technique: Stratified Sampling
* Stratified Sampling merupakan teknik pengumpulan data yang dilakukan secara acak yang dilakukan dengan terlebih dahulu membagi anggota populasi ke dalam beberapa kelompokberdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin, tingkat pendapatan, etc).
* Kelompok yang terbentuk ini biasa dikenal dengan istilah strata.
* Anggota dari tiap strata tersebut akan dipilih secara acak untuk dijadikan anggota sample.
* Agar sampling yang dilakukan di tiap strata haruslah proporsional dengan proporsinya dalam populasi.
Sampling Technique: Cluster Sampling
* Cluster Sampling merupakan teknik pengumpulan data yang dilakukan secara acak yang dilakukan dengan membagi anggota populasi ke dalam beberapa kelompok berdasarkan pengelompokan yang sudah terbentuk (e.g., kecamatan, kelurahan, etc).
* Kelompok yang terbentuk ini biasa dikenal dengan istilah cluster.
* Anggota dari tiap cluster tersebut akan dipilih secara acak untuk dijadikan anggota sample.
* Agar sampling yang dilakukan di tiap cluster haruslah proporsional dengan proporsional dengan proporsinya dalam populasi.
Sampling Technique: Systematic Sampling
Systematic Sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya sja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.
Sampling Technique: Convenience Sampling
Convenience Sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias.
Selasa, 13 Juli 2021
Desain Eksperimen dalam Statistika
Studi Statistik
Studi Observasi
Studi Eksperimen
Desain Eksperimen
- Kendali
- Pengacakan
- Replikasi
Eksperimental Design: Control (kendali)
- Kendali (control) dapat dilakukan menerapkan: Bliding dan Double Bliding
- Blinding, subjek eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo
- Double Blinding, dibutuhkan pihak ketiga untuk mendistribusikan traetment dan placebo kepada subjek eksperimen.
Eksperimental Design: Randomisation (pengacakan)
- Keseluruhan subjek eksperimen akan dikelompokkan berdasarkan kesamaan karakteristik tertentu.
- Subjek ditiap kelompok lalu dipilih secara acak untuk dimasukan dalam treatment group dan control group.
Eksperimental Design: Replications (replikasi)
Tantangan dalam Eksperimental Study
- faktor eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan pengaruh terhadap hasil eksperimen.
- Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo(treatment palsu).
- Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya telah terlibat eksperimen.
Senin, 12 Juli 2021
Klasifikasi Data dalam Statistika
Tipe Data
Data Kualitatif
- Atribut
- Label
Data Kuantitatf
- Perhitungan
- Pengukuran
Skala Pengukuran
- Nominal
- Ordinal
- Interval
- Rasio
Skala pengukuran Nominal
- Berasosiasi dengan tipe data kuanlitatif
- Berfokus pada pengelompokan atau pengkategorikan data berdasarkan nama, label, dan kualitas
- Tidak dapat dikenakan operasi Matematika
- Contoh: merk kendaraan motor, kota kelahiran, nama siswa
Skala pengukuran Ordinal
- Berasosiasi dengan tipe data kuanlitatif
- Data dapat dikelompokkan
- data dapat disusun berdasarkan urutan, peringkat, atau ranking
- Tidak dapat dikenakan operasi Matematika
- Contoh: tingkat kepuasan pelanggan, peringkat siswa dikelas
Skala pengukuran Ordinal
- Berasosiasi dengan tipe data kuanlitatif
- Data dapat dikelompokkan
- data dapat disusun berdasarkan urutan, peringkat, atau ranking
- Dapat dikenakan operasi matematika untuk menghitung selisih nilai
- Nilai numerik mempresentasikan posisi pada suatu skala ukur tertentu
- Tidak memiliki angka Nol yang absolut
- Tidak dapat dikenakan operasi Matematika terkait perkalian
- Contoh: temperatur udara 32 celcius, tahun 2020
Skala pengukuran Ordinal
- Berasosiasi dengan tipe data kuanlitatif
- Data dapat dikelompokkan
- data dapat disusun berdasarkan urutan, peringkat, atau ranking
- Dapat dikenakan operasi matematika untuk menghitung selisih nilai
- Memiliki nilai 0 yang absolut
- Dapat dikenakan operasi matematika terkait perkalian
- Contoh: Usia anak 7 tahun, berat badan 65kg
STATISTIKA DASAR
MENGAPA BELAJAR STATISTIKA?
- Data warehouse
- Data mining
- Big Data Analytics
- Machine Learning
- Data Sciense
DEFINISI
Statistika
- Pengumpulan (Collecting)
- Pengelolaan (Organising)
- Analisis (Analysing)
- Interpretasi (Interpreting)
Data
- Pengamatan (observations)
- Perhitungan (counts)
- Pengukuran (measuremens)
- Responsi (responses)
POPULASI & SAMPEL
Populasi (Populations)
Sampel (Samples)
- Bagian dari populasi
- Sampel yang baik adalah sampel yang representatif terhadap populasi sehingga dapat digunakan untuk menarik simpulan (conclusions) terhadap populasi
- Karena itu data sampel harus dikumpulkan dengan metode yang tepat (e.g random sampling)
PARAMETER & STATISTIK
Parameter
- Deskripsi numerik dari karakteristik suatu populasi.
- Terdapat hanya satu parameter untuk satu populasi.
Statistik
- Deskripsi numerik dari karakteristik suatu sampel.
- Memungkinkan untuk mendapati sejumlah statistik dengan nilai yang beragam untuk satu populasi yang sama.
contoh PARAMETER & STATISTIK
Cabang Ilmu Statistika
Statistika Deskriptif
- Pengelolahaan Data
- Peringkasan Data
- Visualisasi Data