Selasa, 27 Juli 2021

Permutasi dan Kombinasi

 Permutasi


Permutasi adalah pengaturan urutan penyusunan sekumpulan objek unik (tidak mengandung duplikasi) 
permutasi dari sekumpulan n objek dapat diformulasikan sebagai faktorial dari n.























Kombinasi











Addition Rule Aturan Penjumlahaan

 Mutualy Exclusive Events

Dua buah event A dan B adalah Mutually Exclusive Event bila A dan B tidak dapat muncul pada waktu bersamaan.













The Addition Rule | Aturan Penjumlahan

Probabilitas untuk kemunculan event A dan B dapat diformulasikan sebagai berikut:











Conditional Probability & Multiplication Rule

 Apa itu Conditional Probability?

Conditional Probability adalah probabilitas kemunculan event, dengan mengetahui bahwa evnt lain sudah muncul atau terjadi.

Independent Event

Dua event adalah independent bila kemunculan dari event yang satu tidak mempengaruhi probability kemunculan event kedua.

Dependent Event

Event yang tidak independent dikenal sebagai dependent event.

The Multiplication Rule

Untuk mencari probaility dari dua event yang muncul secara berurutan, kita bisa memanfaatkan multiplication rule.

Konsep Dasar Probability & Counting

 Apa itu Probability?

Probability adalah pengukuran terhadap suatu kemungkinan atau peluang.
Pemahaman terhadap Probability merupakan dasar melangkah ke Statistika Inferensi.

Terminologi

  • Hasil dari suatu pencobaan (trial) dikenal sebagai outcome.
  • Himpunan dari seluruh kemungkinan outcome pada suatu probability experiment dikenal sebagai sample space
  • Bagian dari sample space dikenal dari event.
  • Event bisa terdiri dari satu atau lebih outcomes.

Probability Experiment

Probability experiment adalah aksi atau pencobaan (trial) yang menghasilkan suatu penghitungan, pengukuran, atau respon.

Tree Diagram

Tree diagaram digunakan untuk memberikan gambaran visual terkait setiap outcome dari suatu probability experiment.

Event

  • Event umumnya mempresentasikan dengan huruf kapital seperti A, B, dan C.
  • Suatu event yang terdiri dari sebuah outcome dikenal sebagai event sample.

Fundamental Counting Priciple

  • Pemanfaatan tree diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.
  • Sebagai alternatif, kita bisa memanfaatkan fundamental counting priciple untuk mengetahui jumlah kemungkinan outcomes dari dua atau lebih event yang muncul secara berurutan.

Types of Probability

  • Probability dapat dituliskan dengan format pecahan, sesimal, atau presentase.
  • Probability untuk kemunculan event E dapat dituliskan sebagai P(E).
Terdapat tiga tipe Probability:
  1. Classical (Theoritical) Probability
  2. Empirical (Statictica) Probability
  3. Subjective Probability

Classical (Theoritical) Probability

Classical Probability digunakan ketika setiap outcome pada sample space memiliki peluang yang sama untuk muncul.

Empirical (Statictica) Probability

Empirical Probability didasarkan pada observasi dari probability experiment.

Subjective Probability

didasarkan pada intuisi, eduacated guesses, dan estimasi.

Senin, 26 Juli 2021

Measure of Position dalam Statistika

 Apa itu Measure of Position?

Measure of Position dapat di definisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.
  • Quartile
  • Percentile
  • Standard Core

Quatile (Kuartil)

Quartile adalah nilai yang membagi suatu dataset terurut menjadi 4 bagian yang sama. Terdapat tiga nilai quartile, yaitu Q1, Q2, dan Q3 

Percentile (Persentil)

Persentil adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama.
Terdapat 99 nilai Percentile yaitu: P1, P2, .. ,P99
  • P25 menunjuk posisi yang sama dengan Q1
  • P50 menunjuk posisi yang sama dengan Q2
  • P75 menunjuk posisi yang sama dengan Q3

Deteksi Outlier dengan Percentile

Entri data (Data Point) pada suatu dataset bisa dikategorikan sebagai outlier bila:
  • Lebih kecil dari P5
  • Lebih besar dari P95
 

Measure of Variation dalam Statistika

 Apa itu Measure of Variation?

Measure of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan Keberagaman  dan sebaran data.

  • Range
  • Variance
  • Standard Deviation

Range (Jangkauan)

Range dari suatu dataset merupakan hasil perhitungan selisih antara nilai tertinggi dengan nilai terendah pada dataset tersebut.
Pengukuran nilai keberagaman dengan menggunakan range memiliki kelemahan dimana hanya menyertakan dua nilai saja dalam nilai pengukuran.

Variance (Variansi)

Variance dari suatu dataset merupakan hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari data tersebut.

Standard Deviation (Simpangan Baku)

Kelemaha utama dari Varience adalah nilai yang dihasilkan tidak lagi memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.

Jumat, 23 Juli 2021

Measure of Central Tendency dalam Statistika

 Apa itu Measure of Central Tendency?

Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan  nilai tipikal atau sentral dari suatu dataset.

Mean 

Mean dari suatu dataset merupakan penjumlahaan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri  pada dataset tersebut.

Mean: Contoh






Median

Median dari suatu dataset merupakan nilai yang berada ditengah dengan mengacu pada nilai dataset yang sudah terurut.

Median: Contoh 







Mode 

Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.

Mode: Contoh




Kelebihan dan kekurangan Mean

* Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.

* Mean sangat rentan terhadap outlier.

* Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.

Outlier pada Dataset






Weighted Mean

Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.

Bentuk Distribusi (1/2)






Bentuk Distribusi (2/2)



Kamis, 22 Juli 2021

Visualisasi Data dalam Statistika

 Pengantar

Beberapa teknik visualisasi data yang akan diperlajari:

* Stem and Leaf Plot 

* Dot Plot

* Pie Chart

* Bar Plot

* Scatter Plot

* Time Series Chart

* Visual Data dengan Python


Stem and Leaf Plot{1/2}





Stem and Leaf Plot{2/2}







Dot Plot






Pie Chart







Bar Plot







Scatter Plot







Time Series Chart



Distribusi Frekuensi dalam Statistika

Distribusi Frekuensi (Frequency Distribution)

Definisi

* Distribusi frekuensi adalah bentuk pengolahaan data di mana data dikelompokkan ke dalam beberapa kelas berdasarkan interval tertentu.

* Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi dari kelas.

Frequency Distribution: Contoh






Membuat Distribusi Frekuensi 








Mengenal midpoint, relative frequency, dan cummulative frequency







Visualisasi Data: Histogram






Visualisasi Data: Frequency Polygon







Visualisasi Data: Ogive



PENGUMPULAN DATA

Pengumpulan Data(Data Collection)

Census

Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan.

Sampling

Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik.

Dibutuhkan teknik sampling yang tepat untuk mendapat sample yang representatif terhadap populasinya.

Sampling eror

Karena sample merupakan sub bagian dari populasi, maka selisih perbedaan nilai antara data sample dan data populasi akan selalu ada. Perbedaan atau selisih nilai ini dikenal dengan istilah sampling eror. Bahkan dengan teknik sampling sebaik apapun, sampling eror ini tidak dapat dihindarkan.

Sampling: with/without Replacement

Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih darisatu kali sebagai anggota sample.

Sampling without replacement: Menjamin satu anggota populasi hanya dapat terpilih satu kali saja sebagai anggota sample.

Teknik Sampling(Sampling Techniques)

Teknik sampling dalam bidang statistika:

* Simple Ramdom Sampling

* Stratified Sampling

* Cluster Sampling

* Systematic Sampling

* Convenience Sampling

Sampling Technique: Simple Random Sampling

Simple random sampling merupakan teknik pengumpulan data yang dilakukan secara acak dimana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.

Sampling Technique: Stratified Sampling

* Stratified Sampling merupakan teknik pengumpulan data yang dilakukan secara acak yang dilakukan dengan terlebih dahulu membagi anggota populasi ke dalam beberapa kelompokberdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin, tingkat pendapatan, etc).

* Kelompok yang terbentuk ini biasa dikenal dengan istilah strata.

* Anggota dari tiap strata tersebut akan dipilih secara acak untuk dijadikan anggota sample.

* Agar sampling yang dilakukan di tiap strata haruslah proporsional dengan proporsinya dalam populasi.

Sampling Technique: Cluster Sampling

* Cluster Sampling merupakan teknik pengumpulan data yang dilakukan secara acak yang dilakukan dengan membagi anggota populasi ke dalam beberapa kelompok berdasarkan pengelompokan yang sudah terbentuk (e.g., kecamatan, kelurahan, etc).

* Kelompok yang terbentuk ini biasa dikenal dengan istilah cluster.

* Anggota dari tiap cluster tersebut akan dipilih secara acak untuk dijadikan anggota sample.

* Agar sampling yang dilakukan di tiap cluster haruslah proporsional dengan proporsional dengan proporsinya dalam populasi.

Sampling Technique: Systematic Sampling

Systematic Sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya sja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.

Sampling Technique: Convenience Sampling

Convenience Sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias.

 

Selasa, 13 Juli 2021

Desain Eksperimen dalam Statistika

 Studi Statistik

Studi Observasi

Seorang peneliti hanya melakukan pengamatan terhadap subjek tanpa melakukan tindakan apapun yang dapat mempengaruhi hasil pengamatan.

Studi Eksperimen

Suatu peneliti menerapkan suatu treatmen tertentu terhadap subjek sebelum melakukan pengamatan untuk memahami efek dari treatment yang dibeikan.

Desain Eksperimen

  • Kendali
  • Pengacakan 
  • Replikasi

Eksperimental Design: Control (kendali)

  • Kendali (control) dapat dilakukan menerapkan: Bliding dan Double Bliding
  • Blinding, subjek eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo
  • Double Blinding, dibutuhkan pihak ketiga untuk mendistribusikan traetment dan placebo kepada subjek eksperimen.

Eksperimental Design: Randomisation (pengacakan)

Randomised Blocked Design:
  • Keseluruhan subjek eksperimen akan dikelompokkan berdasarkan kesamaan karakteristik tertentu.
  • Subjek ditiap kelompok lalu dipilih secara acak untuk dimasukan dalam treatment group dan control group.

Eksperimental Design: Replications (replikasi)

Untuk meningkatkan vadilitas dari hasil eksperimen, dibutuhkan replikasi atau pengulangan eksperimen eksperimen dengan kondisi serupa atau mirip.

Tantangan dalam Eksperimental Study

Confounding/lurking variable:
  • faktor eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan pengaruh terhadap hasil eksperimen.
Placebo effect:
  • Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo(treatment palsu).
Hawthorne effect:
  • Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya telah terlibat eksperimen.

Senin, 12 Juli 2021

Klasifikasi Data dalam Statistika

 Tipe Data

Data Kualitatif

Data non numerik:
  • Atribut
  • Label

Data Kuantitatf

Data numerik yang dihasilkan melalui:
  • Perhitungan
  • Pengukuran

Skala Pengukuran 

Terdapat 4 skala pengukuran (Level of Measuremens) dalam bidang statistika:
  1. Nominal
  2. Ordinal
  3. Interval 
  4. Rasio

Skala pengukuran Nominal

  • Berasosiasi dengan tipe data kuanlitatif
  • Berfokus pada pengelompokan atau pengkategorikan data berdasarkan nama, label, dan kualitas
  • Tidak dapat dikenakan operasi Matematika
  • Contoh: merk kendaraan motor, kota kelahiran, nama siswa

Skala pengukuran Ordinal

  • Berasosiasi dengan tipe data kuanlitatif
  • Data dapat dikelompokkan
  • data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Tidak dapat dikenakan operasi Matematika
  • Contoh: tingkat kepuasan pelanggan, peringkat siswa dikelas

Skala pengukuran Ordinal

  • Berasosiasi dengan tipe data kuanlitatif
  • Data dapat dikelompokkan
  • data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Dapat dikenakan operasi matematika untuk menghitung selisih nilai
  • Nilai numerik mempresentasikan posisi pada suatu skala ukur tertentu
  • Tidak memiliki angka Nol yang absolut
  • Tidak dapat dikenakan operasi Matematika terkait perkalian
  • Contoh: temperatur udara 32 celcius, tahun 2020

Skala pengukuran Ordinal

  • Berasosiasi dengan tipe data kuanlitatif
  • Data dapat dikelompokkan
  • data dapat disusun berdasarkan urutan, peringkat, atau ranking
  • Dapat dikenakan operasi matematika untuk menghitung selisih nilai
  • Memiliki nilai 0 yang absolut
  • Dapat dikenakan operasi matematika terkait perkalian
  • Contoh: Usia anak 7 tahun, berat badan 65kg

STATISTIKA DASAR

MENGAPA BELAJAR STATISTIKA?

  • Data warehouse
  • Data mining
  • Big Data Analytics
  • Machine Learning
  • Data Sciense 

DEFINISI

Statistika

Bidang keilmuan yang mencakup
  • Pengumpulan (Collecting)
  • Pengelolaan (Organising)
  • Analisis (Analysing)
  • Interpretasi (Interpreting)
data, untuk mengambil keputusan

Data

Kumpulan Informasi yang diperoleh melalaui:
  • Pengamatan (observations)
  • Perhitungan (counts)
  • Pengukuran (measuremens)
  • Responsi (responses)


POPULASI & SAMPEL

Populasi (Populations)

Kumpulan dari keseluruhan pengamatan, penghitungan, pengukuran, atau responsi terhadap topik yang ingin dikaji.

Sampel (Samples)

  • Bagian dari populasi
  • Sampel yang baik adalah sampel yang representatif terhadap populasi sehingga dapat digunakan untuk menarik simpulan (conclusions) terhadap populasi
  • Karena itu data sampel harus dikumpulkan dengan metode yang tepat (e.g random sampling)
contoh Populasi & Sampel
Sampel : 
Suatu survey dilakukan di 35 perguruan tinggi diIndonesia untuk menanyakan apakah seorang mahasiswa pernah mengalami bully selama study diperguruan tinggi.
Didapati 237 dari total 972 reponden mengaku pernah mengalami bully selama menjalani studi diperguruan tinggi.

Populasi:
Warga kompleks perumahan Suka Rapi yang terdiri dari total 45 kepala keluarga berencana untuk mempercantik kompleks dengan melakukan peremajaan pavin jalan.

PARAMETER & STATISTIK

Parameter

  • Deskripsi numerik dari karakteristik suatu populasi.
  • Terdapat hanya satu parameter untuk satu populasi.

Statistik

  • Deskripsi numerik dari karakteristik suatu sampel.
  • Memungkinkan untuk mendapati sejumlah statistik dengan nilai yang beragam untuk satu populasi yang sama.

contoh PARAMETER & STATISTIK

Statistik:
Dari hasil uji emisi yang dilakukan secara acak terhadap kendaraan bermotor yang melintas di Jalan Suka Makmur, didapati 48% kendaraan tidak memenuhi standar kelayakan.

Parameter:
Dari hasil ujian saringan masuk diperguruan tinggi Universitas Suka Pintar pada tahun ini, ditemui 78% dari calon mahasiswa memiliki kemampuan analisis numerik diatas ambang batas yang disyaratkan.

Cabang Ilmu Statistika 

Statistika Deskriptif 

Cabang ilmu statistika yang berfokus pada:
  • Pengelolahaan Data
  • Peringkasan Data
  • Visualisasi Data

Statistika Inferensi

Cabang ilmu statistika yang berfokus pada pemanfaatan sampel untuk menarik simpulan terhadap populasi.