Cara belajar setiap orang berbeda, adapun aku punya cara belajar yang cukup banyak, tapi yang penting aku ga bisa belajar dengan diem dan membaca doang dalem hati. Itu pasti langsung ilang. Aku juga ga bisa kaya orang orang pinter di kelas yang dosen lagi jelasin, mereka tidur, tapi tetep bisa jawab. Jenius.

Beberapa effort biar ini otak dapat menerima adalah: nulis pake warna, ngajarin orang, baca tapi harus ngomong dan mengulangnya kembali sambil ngomong. Lebih bagus lagi kalo ada temen belajar yang pola belajarnya sama, biasanya aku selalu tanya jawab dan belajar bareng.

Cara selanjutnya adalah: nulis lagi. Jadi aku mo ngulang dengan bahasaku sendiri. Ini basic banget, saking basicnya jadi udah lupa semua.

hubungan data

Data, didapat dari observasi dan experiment. Pengolahan data dapat dilakukan dengan berbagai cara, dalam konteks ini karena sedang menuju AI maka ada 3 cara; asosiasi, intervensi, dan counterfactual.

  1. asosiasi: hubungan antar data cukup linear. Kita hanya perlu mengamati. Contoh: data gempa berupa magnitudo (X)  akan menghasilkan tinggi gelombang (Y) yang berbeda untuk setiap X. Solusi: menggunakan machine learning dan deep learning.
  2. Intervensi: ada perlakuan khusus yang dilakukan terhadap X. Contoh: Jika aku pake vaksin, apakah bakal bebas dari covid? Cara pengambilan data adalah dengan ada segerombol sampel data (X), 50% pakai vaksin dan 50% ga pake vaksin (Z). Lalu dilihat hasilnya apakah berpengaruh pada reaktif/tidaknya terhadap virus (Y). Solusi model: causal modelling
  3. counterfactual. Kita memiliki data sebaliknya dari data yang dibutuhkan. Misal, aku mau pulang lewat jalan A (X’) maka akan menempuh waktu B (Y’). Tapi yang ditanyakan adalah berapa waktu yang dibutuhkan (Y)  jika kamu lewat jalan C (X)? Solusi model: causal modelling.

Hubungan hubungan antara X dan Y bisa diketahui dengan regresi. Setelah hubungan antara kedua data didapat, maka dia akan menghasilkan linear regresion model yang bisa memodelkan kasus lain dengan karakter yang sama. Linear regresi ini berlaku untuk data yang CONTINUOUS dengan rentang tidak terbatas.

Jika data yang dimiliki berbentuk klasifikasi dan DISKRIT maka jangan gunakan linera model, tapi classification model. Machine learningnya: logistic regression, random forest (???), etc. Contoh kasus: ada pengklasifikasian apakah si data hoax/tidak. reaktif/non reaktif. tsunami/non tsunami.

Jika data yang kita punya berupa titik, maka dalam model yang perlu dicari adalah garis tengah yang merepresentasikan kecondongan data-data dalam titik-titik tersebut. TUGAS dari machine learning adalah: menentukan garis yang digunakan sebagai persamaan. Dia memiliki kriteria dan akan terjawab setelah ada persamaan yang pas.

JIKA ada data berupa cluster yang karakternya saling berbeda tapi membentuk grup, maka observasi dilakukan dalam grup dengan karakter yang sama.

Persamaannya kurang lebih umumnya seperti ini. YANG KITA UBAH-UBAH SUPAYA SI GARIS JADI FIT: INTERCEPT DAN SLOPE. udah dua itu aja.

Jika si teta diubah-ubah nantinya ada beberapa opsi persamaan/garis yang merepresentasikan model yang berbeda. Kita ubah si intercept dan slopenya dari negatif ke positif untuk mencari model terbaik (eror paling kecil).

Prosedurnya seperti ini:

Dari gambar diatas, H(teta) ADALAH hasil akhir dari intercept dan slope yang tadi udah diubah-ubah dan telah ditemukan mana yang paling cocok.

Habis itu, tentu saja kita cari errornya, disini dikatakan pakai metode corresponding cost function (si j(teta) dalam gambar diatas). Kalau lihat rumusnya, ini adalah rumus ordinary least square–sama kayak yang dipake di pasut.

j(teta) akan menentukan apakah h(teta) baik/tidak. Selisihnya (data asli – data prediksi) merepresentasikan si errornya. J(teta) ini adalah eror antara si data asli (dalam gambar ini berbentuk titik/diskrit) terhadap jarak garis model. 

Setelah estimasi cost function tadi, kita bisa update parameter tetanya dengan menyesuaikan dengan hasil eror tadi supaya nilai j(teta) jadi kecil. CARA: coba semua nilai teta yang berbeda, cari hingga j(teta) mendekati NOL. Cara manual: bandingkan dengan data sebelum dan sesudah.

Cara lain untuk mencari error (j(teta)): dengan cross entrophy, jadi nanti ada dua kurva ada yang menuju 0 dan menuju 1, tapi agak skip……

Tenang saja, hal hal diatas udah langsung dilakukan oleh si modelnya sendiri, jadi ngapain juga belajar? hehehe

materi 2-6: tidak bisa ditulis karena langsung praktek…

sekian dan numpang nitip