Perusahaan asuransi bernama "Sure Tomorrow" ingin menyelesaikan beberapa masalah dengan bantuan machine learning. Kamu pun diminta untuk mengevaluasi kemungkinan tersebut.
Tugas 1: Temukan klien yang mirip dengan kriteria klien tertentu. Tugas ini akan memudahkan perusahaan untuk melakukan pemasaran.
Tugas 2: Prediksi apakah klien baru kemungkinan akan mengambil klaim asuransi. Apakah prediksi model lebih baik daripada prediksi model dummy?
Tugas 3: Prediksi besaran klaim asuransi yang mungkin diterima klien baru menggunakan model regresi linear.
Tugas 4: Lindungi data pribadi klien tanpa merusak model dari tugas sebelumnya.
Oh ya, sangat penting untuk mengembangkan algoritma transformasi data yang bisa mencegah penyalahgunaan informasi pribadi klien jika data tersebut jatuh ke tangan yang salah. Ini disebut sebagai penyembunyian data atau pengaburan data. Namun, prosedur perlindungan datanya pun perlu diperhatikan agar kualitas model machine learning tidak menurun. Di sini, kamu tidak perlu memilih model yang terbaik, cukup buktikan bahwa algoritma kamu bekerja secara akurat.
Fitur-fitur: gender, usia, gaji, dan jumlah anggota keluarga dari orang yang diasuransikan.
Target: besaran klaim yang diterima orang yang diasuransikan selama lima tahun terakhir.