UTS Konsep Data Mining - ATA 2020/2021 | Dosen LILIS RATNASARI
ATA 2020/2021 | 4IA05 | Konsep Data Mining
Dosen : LILIS RATNASARI
1. Yang tejadi apabila ada data dengan bias yang tinggi adalah...
Select one:
a. Lowkey decision
b. Multicovariant
c. Underfitting
d. Overfitting
2. Machine Learning dapat digunakan untuk....
Select one:
a. Semua benar
b. Semua salah
c. Meberikan prediksi yang akurat
d. Membuat model matematis
3. Suatu bidang ilmu komputer yang memberikan kemampuan pembelajaran kepada komputer untuk mengetahui sesuatu tanpa pemrograman yang fix adalah salah satu pengertian....
Select one:
a. Fuzzy Logic Sistem
b. Machine Learning
c. Deep Learning
d. Neural Network
4. Definisi data mining yang paling tepat adalah berikut ini :
Select one:
a. Penggalian informasi menggunakan kumpulan tools tertentu
b. Penemuan pola yang tersimpan dalam dataset
c. Proses penemuan pola tersembunyi dari suatu kumpulan data
d. Pendekatan modern untuk menganalisa data
5. Dalam sebuah file, terdapat 1 record yang memiliki karakteristik berbeda dari data umumnya. Data yang berbeda tersebut dikenal dengan istilah…
Select one:
a. Scammer
b. Outliers
c. Missing Value
d. Noise
6. Range nilai similaritas adalah...
Select one:
a. 0 dan 2
b. 0 dan 1
c. 1 dan 2
d. 1 dan 2
7. Berikut adalah jenis-jenis missing value kecuali….
Select one:
a. Functionality random
b. Missing not at random
c. Missing value at random
d. Missing at random
8. Bidang teknik yang terkait dalam konsep data mining adalah berikut ini kecuali :
Select one:
a. Humaniora
b. Kecerdasan Buatan
c. Stastistika
d. Basisdata
9. Bidang kajian utama Machine Learning adalah berikut ini kecuali...
Select one:
a. Support Vector Machine
b. Deep Learning
c. Fuzzy Logic Sistem
d. Neural Network
10. Kadang dalam pembuatan model terdapat parameter yang berlebihan sehingga dapat menyebabkan...
Select one:
a. Underfitting
b. Unfit algorithm
c. Overfitting
d. Bias
11. Ada istilah 3V dalam data mining. Pengukuran tentang seberapa cepat data dikumpulkan, dibuat, dan didistribusikan adalah maksud dari….
Select one:
a. Velocity
b. Varicity
c. Volume
d. Variety
12. Tujuan metode classification adalah..
Select one:
a. Menentukan kelas
b. Memilihkan kelas
c. Salah semua
d. Membagi kelas
13. Perbedaan antara prediksi rata-rata model dengan nilai yang benar yang coba diprediksi disebut...
Select one:
a. Primary key
b. Bias
c. Covariant
d. Disguise
14. Tipe atribut dimana nilai 0 adalah sebuah nilai yang nyata dan dapat dicatat adalah tipe atribut…
Select one:
a. Ratio
b. Ordinal
c. Nominal
d. Interval
15. Berikut ini adalah rumus untuk menghitung impurity kecuali...
Select one:
a. Euclidean
b. Gini Index
c. Classification error
d. Entropy
16. Atribut yang sesuai untuk menggunakan tipe Nominal adalah berikut ini kecuali…
Select one:
a. Jenis Kelamin
b. Tinggi badan
c. ID Pegawai
d. Kodepos
17. Berikut ini adalah teknik mengukur jarak kecuali...
Select one:
a. Hamming
b. Euclidean
c. Jaccard
d. Minkowski
18. Overfitting sangat mungkin terjadi pada kondisi...
Select one:
a. Bias dan variansi tinggi
b. Bias tinggi dan variansi rendah
c. Bias dan variansi rendah
d. Bias rendah dan variansi tinggi
19. Jika Buku adalah sebuah entitas/objeku maka yang dapat menjadi salah satu atributnya adalah..
Select one:
a. Judul
b. Kemiringan
c. Kecepatan
d. Suhu
20. Salah satu algoritma yang masuk ke dalam metode classification adalah...
Select one:
a. K-means
b. Decision tree
c. Umbrella chain
d. Nearest neighbour
21. Metode classification termasuk dalam supervised learning karena...
Select one:
a. Ada missing value
b. Memiliki parameter
c. Lebih mudah diterapkan
d. Memiliki lingkup terdekat
22. Noise pada atribut dapat terjadi karena adanya…
Select one:
a. Penghapusan nilai
b. Modifikasi nilai data dari aturan nilai asli
c. Benda asing yang menempel di data
d. Kelebihan nilai
23. Kualitas data dapat dipengaruhi oleh factor..
Select one:
a. Alat
b. Manusia
c. Semua benar
d. Teknis
24. Data dokumen, matriks, data transaksi umumnya masuk dalam tipe dataset…
Select one:
a. Ordered
b. Record
c. Graph
d. Biased
25. Pengukuran seberapa miripnya dua objek adalah konsep dasar...
Select one:
a. Similaritas
b. Semua salah
c. Konjungsi
d. Dissimilaritas
26. Data merupakan….
Select one:
a. Informasi yang diolah lebih bernilai
b. Karakteristik suatu objek yang diamati
c. Kumpulan fakta yang disimpan dengan aturan
d. Koleksi objek data dan atributnya
27. Untuk dua objek yang mirip dalam similiaritas nilainya akan...
Select one:
a. Lebih tinggi
b. Standar
c. Lebih rendah
d. Tetap
28. Untuk mengantisipasi bahwa tidak ada data yang sempurna maka dalam pembuatan model harus melibatkan..........
Select one:
a. Kovarian dan Bias
b. Ambivalen dan Euclidean
c. Proximity dan Distance
d. Ouliers dan Noise
29. Ukuran kesalahan sebuah model terletak pada...
Select one:
a. Nilai error yang besar
b. Daya analisa yang lemah
c. Salah semua
d. Bias yang besar
30. Dua jenis data dalam machine learning adalah......
Select one:
a. Semua salah
b. Data training dan data testing
c. Data testing dan data fix
d. Data training dan data fix
31. Nilai Y dalam kurva logistic regression memiliki range nilai antara...
a. -1 dan 1
b. 0 dan ~
c. 0 dan 1
d. -1 dan 0
32. Nilai minimal dissmilaritas adalah...
a. 0
b. 1
c. 2
d. 3
33. Jumlah minimal untuk sampel dalam logistic regression yang direkomendasikan oleh Hosmer dan Lemeshow adalah...
a. 50
b. 300
c. 1000
d. 400