Apa itu Over Sampling dan Under Sampling? Over sampling dan under sampling adalah teknik dalam data mining dan data analytics yang digunakan untuk menyeimbangkan kelas data yang tidak merata agar menghasilkan data set yang lebih seimbang. Kedua teknik ini juga sering disebut sebagai resampling. Teknik ini sering digunakan untuk membuat data lebih mewakili kondisi dunia […]
Category: Data analytics and AI
data virtualization
Apa itu Data Virtualization? Data virtualization adalah istilah umum yang digunakan untuk menggambarkan pendekatan manajemen data yang memungkinkan aplikasi mengambil dan memanipulasi data tanpa harus mengetahui detail teknisnya. Ini mencakup bagaimana data diformat atau di mana data tersebut secara fisik disimpan. Tujuan utama dari data virtualization adalah menciptakan satu representasi data dari berbagai sumber yang […]
pseudo-random number generator (PRNG)
Apa Itu Pseudo-Random Number Generator (PRNG)? Pseudo-random number generator (PRNG) adalah program yang digunakan dalam aplikasi probabilitas dan statistik ketika dibutuhkan banyak angka acak. Sebagian besar program ini menghasilkan deretan panjang angka satu digit, biasanya dalam basis 10 (sistem desimal). Ketika sampel besar angka pseudo-random diambil, setiap digit dalam himpunan {0,1,2,3,4,5,6,7,8,9} akan muncul dengan frekuensi […]
stemming
Apa Itu Stemming? Stemming adalah proses mengubah kata ke bentuk dasarnya dengan menghilangkan akhiran dan awalan atau ke akar kata yang dikenal sebagai “lemma”. Stemming berperan penting dalam pemahaman bahasa alami (NLU) dan pemrosesan bahasa alami (NLP). Stemming merupakan bagian dari studi linguistik dalam morfologi serta kecerdasan buatan (AI), pengambilan informasi, dan ekstraksi data. Dengan […]
speech disfluency
Speech disfluency adalah gangguan dalam kelancaran berbicara yang disebabkan oleh penuturnya sendiri. Jenis-jenis speech disfluency meliputi gagap, jeda, serta kata-kata pengisi yang sering digunakan orang untuk menghindari keheningan yang canggung atau mencegah orang lain menyela sebelum mereka menemukan kata berikutnya. Beberapa kategori speech disfluency: Fillers – Kata atau suku kata yang disisipkan dalam percakapan seperti […]
ambient intelligence (AmI)
Apa Itu Ambient Intelligence (AmI)? Ambient intelligence, atau sering disingkat AmI, adalah elemen dalam lingkungan pervasive computing yang memungkinkan sistem berinteraksi dan merespons manusia secara otomatis. Kemampuan ini didukung oleh perangkat tertanam yang tidak mencolok dan antarmuka pengguna (UI) yang alami, yang memungkinkan sistem memberikan layanan secara otomatis sesuai kebutuhan yang terdeteksi, serta menerima input […]
data science as a service (DSaaS)
Data Science as a Service (DSaaS) adalah bentuk outsourcing di mana sebuah perusahaan menerima informasi dari analisis data tingkat lanjut yang dijalankan oleh data scientist dari perusahaan penyedia layanan untuk digunakan dalam bisnis mereka. Penyedia DSaaS mengumpulkan data dari klien, menyiapkannya untuk analisis, menjalankan algoritma analitik terhadap data yang telah diproses, lalu mengembalikan hasil yang […]
read-only
Apa Itu Read-Only? Read-only adalah sebuah atribut file yang hanya memungkinkan pengguna untuk melihat file tersebut, tetapi membatasi segala bentuk penulisan atau pengeditan. Jika sebuah file disetel sebagai “read-only”, pengguna masih bisa membukanya dan membacanya, tetapi tidak dapat menghapus, menimpa, mengedit, atau mengganti namanya. Fitur ini sering digunakan untuk tujuan izin akses dan keamanan, guna […]
integer
Apa Itu Integer (Bilangan Bulat) dan Contohnya? Bilangan bulat (integer, dibaca: IN-tuh-jer) adalah bilangan utuh (bukan bilangan pecahan) yang bisa bernilai positif, negatif, atau nol. Contoh bilangan bulat: -5, 1, 5, 8, 97, dan 3.043. Contoh bilangan yang bukan bilangan bulat: -1,43, 1 3/4, 3,14, 0,09, dan 5.643,1. Himpunan Bilangan Bulat Himpunan bilangan bulat, yang […]
Korelasi
Apa Itu Korelasi? Korelasi adalah ukuran statistik yang menunjukkan sejauh mana dua atau lebih variabel berfluktuasi dalam hubungan satu sama lain. Korelasi positif menunjukkan bahwa kedua variabel tersebut cenderung meningkat atau menurun secara bersamaan, sedangkan korelasi negatif berarti ketika satu variabel naik, variabel lainnya justru turun. Koefisien korelasi adalah ukuran statistik yang menunjukkan sejauh mana […]