Tipologi ini dapat dengan mudah membingungkan seperti yang dijelaskan.
Misalnya, data biner, seperti yang diperkenalkan dalam banyak teks atau kursus pengantar, tentu terdengar kualitatif: ya atau tidak, selamat atau mati, ada atau tidak ada, pria atau wanita, apa pun. Tapi skorkan dua kemungkinan 1 atau 0 dan semuanya kuantitatif sempurna. Penilaian semacam itu adalah dasar dari semua jenis analisis: proporsi perempuan hanya rata-rata beberapa 0 untuk laki-laki dan 1 untuk perempuan. Jika saya bertemu 7 wanita dan 3 pria, saya bisa rata-rata 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 untuk mendapatkan proporsi 0,7. Dengan respons biner, Anda memiliki jalan terbuka yang luas untuk mencatat dan mengeluarkan regresi, dan sebagainya, yang berfokus pada variasi dalam proporsi, fraksi atau probabilitas yang bertahan, atau sesuatu yang serupa, dengan apa pun yang mengontrol atau memengaruhinya. Tidak ada yang perlu khawatir dengan pengkodean yang sewenang-wenang. Proporsi laki-laki hanya 1 dikurangi proporsi perempuan,
Hampir sama juga berlaku ketika data nominal atau ordinal sedang dipertimbangkan, karena setiap analisis data tersebut bergantung pada penghitungan pertama, berapa banyak yang masuk dalam setiap kategori dan kemudian Anda dapat menjadi kuantitatif yang Anda inginkan. Bagan pie dan bagan batang, seperti yang pertama kali ditemukan pada tahun-tahun awal, menunjukkan hal itu, sehingga membingungkan berapa banyak akun yang melewatkan ini dalam penjelasan.
Dengan kata lain, Anda dapat mengklasifikasikan data mentah atau asli sebagai yang pertama kali dilaporkan dan sebagai yang muncul di katakanlah sel spreadsheet atau database. Tetapi bentuk aslinya tidak berubah. Bayangkan sesuatu yang benar-benar seperti kematian karena kebingungan karena terlalu banyak membaca buku teks yang dangkal. Itu dapat ditulis pada sertifikat, tetapi analisis statistik tidak pernah berhenti di situ. Ada agregasi untuk menghitung (berapa banyak kematian seperti itu di suatu daerah dan periode waktu), pengurangan tingkat (berapa banyak relatif terhadap populasi yang berisiko), dan sebagainya.
Jadi, bagaimana data pertama kali dikodekan jarang menghambat penggunaannya dengan cara lain dan transformasi ke bentuk lain. Etimologi data di sini mengungkapkan: menerjemahkan bahasa Latin asli secara harfiah, mereka seperti yang diberikan kepada Anda, tetapi tidak ada aturan terhadap mengubahnya menjadi banyak bentuk lainnya.