Repositori Data Kesehatan Masyarakat di Amerika Serikat bergerak menuju AGE dalam format kenaikan lima tahun dalam tahun-tahun karena dampak dari peraturan HIPAA mengenai penyamaran dan penyembunyian data yang disengaja untuk alasan privasi pribadi.
Mengingat tantangan ini terhadap apa yang telah terjadi di masa lalu (sebelum HIPAA) tingkat yang cukup dari elemen data pengukuran berdasarkan perbedaan antara tanggal lahir dan tanggal kematian, kita mungkin perlu mempertimbangkan kembali AGE sebagai variabel skala yang dapat dijelaskan secara parametrik sama sekali dalam set data kesehatan masyarakat, yang mendukung model yang menggambarkan AGE secara non-parametrik, sebagai tingkat ukuran ordinal. Saya tahu ini mungkin tampak "di atas" untuk banyak faksi dalam komunitas informatika biomedis, tetapi ide ini mungkin memiliki beberapa kelebihan dalam hal "interpretasi" seperti yang dijelaskan dalam komentar di atas.
Bagaimana dengan semua kekuatan analitis yang tersedia untuk pendekatan non-parametrik? Ya, memang benar bahwa setiap orang dari kita hampir secara universal akan mencoba menerapkan teknik GLM (model linier umum) ke variabel yang menampilkan dirinya kepada kita dalam distribusi yang berperilaku seperti AGE.
Pada saat yang sama bentuk distribusi itu dan bagaimana bentuk itu ditentukan oleh efek interaksi multi-dimensi pada centroid multi-dimensi dan sub-grup centroid yang ada dalam distribusi, harus dipertimbangkan. Apa yang harus dilakukan dengan set data yang sangat kompleks ini?
Ketika elemen data gagal memenuhi "asumsi model", kami semakin memindai (saya katakan di seberang, bukan ke bawah; kita harus menjadi pengusaha dengan kesempatan yang sama, setiap alat berasal dari pabrik dengan bentuk mengikuti aturan fungsi) daftar dari model lain yang mungkin untuk menemukan yang "tidak gagal" tes asumsi.
Dalam format saat ini dalam set data kesehatan masyarakat, kami benar-benar perlu (sebagai komunitas visualisasi data) untuk menghasilkan model yang lebih standar untuk menangani AGE dalam peningkatan lima tahun (5YI). Pilihan saya untuk visualisasi data AGE (diberikan format 5YI baru) adalah menggunakan histogram dan plot kotak dan kumis. Ya, ini berarti median. (Tidak ada permainan kata-kata yang dimaksudkan!)
Kadang-kadang gambar benar-benar bernilai seribu kata, dan abstrak adalah ringkasan dari seribu kata. Plot kotak dan kumis menunjukkan "bentuk" dari distribusi sebagai representasi simbolis yang bermakna dari histogram pada tingkat resolusi ikonik. Membandingkan distribusi kenaikan usia lima tahun dengan menunjukkan kotak "berdampingan" dan plot kumis di mana orang dapat secara instan membandingkan pola dari 75 ke 50 (median) ke ntile ke-25 yang lebih rendah, akan membuat "standar universal" yang elegan untuk membandingkan AGE lintas Dunia. Bagi kita yang terus menikmati sensasi representasi data melalui mekanisme tekstual tampilan tabular, diagram "batang dan daun" juga dapat digunakan saat digunakan sebagai elemen grafis visual beranimasi dalam "grafik mini"
Usia sudah dewasa. Perlu dieksplorasi lebih lanjut dengan algoritma komputasi yang lebih kuat yang sekarang tersedia.