Gambaran
Ada banyak kemungkinan representasi, dan dengan demikian skema database, untuk menyimpan tanggal fuzzy (atau bahkan hanya tanggal fuzzy):
- Tanggal-waktu dan kode menunjukkan ketepatan atau keakuratannya
- Tanggal-waktu dan interval di mana ada beberapa kemungkinan untuk mewakili suatu interval:
- Mewakili semua interval sebagai kuantitas bilangan bulat (atau angka lainnya) dari beberapa unit tetap, misalnya hari, menit, nanodetik.
- Menampilkan interval sebagai kuantitas integer (atau numerik lainnya) dan kode yang menunjukkan unitnya.
- Tanggal mulai dan berakhir
- Tali
- Distribusi kemungkinan:
- Kuantitas atau titik apung untuk parameter yang menentukan distribusi tertentu dalam kelompok tertentu, misalnya mean dan standar deviasi dari distribusi normal.
- Fungsi distribusi probabilitas, misalnya sebagai kode (pencarian) (berpotensi dengan parameter nilai tertentu), atau sebagai ekspresi dalam bahasa, format, atau representasi yang cukup ekspresif.
[1], [2], dan [3] adalah semua interval seragam (secara implisit), yaitu seperangkat (sama) poin yang mungkin dalam waktu.
[4] adalah yang paling ekspresif, yaitu ketika memungkinkan kalimat atau frasa bahasa tertulis yang memungkinkan (atau setidaknya panjang). Tapi itu juga yang paling sulit untuk dikerjakan. Dalam batas tersebut, AI tingkat manusia akan diperlukan untuk menangani nilai-nilai sewenang-wenang. Secara praktis, kisaran nilai yang mungkin perlu dibatasi secara ketat, dan nilai 'terstruktur' alternatif mungkin akan lebih disukai untuk banyak operasi, misalnya penyortiran, pencarian.
[5] mungkin merupakan representasi kompak paling umum yang (agak) praktis.
Interval Seragam
Interval yang seragam adalah cara ringkas paling sederhana untuk mewakili sekumpulan nilai waktu tanggal (mungkin).
Untuk [1], bagian-bagian dari nilai tanggal-waktu diabaikan, yaitu bagian-bagian yang terkait dengan unit yang lebih halus daripada presisi atau akurasi yang ditunjukkan; jika tidak, ini setara dengan [2] dan kode presisi / keakuratan setara dengan interval dengan unit yang sama (dan kuantitas tersirat dari 1).
[2] dan [3] secara ekuivalen setara. [1] sangat kurang ekspresif daripada karena ada interval efektif yang tidak dapat diwakili oleh [1], mis. tanggal-waktu fuzzy setara dengan interval 12 jam yang mencakup batas tanggal.
[1] lebih mudah bagi pengguna untuk memasukkan daripada representasi lainnya dan umumnya harus (setidaknya sedikit) kurang mengetik. Jika tanggal-waktu dapat dimasukkan dalam berbagai representasi teks, misalnya "2013", "2014-3", "2015-5-2", "7/30/2016 11p", "2016-07-31 18:15" , ketepatan atau keakuratan juga dapat disimpulkan secara otomatis dari input.
Keakuratan atau ketepatan [1] juga paling mudah untuk dikonversi ke formulir yang akan disampaikan kepada pengguna, misalnya '2015-5 dengan akurasi bulan' hingga "Mei 2015", dibandingkan "13 Mei 2015 2p, plus atau minus 13,5 hari" (perhatikan bahwa yang terakhir tidak dapat diwakili oleh [1] lagipula).
String
Secara praktis, nilai-nilai string perlu dikonversi ke representasi lain untuk kueri, mengurutkan, atau membandingkan beberapa nilai. Jadi, sementara bahasa alami (manusia) apa pun tertulis lebih ekspresif daripada [1], [2], [3], atau [5], kami belum memiliki cara untuk menangani lebih dari sekadar representasi atau format teks standar. Mengingat itu, ini mungkin representasi yang paling tidak berguna dengan sendirinya .
Salah satu keuntungan dari representasi ini adalah bahwa nilai-nilai harus, dalam praktiknya, dapat ditampilkan kepada pengguna apa adanya dan tidak memerlukan transformasi agar mudah dipahami.
Distribusi Probabilitas
Distribusi probabilitas menggeneralisasi representasi interval yang seragam [1], [2], [3], dan (bisa dibilang) setara dengan representasi string (umum) [4].
Salah satu keuntungan dari distribusi probabilitas dibandingkan string adalah bahwa yang pertama tidak ambigu.
[5-1] akan sesuai untuk nilai-nilai yang (sebagian besar) sesuai dengan distribusi yang ada, misalnya output nilai tanggal-waktu dari perangkat yang pengukurannya diketahui (atau dipikirkan) agar sesuai dengan distribusi tertentu.
[5-2] mungkin cara terbaik (agak) praktis untuk secara kompak mewakili nilai 'fuzzy datetime'. Tentu saja komputabilitas dari distribusi probabilitas khusus menggunakan hal-hal dan pasti ada masalah yang menarik (dan mungkin tidak mungkin) untuk dipecahkan ketika menanyakan, menyortir, atau membandingkan nilai-nilai yang berbeda, tetapi banyak dari ini mungkin sudah diketahui atau diselesaikan di suatu tempat pada saat ini literatur matematika dan statistik jadi ini jelas berdiri sebagai representasi yang sangat umum dan tidak ambigu.