IMHO, siapa pun yang terlebih dahulu menghilangkan waktu perubahan yang tepat number of carsadalah yang pertama bertanggung jawab atas hasil yang menyesatkan. Jika Anda memiliki informasi ini (bahkan jika diukur dengan kesalahan), timeakan menjadi variabel kontinu yang tepat, bukan variabel kontinu yang dikelompokkan (lihat Anderson, 1984) tentu saja. Anda akan bebas untuk mengelompokkan pengamatan menjadi hournampan berbasis jika Anda benar-benar ingin, pada titik mana Anda akan memikul tanggung jawab untuk mendapatkan hasil yang menyesatkan. Jika tidak, dengan mempertahankan waktu kedatangan yang tepat, Anda dapat membuat grafik number of cars seri waktulebih terus menerus timesecara akurat.
Lagi pula, dengan asumsi Anda terjebak dengan number of carsperhour, Saya setuju dengan @John, Anda harus menggambar garis yang menghubungkan pengamatan jam Anda. Jika Anda kekurangan informasi tentang kapan setiap perubahan tambahan terjadi, agak sulit untuk mengatakan Anda menyesatkan siapa pun kecuali Anda gagal menggambarkan batas-batas informasi yang digambarkan. Demikian pula, jika Anda membuat grafik data per jam Anda dengan diagram batang sederhana tanpa garis yang menghubungkan tempat sampah, Anda tidak benar-benar bersalah menyesatkan siapa pun jika Anda tidak mengklaim bahwa perubahan antara pengamatan per jam terjadi tepat seperti yang digambarkan, pada jam tersebut, semua sekaligus. Jika seseorang salah paham (seperti yang mungkin terjadi dengan statistik atau data yang dipublikasikan), Anda tidak akan salah paham, terutama jika Anda mendeskripsikan data dan prosedur pengumpulan Anda dengan cukup detail. Sebanyak ini seharusnya tidak sulit untuk dilakukan.
Mengingat kejelasan dan ketelitian dasar data dan deskripsi grafik, seharusnya tidak ada kerugian menggambar garis untuk menghubungkan tempat sampah Anda. The keuntungan dari menghubungkan sampah Anda sebenarnya apa yang Anda tampaknya berpikir adalah merugikan: menggambar garis meniru persamaan setengah layak untuk number of carssebagai fungsi kontinu time, meskipun hal ini didasarkan pada diskrit, pengamatan per jam. Anda dapat menggunakan garis lurus di antara pengamatan untuk mewakili asumsi yang cukup masuk akal bahwa perubahan terjadi secara linear atas masing-masing hour, tidak sekaligus. Berdasarkan asumsi seperti itu, setiap pembaca dapat membuat tebakan yang layak minutesetelah hourpengukuran yang diberikan akan melihat mobil berikutnya tiba atau pergi dengan prosedur empat langkah yang cukup masuk akal ini:
- Temukan titik pada baris di mana
number of cars =1+hourpengamatan sebelumnya
- Gambarlah garis lurus ke bawah dari titik ini untuk menemukan di mana ia bersinggungan dengan
hoursumbu
- Ukur
distancetitik ini pada hoursumbu dari titik pengamatan sebelumnya
distance ÷ distance between observations ×60= minutesetelah hourkedatangan mobil berikutnya.
Tentu saja, seseorang dapat memperkirakan kedatangan mobil berikutnya ke detik yang tepat juga, dan Anda tidak dapat menghentikan pembaca dari melakukan ini dengan tidak menyediakan garis - menggambar garis hanya menjadi yang pertama dari lima langkah. Jadi, jika seseorang benar-benar ingin tahu berapa banyak mobil yang ada di sana ... ya, mereka tidak bisa, karena info itu tidak tersedia, tetapi mereka dapat memperkirakan. Jika Anda mengetuk langkah dari proses untuk mereka, saya membayangkan mereka akan berterima kasih.
Melakukan ini untuk pembaca Anda dengan garis-garis lurus dan sederhana hanya menyiratkan kenyamanan Anda dengan asumsi bahwa perubahan terjadi secara linier antara pengamatan per jam, atau lebih tepatnya menyatakan, ketidaksukaan Anda pada ketidakakuratan dalam asumsi ini. Ketidakakuratan tidak sulit dibayangkan. Pertama, perubahan harus terjadi sebagai fungsi nonlinier, inflasi nol time. Ini nonlinier karena pergantian peristiwa adalah ternary : baik mobil datang, pergi, atau tidak - mobil tidak datang atau pergi dengan penambahan fraksional. Tidak ada inflasi karena sebagian besar waktu tidak akan melihat mobil datang atau pergi. Anda dapat menyiasati hal ini dengan memperlakukan garis seperti menggambarkan probabilitymobil yang akan tiba atau pergi pada saat tertentu untuk mencapai seluruh nomor terdekat.
Namun ketidaktepatan lain dari asumsi di balik garis lurus antara pengamatan per jam tetap. Anda mungkin mengharapkan tingkat perubahan (dalam hal probabilityseperti di atas) berubah lebih lancar dari waktu ke waktu daripada garis lurus Anda ditarik secara terpisah di antara titik-titik yang tersirat. Dalam istilah yang lebih matematis, Anda mungkin ingin turunan dari fungsi number of cars( hour) Anda menjadi kontinu di hours. Anda mungkin dapat melakukan ini dengan menyesuaikan fungsi polinomial ke data Anda, tetapi jika tujuan Anda prediktif, waspadalah terhadapoverfitting.
Keuntungan lain dari garis di atas bilah gaya-histogram (yaitu, tanpa jarak menengah untuk nilai-nilai yang berdekatan dari hour... apalagi bagan dengan bilah yang tidak saling "menyentuh") muncul dari lotvariabel politom Anda . Anda dapat menempatkan seri waktu terpisah Anda untuk setiap lot pada grafik yang sama untuk memfasilitasi perbandingan, yang akan membantu Anda melihat apakah lotvariabel Anda menarik. Berikut ini demonstrasi dengan beberapa data yang dibuat-buat:
Kudos to McCown !
Saya bahkan tidak akan mencoba mencari tahu bagaimana melakukannya secara koheren dengan bar; Saya akan menyerahkannya ke @ ChristianStade-Schuldt;) Agar adil, akan lebih mudah untuk tidak menghubungkan titik-titik ini seperti yang ia sarankan, tetapi menambahkan garis membantu menyamarkan titik-titik yang berkaitan dengan rangkaian waktu yang terpisah satu sama lain. Pada akhirnya, itu masih akan menjadi sedikit subjektif, jadi menilai sendiri:

Saya sendiri mendapati diri saya menggambar garis-garis dalam pikiran saya. BTW, jika Anda merasakan garis-garis pada gambar pertama mengurangi apa pun dari dampak visual dari titik yang tepat, jangan lupa bahwa Anda selalu dapat meningkatkan ukuran titik, mengubah bentuknya, atau menyajikan nilainya secara numerik dalam tabel terpisah .
Referensi
Anderson, JA (1984). Regresi dan variabel kategori terurut. Jurnal Royal Statistics Society B, 46 , 1–30.