Apa perbedaan antara istilah "analisis deret waktu" dan "analisis data longitudinal"


17

Ketika berbicara tentang data longitudinal, kita dapat merujuk pada data yang dikumpulkan dari waktu ke waktu dari subjek / unit studi yang sama berulang kali, sehingga ada korelasi untuk pengamatan dalam subjek yang sama, yaitu kesamaan dalam subjek.

Ketika berbicara tentang data deret waktu, kami juga merujuk pada data yang dikumpulkan selama serangkaian waktu dan tampaknya sangat mirip dengan pengaturan longitudinal yang disebutkan di atas.

Saya ingin tahu apakah seseorang dapat memberikan klarifikasi yang jelas antara kedua istilah ini, apa hubungannya dan apa perbedaannya?


1
Ini dapat berubah menjadi sebuah jajak pendapat ... Saya telah bekerja pada kedua jenis data, dan satu perbedaan utama tampaknya adalah bahwa data longitudinal sering digunakan dalam analisis sebab-akibat , untuk memahami dampak intervensi atau perawatan, sedangkan rangkaian waktu sering digunakan dalam peramalan . Tentu saja, perbedaannya tidak jelas (Anda perlu memahami driver yang mendasari perkiraan, dan IMO Anda belum memahami driver kecuali Anda dapat memperkirakan dengan baik). Tetapi orang-orang yang melakukan deteksi sinyal dalam deret waktu sering tidak terlalu peduli tentang perkiraan, sehingga mereka mungkin akan menolak perbedaan saya.
Stephan Kolassa

Terima kasih atas komentar anda Tapi saya pikir istilah "kausal" mungkin tidak sesuai di sini, bukan istilah "asosiasi" harus lebih baik? Dalam hal tujuan analisis data, saya pikir komentar Anda masuk akal bagi saya. Tapi tidak bisakah kita menggunakan data longitudinal untuk melakukan perkiraan? Karena itu juga semacam data deret waktu.
tanya

1
Anda memang memiliki poin tentang "sebab-akibat" vs "asosiasi", dan tentu saja data longitudinal dapat digunakan untuk memperkirakan - hanya saja saya tidak sering melihat kedua konsep secara bersamaan. Peramal biasanya berbicara tentang deret waktu. Selain itu, saya tidak bisa mengatakannya lebih baik daripada @ung.
Stephan Kolassa

3
Salah satu perbedaan khas (bukan definisi) yang mungkin adalah bahwa dalam deret waktu Anda melihat dan memodelkan respons waktu sebagai bergantung pada kondisi ; ini adalah efek sisa . Dalam analisis waktu longitudinal, Anda biasanya menganggap waktu sebagai faktor latar belakang evolusi yang permanen . tt1
ttnphns

Jawaban:


19

Saya ragu ada definisi formal yang ketat yang disetujui oleh berbagai analis data.

Namun secara umum, deret waktu berkonotasi dengan unit studi tunggal yang diamati secara berkala selama periode waktu yang sangat lama. Contoh prototipikal adalah pertumbuhan PDB tahunan suatu negara selama beberapa dekade atau bahkan lebih dari seratus tahun. Untuk seorang analis yang bekerja untuk perusahaan swasta, itu mungkin merupakan pendapatan penjualan bulanan selama masa hidup perusahaan. Karena ada begitu banyak pengamatan, data dianalisis dengan sangat rinci, mencari hal-hal seperti musiman selama periode yang berbeda (misalnya, bulanan: lebih banyak penjualan pada awal bulan setelah orang-orang dibayar; setiap tahun: lebih banyak penjualan pada bulan November dan Desember, ketika orang-orang berbelanja untuk musim Natal), dan mungkin bergeser rezim. Peramalan seringkali sangat penting, seperti dicatat oleh @StephanKolassa.

Longitudinal biasanya mengacu pada pengukuran yang lebih sedikit pada sejumlah besar unit studi. Contoh prototipe mungkin percobaan obat, di mana ada ratusan pasien diukur pada awal (sebelum pengobatan), dan bulanan selama 3 bulan ke depan. Dengan hanya 4 pengamatan dari masing-masing unit dalam contoh ini, tidak mungkin untuk mencoba mendeteksi jenis-jenis fitur yang diminati oleh para analis time series. Di sisi lain, dengan pasien yang mungkin diacak ke dalam kelompok perawatan dan kontrol, kausalitas dapat disimpulkan begitu non-kemerdekaan telah diatasi. Seperti yang disarankan, sering kali non-kemerdekaan dianggap hampir sebagai gangguan, bukan fitur utama yang menarik.


9

Ada sekitar tiga jenis dataset:

  • potongan melintang: subjek yang berbeda secara bersamaan; menganggapnya sebagai satu baris dengan banyak kolom yang sesuai dengan mata pelajaran yang berbeda;
  • seri waktu: subjek yang sama pada waktu yang berbeda; menganggapnya sebagai satu kolom dengan baris yang sesuai dengan titik waktu yang berbeda;
  • panel (longitudinal): banyak subjek di waktu yang berbeda, Anda memiliki subjek yang sama di waktu yang berbeda, dan Anda memiliki banyak subjek di waktu yang sama; menganggapnya sebagai tabel di mana baris adalah titik waktu, dan kolom adalah subjek.

2
Berdasarkan komentar Anda, tampaknya data longitudinal adalah serangkaian data deret waktu yang dikumpulkan dari berbagai subjek?
tanya

1
Secara umum, ya, Anda bisa melihat setiap data subjek sebagai deret waktu. Namun dalam praktiknya, data longitudinal seringkali memiliki titik waktu yang sangat sedikit untuk setiap subjek. Mereka menyebut titik waktu gelombang . Sebagai contoh, itu bisa menjadi studi medis di mana setiap pasien memiliki 4-5 pengamatan pada interval bulanan, dan ratusan pasien selama bertahun-tahun. Dengan begitu set data panel sering tidak seimbang (pikirkan tabel yang sangat jarang), sehingga studi longitudinal memiliki metode favorit mereka sendiri untuk menangani hal ini.
Aksakal

Ini membantu mengingat pertanyaan itu, tetapi ada banyak jenis dataset lain yang tidak termasuk dalam judul ini. Namun, mereka tampaknya tidak relevan dengan pertanyaan, dan mencoba untuk mengklasifikasikan setiap jenis dataset yang mungkin akan sia-sia di sini. Contoh: setiap dataset di mana struktur dasar subjek x subjek; setiap dataset yang bukan dua dimensi.
Nick Cox

@NickCox, benar, tapi saya di bidang ekonometrika, dan ketiganya adalah orang-orang dengan teori yang dikembangkan, dan sebagian besar digunakan di bidang kita
Aksakal

2
Tidak diragukan lagi Anda memang demikian, tetapi tidak ada dalam pertanyaan ini yang mendukung atau bahkan mendorong sudut pandang ekonometrik yang sempit, juga perspektif spesifik Anda tidak dibuat eksplisit.
Nick Cox

4

Kedua istilah ini mungkin tidak terkait dengan cara OP mengasumsikan - yaitu, saya tidak berpikir mereka bersaing mode analisis.

Sebaliknya analisis deret waktu menggambarkan serangkaian teknik tingkat rendah yang mungkin berguna untuk menganalisis data dalam studi longitudinal.

Objek studi dalam analisis deret waktu adalah sinyal yang tergantung waktu.

Sebagian besar teknik untuk menganalisis dan memodelkan / memprediksi sinyal yang tergantung waktu ini dibangun di atas premis bahwa sinyal-sinyal ini dapat didekomposisi menjadi berbagai komponen. Dua yang paling penting adalah:

  • komponen siklik (misalnya, harian, mingguan, bulanan, musiman); dan

  • kecenderungan

Dengan kata lain, analisis deret waktu didasarkan pada eksploitasi sifat siklik dari sinyal yang bergantung waktu untuk mengekstraksi sinyal yang mendasarinya.


1

Apa Itu Data Longitudinal?

Data longitudinal, kadang-kadang disebut sebagai data panel, melacak sampel yang sama pada titik waktu yang berbeda. Sampel dapat terdiri dari individu, rumah tangga, perusahaan, dan sebagainya. Sebaliknya, data cross-sectional berulang, yang juga menyediakan data jangka panjang, memberikan survei yang sama untuk sampel yang berbeda dari waktu ke waktu.

Data longitudinal memiliki sejumlah keunggulan dibandingkan data cross-sectional yang berulang. Data longitudinal memungkinkan pengukuran perubahan dalam sampel dari waktu ke waktu, memungkinkan pengukuran durasi peristiwa, dan mencatat waktu berbagai peristiwa. Misalnya, misalkan tingkat pengangguran tetap tinggi untuk jangka waktu yang lama. Seseorang dapat menggunakan data longitudinal untuk melihat apakah kelompok individu yang sama tetap menganggur selama seluruh periode atau jika kelompok individu yang berbeda masuk dan keluar dari pengangguran selama periode waktu tersebut.

Sumber


0

Untuk membuatnya lebih sederhana, saya akan mengasumsikan studi individu, tetapi hal yang sama berlaku untuk setiap unit analisis. Itu tidak rumit, deret waktu adalah data yang dikumpulkan dari waktu ke waktu, biasanya menyiratkan pengukuran yang sama dari populasi yang setara pada interval waktu yang terpisah - atau dikumpulkan terus menerus tetapi dianalisis pada interval waktu.
Data longitudinal jauh lebih luas cakupannya. Populasi yang setara digantikan oleh populasi yang identik, sehingga data individu dapat dipasangkan atau bergabung dari waktu ke waktu. Data longitudinal dapat pengukuran berulang atau tidak tergantung pada tujuan penelitian. Ketika data Longitudinal tampak seperti deret waktu adalah ketika kita mengukur hal yang sama dari waktu ke waktu. Perbedaan besar adalah bahwa dalam rangkaian waktu kita dapat mengukur perubahan keseluruhan dalam pengukuran dari waktu ke waktu (atau dengan kelompok) sementara dalam analisis longitudinal Anda benar-benar memiliki pengukuran perubahan pada tingkat individu. Jadi Anda memiliki potensi yang lebih besar untuk analisis dan pengukuran perubahan tanpa kesalahan jika melibatkan sampel, sehingga studi longitudinal dapat lebih tepat dan informatif.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.