Berapa banyak informasi yang bisa Anda dapatkan dari nama?


11

Nama: pertama, mungkin tengah, dan nama keluarga.

Saya ingin tahu tentang seberapa banyak informasi yang dapat Anda gali dari suatu nama, menggunakan kumpulan data yang tersedia untuk umum. Saya tahu bahwa Anda bisa mendapatkan yang berikut dengan di mana saja antara probabilitas rendah-tinggi (tergantung pada input) menggunakan data sensus AS: 1) Jenis Kelamin. 2) Perlombaan.

Facebook misalnya, menggunakan persis itu untuk mencari tahu, dengan tingkat akurasi yang layak, distribusi rasial dari pengguna situs mereka (https://www.facebook.com/note.php?note_id=205925658858).

Apa lagi yang bisa ditambang? Saya tidak mencari sesuatu yang spesifik, ini adalah pertanyaan yang sangat terbuka untuk mengurangi rasa penasaran saya.

Contoh saya khusus untuk AS, jadi kami akan menganggap bahwa nama itu adalah nama seseorang yang berlokasi di AS; tetapi, jika seseorang mengetahui set data yang tersedia untuk umum untuk negara lain, saya lebih dari terbuka untuk mereka juga.

Saya tidak yakin apakah ini tempat yang tepat untuk ini, jika tidak, saya akan menghargai jika seseorang dapat mengarahkan saya ke tempat yang lebih tepat.

Saya harap ini pertanyaan yang menarik, dan ini adalah tempat yang tepat!


2
mungkin Anda bisa mendapatkan sesuatu tentang lokasi geografis juga, jika Anda bisa mendapatkan data yang cocok? Anda juga dapat menggunakan informasi tentang popularitas nama depan dari waktu ke waktu (google "baby name wizard") untuk membuat kesimpulan tentang usia ...
Ben Bolker

1
Saya telah menggabungkan pertanyaan yang ditransfer dengan duplikat.

Jawaban:


12

Ini bukan jawaban yang serius, tetapi saya baru ingat sesuatu dari buku yang saya baca setahun yang lalu. Ada bab dalam Freakonomics yang ditujukan untuk apa yang dapat Anda ceritakan tentang seseorang dari namanya. Bab ini didasarkan pada makalah penelitian penulis Penyebab dan konsekuensi dari nama hitam yang khas

Saya pikir saya telah menemukan kutipan atau ringkasannya di artikel ini

Data menunjukkan bahwa, rata-rata, seseorang dengan nama hitam yang khas — apakah itu wanita bernama Imani atau pria bernama DeShawn — memang memiliki hasil kehidupan yang lebih buruk daripada wanita bernama Molly atau pria bernama Jake. Tapi itu bukan kesalahan namanya. Jika dua anak laki-laki kulit hitam, Jake Williams dan DeShawn Williams, dilahirkan di lingkungan yang sama dan dalam lingkungan keluarga dan ekonomi yang sama, mereka kemungkinan akan memiliki hasil kehidupan yang sama. Tetapi jenis orang tua yang menamai putranya Jake tidak cenderung tinggal di lingkungan yang sama atau berbagi keadaan ekonomi dengan tipe orang tua yang menamai putranya DeShawn. Dan itu sebabnya, rata-rata, seorang anak laki-laki bernama Jake akan cenderung untuk mendapatkan lebih banyak uang dan mendapatkan pendidikan lebih dari seorang anak laki-laki bernama DeShawn. DeShawn '


4

Dari nama depan, prediksi wilayah, usia, status imigran generasi pertama. Dari nama belakang Anda dapat memprediksi lokasi geografis dari patronim asli. Untuk nama lengkap, Anda dapat memprediksi status sosial dan ekonomi (Thurston Howell III).


+1 hanya untuk penyebutan pertama di situs karakter Gilligan's Island ini.
rolando2

4

Untuk menambahkan saran lain di sini, salah satu sumber terbesar untuk data keluarga adalah rakit situs silsilah di luar sana. Saya pikir sebagian besar orang barat mungkin terdaftar oleh beberapa anggota keluarga, jauh atau sebaliknya pada beberapa dari mereka dan inklusi semacam itu dilengkapi dengan silsilah keluarga yang biasanya lengkap, lengkap dengan tempat, perincian kelahiran, dll. Sangat informatif.

Jika Anda mencocokkan data itu dengan grafik teman di Facebook, karena orang cenderung menambahkan saudara kandung / sepupu (dan kadang-kadang orang tua / anak-anak), maka gunakan data lokasi dengan peran pemilihan dan direktori, Anda biasanya dapat menentukan orang-orang bahkan dengan nama umum, dan dapatkan data dalam jumlah besar yang mengejutkan.


3

Bab terakhir Freakonomics (2005, Steven D. Levitt dan Stephen J. Dubner) memiliki diskusi yang menarik tentang nama-nama, terutama yang berkaitan dengan status dan ras sosial-ekonomi.

Mereka memiliki daftar nama depan yang mungkin berkorelasi dengan analisis nama belakang FB. Mereka juga menggambarkan bagaimana pilihan nama berubah secara diakronis (lintas waktu).

Siapa tahu - nama pilihan orang tua mungkin lebih akurat daripada yang dilaporkan orang tentang sensus.


3

Anda punya banyak saran bagus di atas, jadi saya hanya akan menyebutkan anekdot yang menarik. Seorang siswa musim panas (sekarang seorang ilmuwan komputer terkemuka) di sebuah lab riset perusahaan (yang akan tetap tanpa nama) melihat data dari direktori telepon online perusahaan, dan membangun model prediksi untuk tingkat pembayaran menggunakan karakter n-gram dari nama. Prediktor terkuat adalah bahwa ez_ menunjukkan tingkat upah yang lebih rendah, sebuah penemuan yang saya bayangkan ia tidak terdorong untuk berbicara tentang ...


2

Anda mungkin bisa mengetahuinya:

  1. Profesi dan kemungkinan riwayat pekerjaan, jika seseorang berpartisipasi dalam diskusi profesional apa pun (pekerjaan saat ini biasanya dapat ditemukan dari nama domain dalam email atau tanda tangan, pencarian juga akan mengungkapkan yang sebelumnya)
  2. Kerabat, jika seseorang mempertahankan profil di jejaring sosial.
  3. Lokasi saat ini, setidaknya hingga kota.
  4. Latar belakang etnis, jika seseorang memiliki nama yang berbeda (yaitu, seseorang yang bernama "Lubomir" mungkin terhubung ke salah satu negara Eropa Slavik, dll.).
  5. Tanggal lahir dari jejaring sosial - orang cenderung memberi selamat kepada seseorang pada atau sekitar tanggal kelahirannya, dan jika Anda beruntung, Anda juga mendapatkan tahun ketika seseorang berusia 25, 30, 35 dll. Karena salah satu orang yang mengucapkan selamat mungkin akan menyebutkannya jika bukan orang yang dimaksud.
  6. Latar belakang pendidikan - dari LinkedIn, dll.
  7. Hobi, tim olahraga favorit, dll.
  8. Jika seseorang adalah pecinta hewan peliharaan, dia mungkin akan memiliki semua peliharaannya di jejaring sosial juga.

Btw yang berarti Anda tidak boleh menggunakan apa pun dari daftar di atas untuk kata sandi, pertanyaan rahasia, dll.


Bagaimana dengan orang-orang yang memiliki nama yang sama dengan Anda ... ada sejumlah "Dean Harding" di luar sana, salah satunya bahkan seorang pesepakbola profesional! "DeanHarding" di twitter bukanlah aku, ada ratusan "Dean Harding" di Facebook, dll. ...

Itu tergantung pada kesempatan, tentu saja. Biasanya Anda bisa mengetahui mana yang berdasarkan profesi, lokasi, dll. Meskipun saya melihat kasus di mana ada 3 orang dengan nama lengkap yang sama, dalam profesi yang sama dan tinggal kira-kira di daerah yang sama. Maka tentu saja menjadi lebih sulit :)

2

Darden dan Robinson (1976) berusaha menemukan struktur linguistik yang memandu asosiasi orang tentang nama depan pria. Mereka meminta dua kelompok subjek (siswa sosiologi dan perwira angkatan laut) untuk menilai satu set nama-nama Amerika yang umum di sepanjang perbedaan semantik seperti soft-tough, common-noble, dan urban-rural. Mereka juga meminta penilaian kesamaan antara pasangan nama yang berbeda, dan dengan cara validasi mereka menghubungkan cara dari perbedaan semantik dengan dimensi yang mereka temukan, baik dalam tiga dan empat solusi D, menggunakan prosedur TORSCA MDS.

Para penulis menemukan solusi 3-D mereka secara kasar sesuai dengan trio klasik Osgood tentang aktivasi, evaluasi dan potensi. Dalam empat dimensi, ruang cocok dengan data sedikit lebih baik, dan di sini mereka menafsirkan struktur sebagai tergantung pada "karakter," "kematangan," "kemasyarakatan," dan "kejantanan," meskipun skala ini tampaknya tidak didefinisikan dengan baik seperti saran penulis. Satu temuan mengejutkan yang datang dari penelitian ini adalah, setidaknya untuk dua sampel kecil ini (n = 83 dan 21), tidak ada dimensi yang sesuai dengan perbedaan antara nama yang diberikan dan nama panggilan.

Darden, DK, dan Robinson, IE (1976). Penskalaan multidimensi nama depan pria: Pendekatan sosiolinguistik. Sosiometri, 39 , 4, 422-431.


1

Jumlah informasi yang dapat ditemukan sangat bervariasi, mulai dari ras dan jenis kelamin, hingga semua jenis informasi pribadi. Taruhan terbaik Anda untuk mendapatkan informasi adalah situs jejaring sosial seperti facebook, karena mereka umumnya memberikan lebih banyak informasi daripada database cencus.


1

Ada cukup banyak informasi yang bisa Anda dapatkan tergantung pada sumber yang Anda gunakan. Data sensus jelas. Anda juga dapat memperoleh informasi dari Facebook, MySpace, dan situs jejaring sosial lainnya. Anda juga dapat mencari arsip berita publik untuk menyebutkan nama mereka. Mungkin bahkan situs properti ubclained yang dimiliki beberapa negara bagian.

Jika Anda menginginkan contoh dunia nyata dari apa yang dapat dilakukan, lihat pipl.com


Bisakah Anda memberi tahu kami di mana (di mana pun di dunia) kami dapat menemukan data Sensus dengan nama ?
whuber

1

Anda dapat mencari gelar, SIM, catatan polisi (apakah ini terjemahan yang tepat?). Dengan facebook Anda dapat menemukan informasi tentang hobi, olahraga, musik yang disukai. Anda juga dapat mencari proporsi pengguna media sosial lainnya dengan nama yang diberikan. (Saya akan tertarik dengan hasil ini)



0

Jika Anda mengetahui sesuatu tentang lokasi individu, satu sumber informasi adalah basis data pendaftaran pemilih. Banyak basis data pendaftaran pemilih tersedia (dengan biaya; ada perusahaan yang membelinya dan menyediakan akses permintaan online kepada mereka, dengan biaya). Basis data pendaftaran pemilih mungkin memiliki alamat dan / atau tanggal lahir individu. Informasi itu mungkin memungkinkan Anda untuk mencari individu di database lain.

Namun, ada batasan seberapa banyak ini membantu. Ini mungkin bermanfaat jika Anda mengetahui kota atau kabupaten tempat tinggal orang itu, dan jika nama mereka tidak biasa. Tetapi jika ini adalah nama umum, atau jika Anda tidak tahu di mana mereka tinggal, itu mungkin tidak akan membantu Anda.


0

salah satu sumber terbesar untuk data yang dapat diakses publik termasuk banyak atribut bermanfaat lainnya adalah kantor panitera daerah untuk catatan kepemilikan properti. issu berkaitan dengan menarik semua data bersama-sama ... beberapa negara menyediakan database pusat tetapi yang lain tidak.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.