Apa kriteria pencocokan minimum yang direkomendasikan untuk pencocokan pasien berdasarkan demografi yang andal?


30

Ketika mencocokkan pasien berdasarkan data demografis, adakah rekomendasi tentang bidang apa yang harus cocok dengan pasien untuk menjadi "Pasien yang Sama"?

Saya tahu algoritma akan berbeda untuk implementasi yang berbeda, saya hanya ingin tahu apakah ada praktik terbaik atau rekomendasi di sekitar proses ini.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

dll?


4
Mungkin jawaban untuk pertanyaan ini juga dapat berubah tergantung pada negara tertentu atau bahkan pada pertimbangan etnis dan budaya. Misalnya nama seseorang mungkin bukan pengidentifikasi pasien yang baik untuk penduduk asli Australia (atau harus diberi "berat" yang lebih rendah dalam kasus mereka) karena mereka dapat mengubah nama dari waktu ke waktu. Penduduk asli Australia yang menyandang nama yang sama dengan orang yang sudah meninggal meninggalkannya karena mereka menganggap sangat buruk membawa nama yang sama dengan seseorang yang sudah mati. Hal serupa terjadi dalam budaya lain ketika nama orang mati adalah tabu. tautan

4
Atau contoh lain dari studi yang belum dipublikasikan: pada imigran Filipina ke AS, sepuluh nama keluarga paling umum mencakup sekitar 6% dari semua orang. Dalam imigran Vietnam, mereka menyumbang ~ 60%. Nama-nama adalah pengidentifikasi yang jauh lebih baik di Filipina daripada di Vietnam. Saya pasti akan memposting studi itu setelah tersedia.

Hanya untuk memperjelas: apakah tujuan utama untuk mencocokkan dua set catatan?

Saat mencoba untuk mencocokkan catatan, pastikan untuk membedakan antara kekuatan suatu pertandingan ("Bob" sangat mirip dengan "Bob") versus jumlah kemungkinan pertandingan (ada banyak Bobs). Jika dua catatan memiliki nama yang sama dan tidak ada catatan lain dengan nama itu, itu mungkin orang yang sama bahkan jika alamatnya berbeda. Dengan asumsi Anda memiliki korpus besar, tentu saja.
Jon of All Trades

Jawaban:


20

Ada esai yang luar biasa ini (dalam bahasa Spanyol, maaf) yang ditulis oleh Pablo Pazos, seorang Teknisi CS dari Uruguay yang telah bekerja di IT Layanan Kesehatan sejak tahun 2006 dan telah membuat beberapa kontribusi besar untuk bidang ini, di mana ia menggambarkan algoritma untuk melakukan ini.

Anda dapat menjalankan artikel melalui penerjemah, tetapi intinya adalah bahwa info dasar untuk menentukan identitas seseorang adalah nama dan keluarga mereka (baik dari ayah dan ibu), jenis kelamin, dan tanggal lahir. Yang cukup menarik, ia secara khusus mengecualikan nomor id seperti SSN dari algoritme pencocokan identitasnya, karena "segala jenis pengidentifikasi BUKAN bagian dari identitasnya" (saya kira poin ini bisa diperdebatkan, meskipun). Juga, ia mengecualikan atribut seperti alamat jalan, nomor telepon, dll. Karena mereka tidak benar-benar terkait dengan identitas seseorang, mereka tidak terkait dengan "siapa seseorang sebenarnya".

Selain itu, ia memberikan "bobot" yang berbeda untuk masing-masing atribut sebelumnya, seperti ini:

  • Nama depan: 17,5%
  • Nama tengah: 17.5%
  • Nama keluarga (ayah): 17,5%
  • Nama keluarga (ibu): 17,5%
  • Seks: 10%
  • DOB: 20%

Dengan kecocokan yang ditemukan pada setiap atribut ini, ia menjelaskan metodologi untuk mendapatkan "indeks kecocokan konkordansi" komposit yang memungkinkan perbandingan antara catatan. Juga, kecocokan "parsial" pada atribut nama dimungkinkan dengan menggunakan algoritma seperti jarak Levenshtein .

Baca bagus, IMO. Maaf itu dalam bahasa Spanyol, tapi saya harap saya bisa menyampaikan ide utamanya.


2
ini bagus, terima kasih. +1 juga untuk menyebutkan jarak karena kesalahan ketik cukup umum terutama di komunitas dengan beragam latar belakang budaya seperti yang sering terjadi di Amerika Utara. Yang mengatakan, sebagian besar contoh di mana saya harus melakukan cocok dengan domain dari nilai yang mungkin cukup terbatas. Jadi dalam kasus ini kriteria yang dapat diandalkan (seperti nomor asuransi kesehatan) yang mengembalikan satu hit di database akan mencukupi, jika beberapa entri dikembalikan, saya cenderung bertanya kepada pengguna (jika tersedia) atau menyaring dengan kriteria tambahan.

(... lanjutan) Namun perlu dicatat bahwa kasus-kasus ini berlaku untuk instalasi lokal ESDM ke klinik atau rumah sakit, atau RIS ke departemen radiologi. Dalam hal ini pelanggan terdaftar di klinik atau rumah sakit atau tidak. Namun dalam kasus MPI ini adalah permainan bola yang sepenuhnya baru.

13

Tidak ada algoritma sulap tunggal untuk pencocokan pasien, dan saya ragu akan ada.

Sebagai permulaan, ada varian regional. Seperti yang ditunjukkan MMattoli, apa yang bekerja dengan baik di rumah sakit perkotaan Amerika Serikat mungkin tidak cocok di klinik pedesaan Australia yang merawat orang Aborigin.

Juga, masing-masing situs memiliki pandangan berbeda tentang toleransi kesalahan. Jika Anda hanya cocok ketika Anda benar - benar yakin , Anda akan mendapatkan banyak pertandingan yang terlewat. Ini menyebabkan duplikat catatan pasien, yang menciptakan serangkaian masalah lainnya. Sebagian besar situs akan bersedia menerima cukup yakin , tetapi seberapa yakin cukup yakin? Tanyakan 10 orang dan Anda akan mendapatkan 12 jawaban.

Karenanya, algoritma "terbaik" akan dapat dikonfigurasi, sehingga pelanggan Anda dapat menyetelnya agar sesuai dengan kebutuhan mereka.

Saat mempertimbangkan pertandingan, bidang yang berbeda menawarkan tingkat kepercayaan yang berbeda-beda.

Pengidentifikasi spesifik layanan kesehatan menawarkan kepercayaan diri yang paling besar, karena seluruh tujuan mereka adalah untuk mengidentifikasi secara unik orang tersebut dalam sistem kesehatan. Rumah sakit biasanya bersusah payah untuk memastikan ini tidak terduplikasi.

Contoh:

  • ID Kesehatan Nasional (mis. Nomor UK NHS)
  • Nomor Rekam Medis yang ditetapkan Rumah Sakit.

Pengidentifikasi pasien lain mungkin menawarkan kepercayaan diri yang tinggi, tergantung pada sistem Misalnya, ID Militer mungkin sangat relevan di rumah sakit militer.

Contoh:

  • ID Militer
  • ID Asuransi
  • Nomor Jaminan Sosial (Di AS, Nomor Jaminan Sosial umumnya tidak dianggap sebagai pertandingan berkeyakinan tinggi, karena penipuan asuransi yang merajalela.)

Dengan tidak adanya pengidentifikasi unik, seseorang harus menggunakan informasi demografis. Sangat tidak disarankan untuk mencocokkan pada satu bidang mana saja, tetapi semakin banyak bidang demografis yang cocok, semakin percaya diri pertandingan.

Hal-hal tentang seseorang yang tidak sering berubah baik untuk dicocokkan:

  • Nama
  • Jenis kelamin
  • Tanggal lahir

Tetapi informasi yang lebih lunak dapat dipertimbangkan dalam pertandingan untuk meningkatkan kepercayaan:

  • Alamat
  • Nomor telepon
  • Alamat email

3
SSN juga memiliki beberapa batasan yang sangat ketat, misalnya di Kanada adalah ilegal untuk memintanya kecuali Anda adalah majikan atau bank (mungkin beberapa juga, saya bukan pengacara). Tempat-tempat lain seperti Cina mereka menggunakannya untuk hampir semua hal, bahkan untuk membeli tiket kereta api selama liburan yang padat.

Perubahan nama adalah hal biasa jika Anda wanita. Dan dua orang sering memiliki nama yang sama dan bahkan tinggal di tempat yang sama (ayah dengan nama anak laki-laki setelah dia misalnya).
HLGEM

@HLGEM: Sepenuhnya benar, itulah sebabnya tidak ada bidang demografis tunggal yang harus digunakan untuk pencocokan. Tetapi ketika orang harus menggunakan itu, bidang yang lebih statis (yang terkadang berubah) lebih dapat diandalkan daripada alternatifnya. Itu tidak membuat mereka baik.
Lynn

7

Anda juga perlu memeriksa nama belakang sebelumnya karena ini sering berubah.


+1 "sering" adalah pernyataan yang meremehkan. :) Ini tentu bisa menjadi kasus untuk pasien yang tidak dapat diidentifikasi atau tidak disebutkan namanya, bayi baru lahir, salah identifikasi, dan sebagainya. Nama lebih sulit, namun lebih signifikan, dalam lingkungan dengan banyak transaksi.

4

Terlepas dari kombinasi yang jelas dari tiga berikut yang diberikan dalam pertanyaan Anda

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Saya akan berpikir untuk menambah phone number (Home and/or Cell)daftar. Hari-hari ini sangat umum dan setiap orang akan memiliki nomor unik dan bahkan jika beberapa kali orang mengubah nomor telepon mereka, nomor telepon yang lebih tua diingat oleh kebanyakan orang, sehingga dapat berguna.

Kami menemukan bahwa alamat sering mengalami beberapa ejaan dan berbagai cara render terutama di negara-negara seperti India di mana orang menggunakan bahasa lokal dan perangkat lunak manajemen pasien 'masih' menggunakan bahasa Inggris.


3

Jenis kelamin dalam catatan tampaknya sering berasal dari Nama Depan. Saya telah melihat peningkatan variasi dalam gender untuk orang asing, ketika kita tidak bisa mendapatkan gender dari namanya.

Di Jerman kami memiliki beberapa variasi lebih lanjut dengan nama-nama yang mengandung 'Umlaute' seperti 'äöü', yang kadang-kadang diganti dengan 'ae oe ue'.


1

Pikiranku ada di urutan seperti di bawah ini 1). SSN, Nama belakang, dan 5 karakter pertama dari nama depan 2). SSN, Tanggal Lahir dan 5 karakter pertama dari nama depan 3). SSN, Tanggal Lahir dan nama belakang 4). SSN, Gender, Tanggal Lahir 5). Nama belakang, 5 karakter pertama dari nama depan, kota dan zip


1

Ini adalah masalah yang sangat sulit di AS. Nama tidak unik dan sering berubah selama masa hidup seseorang atau disajikan secara berbeda (misalnya Rob versus Robert), sehingga tidak dapat digunakan untuk mengidentifikasi pasien kecuali dalam hubungannya dengan beberapa informasi yang lebih dapat dipercaya. Jumlah dan penyedia asuransi kesehatan berubah jauh lebih sering dan mungkin sama untuk banyak anggota keluarga. SSN seharusnya unik, tetapi ada penipuan di sekitarnya. Sama dengan nomor perizinan Pengemudi yang tentu saja tidak semua orang akan miliki.

Secara pribadi, saya akan mulai dengan nomor polis asuransi dan tanggal lahir dan kombinasi nama, kemudian ssn dan tanggal lahir dan kombinasi nama. Saya akan memeriksa alamat dan telepon untuk memberi saya jaminan tambahan ketika mereka cocok tetapi tidak banyak berat jika mereka tidak. Selain itu saya akan menggunakan golongan darah sebagai faktor penentu jika diketahui (dan kita semua tahu vampir rumah sakit akan mengambil sampel darah) karena itu tidak berubah. Pencocokan nama harus cocok dengan fuzzy karena masalah nama pembalasan. Hal-hal lain umumnya harus mencari kecocokan yang tepat terlebih dahulu kecocokan themna fuzzy jika nama kepercayaannya benar-benar tinggi (bisa jadi salah ketik memasuki SSN).

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.