Seorang klien ingin kami menyaring mesin-mesin kerja untuk pornografi. Apa itu mungkin?


30

Seorang klien lama telah meminta kami untuk membantu menyaring mesin kerja mereka untuk pornografi. Mereka khawatir tentang tanggung jawab jika bahan sensitif ditemukan. Kekhawatiran utama mereka (untuk alasan yang jelas) adalah file video, audio, dan gambar. Jika memungkinkan, mereka juga ingin memindai dokumen berbasis teks untuk konten yang tidak pantas. Mereka memiliki hierarki konten tidak-untuk-pekerjaan dimulai dengan terang-terangan ilegal (saya tidak harus mencantumkan detail), pindah ke hal yang jelas-jelas menyinggung, dan juga termasuk hal-hal yang mungkin menyinggung beberapa orang - pikirkan iklan pakaian dalam, kartu lelucon yang menampilkan celah pantat, dan apa pun yang terkait dengan Howie Mandel.

Pertanyaan saya adalah:

  • Apakah ini etis? Saya pikir itu karena setiap karyawan secara hukum setuju bahwa mesin kerja mereka milik perusahaan dan harus dicari. Pemutaran tidak akan terjadi pada mesin pribadi yang dibawa ke kantor.
  • Apakah itu layak? Saya telah melakukan banyak pemrosesan gambar / pengindeksan tetapi ini tampak seperti dunia kompleksitas yang sama sekali baru.
  • Adakah referensi teknik sukses untuk menemukan porno?
  • Apakah pantas bagi saya untuk mengarsipkan hasilnya ketika sesuatu ditemukan?

29
Pornografi siapa yang akan digunakan untuk menguji ini?
ChaosPandion

12
Saya ingin menjadi penguji untuk proyek ini !!
Mayank

56
Buat skrip yang memposting semua gambar yang ditemukannya di 4chan; jika anggota lain menjawab "MOAR!", Anda tahu itu porno. Jika skrip diblokir, mungkin CP.
user281377

8
Anda harus berpikir sudah ada sekian juta produk komersial yang tersedia untuk ini.
GrandmasterB

34
Pertanyaan jujur: apakah ini sebenarnya masalah yang mungkin terjadi? Porno di komputer kantor? Maksud saya ... siapa yang melakukan itu? Selanjutnya, bagaimana mereka bermaksud menangani konten porno yang tidak disengaja? GF saya sebenarnya memiliki virus di PC pekerjaannya baru-baru ini yang mengarahkan permintaan Google sewenang-wenang ke situs porno dan sering kali saya tidak sengaja akan mengetik "python.com" [NSFW!] Alih-alih "python.org" ... Terlebih lagi, jika ini sebenarnya masalah, saya pikir ini mengkhianati kepercayaan yang lebih mendasar dan / atau masalah profesionalitas di perusahaan. Alamat itu alih-alih mencari komputer.
Konrad Rudolph

Jawaban:


125

Anda dapat melakukan ini dengan 90% Headology , 10% perangkat lunak.

Pertama, diam-diam memindai komputer karyawan, buat basis data file dan ukuran untuk setiap karyawan.

Kemudian membocorkan memo bahwa semua PC akan dipindai untuk konten yang dipertanyakan, yaitu bos memiliki program seperti Shazam yang dapat mengidentifikasi porno dll.

Kemudian beberapa hari kemudian, pindai komputer untuk mencari file dan ukuran lagi. Lihat file yang terhapus, apakah file film atau gambar? Maka mereka adalah karyawan yang harus Anda perhatikan.

Secara rutin memindai karyawan PC itu untuk gambar dan film, dan secara manual memeriksa mereka untuk konten yang dipertanyakan.


9
Dan +1 untuk menyebutkan headologi.
TRiG

5
@ Biner: pendekatan dua tahap ini memang mengesankan.
Matthieu M.

2
+1dari saya untuk referensi ke Nenek!
sbi

2
@ Anonim Saat Anda melakukannya. Buat GUI dalam Visual Basic untuk melihat apakah Anda dapat melacak alamat IP. youtube.com/watch?v=hkDD03yeLnU . Namun serius, ini adalah cara yang luar biasa dari teknik untuk memakai beberapa skrip acara TV tingkat kedua.
Evan Plaice

2
ide yang sangat jahat! love it ♥
Chani

75

Ini adalah tugas jaringan saraf yang jelas. Pertama, Anda membutuhkan serangkaian gambar pelatihan besar yang dipilih oleh para ahli di perusahaan Anda .....

Solusi yang lebih efektif adalah dengan mengumumkan bahwa Anda akan memeriksa mesin Everyones untuk porn NEXT minggu / bulan / apa pun, lalu menulis aplikasi sederhana yang hanya menggunakan disk. Saya jamin mesinnya sudah dibersihkan.


ps - Beberapa poin 'serius' - Anda sebenarnya tidak ingin menemukan apa pun.

Jika Anda menemukan beberapa gambar di cache peramban maka mungkin mereka menabrak tautan yang buruk atau sembulan yang cerdik - ingatkah guru itu menembakkan whitehouse.com? Jika Anda memecat / mendisiplinkan mereka untuk ini maka akan ada reaksi balik dari pekerja / serikat pekerja. Bagaimana perusahaan Anda bekerja jika setiap klik harus diserahkan ke legal untuk persetujuan sebelum pekerja Anda meneliti pertanyaan atau memeriksa harga online?

Jika Anda menemukan setumpukan porno di mesin, bagaimana Anda akan membuktikannya diletakkan di sana oleh karyawan itu? Apakah Anda memiliki jenis sistem keamanan dan audit yang akan berdiri di pengadilan? Apakah Anda menggunakan (atau bahkan tahu) OS di mana admin sistem tidak bisa meletakkannya di sana dan membuatnya terlihat seperti file pengguna?

Plus dalam pengalaman saya, lokasi paling umum untuk simpanan porno ada di laptop CxO dan VP senior.

Jauh lebih baik mengatur file-file untuk menghilang begitu saja.


+1 - walaupun saya akan menggabungkan ini dengan cek manusia berbasis%. Mungkin secara acak memilih 0,1% dari stasiun kerja untuk inspeksi nyata.
Drew

@nikie: Martin membuat lelucon tentang set pelatihan.
Andrew Grimm

Ini adalah solusi yang sangat lucu, dan yang akurat :)
crosenblum

10
Tunggu. Bagaimana Anda tahu saya menaruh simpanan porno saya di laptop CEO?
Jaap

1
Saya akan terkejut jika orang benar - benar menghapus semua porno mereka ketika dihadapkan dengan prospek mesin mereka akan dipindai. Programmer mungkin akan melakukannya, tetapi IME orang lain benar-benar, erm, "aneh" mengenai hal-hal seperti itu. Namun, Anda dapat menggabungkan ini dengan ide Binary dan melihat lebih dekat pada mesin-mesin di mana banyak MB terhapus. Namun demikian, +1dari saya untuk pengamatan bahwa Anda tidak benar-benar ingin menemukan sesuatu.
sbi

8

Pendekatan pengendalian ini tentu saja menyakitkan bagi karyawan dan karyawan TI. Begitu sesuatu masuk ke dalam mesin karyawan, tidak ada cara pasti untuk mendeteksinya. Anda harus menghentikannya masuk ke dalam mesin di tempat pertama.
Praktik yang paling dikenal untuk ini jelas mengendalikan situs / domain yang dapat dikunjungi. Daftar tersebut harus tersedia di suatu tempat di internet. Selain ini, Anda juga dapat melacak jumlah gambar, video yang telah diunduh karyawan dan dari mana asalnya.
Ada kemungkinan bahwa materi dapat berasal dari selain web, seperti dari hard drive eksternal. Mungkin ada sebulan sekali pemindaian acak sistem di mana Anda dapat secara acak memilih beberapa video dan gambar dan memeriksanya secara manual. Tidak yakin bagaimana itu bisa dilakukan. Tetapi mengotomatisasi memeriksa gambar dan video tentu saja di luar jangkauan dan tentu saja akan salah.
Sebenarnya saya tidak terlalu banyak dengan gagasan untuk membatasi karyawan dari melakukan hal-hal pribadi. Anda harus mempercayai karyawan Anda untuk ini. Karyawan Anda harus cukup sibuk di kantor sehingga mereka tidak punya waktu untuk ini. Semakin banyak kekhawatiran adalah apakah karyawan tidak melakukan pekerjaannya dengan benar? Atau telah menginstal beberapa perangkat lunak yang diretas atau diretas?


1
Saya setuju bahwa Pengembang - dan orang-orang kreatif lainnya - seharusnya tidak memiliki mesin yang dikunci. Namun - dan percayalah ketika saya mengatakan ini - ketika Anda memiliki 200+ karyawan yang memproses dokumen alur kerja Anda tidak ingin memberi mereka apa pun yang dapat mengalihkan perhatian mereka, dan termasuk browser. Ya, 90% orang bekerja keras dan tidak akan terganggu, tetapi itu berarti Anda akan memiliki 20+ gobshite menarik kencing dan menjadi tidak produktif.
Binary Worrier

6
10% itu akan tetap tidak produktif. Jika tidak menjelajahi situs web, bermain game, membaca, bermain-main, duduk-duduk bosan, dll.).
jwenting

2
Orang bisa menyelesaikan pekerjaannya atau tidak. Mereka lebih mudah dikenali ketika Anda memiliki 200 melakukan tugas serupa yang dapat diukur.
JeffO

2
Di AS, ada masalah hukum yang terkait dengan porno di komputer perusahaan, dan ada masalah hukum yang sangat serius terkait dengan pornografi anak. Paling aman memiliki kebijakan no-pornografi dan mengambil langkah-langkah untuk mencegahnya.
David Thornley

7

Ada sejumlah produk di pasar yang melakukan "pemfilteran konten" dalam berbagai bentuk. (Pencarian Google pada beberapa istilah yang jelas memunculkan beberapa kandidat yang jelas.) Ini mungkin ide yang lebih baik untuk menggunakan salah satu produk ini daripada membangun banyak perangkat lunak pemindaian / penyaringan dari awal. Pilihan lain adalah hanya menonton di perbatasan; misalnya dengan memonitor email eksternal dan lalu lintas web. Sekali lagi ada produk yang melakukan hal semacam ini.

Meskipun tidak ada keraguan bahwa etis bagi perusahaan untuk memindai komputernya untuk "hal-hal buruk", ini tidak berarti bahwa tidak ada masalah.

Masalah pertama:

  • Menentukan apa yang ada dan apa yang bukan "konten yang tidak menyenangkan" adalah subyektif.
  • Perangkat lunak untuk mendeteksi gambar, video yang berisi (katakanlah) "penggambaran tubuh telanjang" adalah (AFAIK) kemungkinan tidak dapat diandalkan, menghasilkan positif palsu dan negatif palsu.

Jadi ... ini berarti seseorang dalam organisasi pelanggan Anda perlu meninjau "hit". Itu membutuhkan uang.

Masalah kedua: Mungkin ada penjelasan yang tidak bersalah. File itu bisa saja diunduh secara tidak sengaja, atau bisa saja ditanam oleh rekan kerja pendendam. Jika ada penjelasan yang tidak bersalah, organisasi pelanggan harus berhati-hati dengan apa yang mereka lakukan / katakan. (Oke ini bukan masalah Anda , tetapi Anda mungkin mengatasi beberapa serangan balik itu.)

Masalah ketiga: Tanpa ragu bahwa perusahaan memiliki hak untuk memantau materi yang tidak menyenangkan, banyak karyawan akan merasa ini tidak menyenangkan. Dan jika mereka terlalu jauh, ini akan berdampak pada semangat kerja karyawan. Beberapa karyawan akan "berjalan". Yang lain mungkin mengambil tindakan protes ... misalnya dengan mencoba membuat banyak positif palsu. (Sekali lagi, bukan masalah Anda , tapi ...)

Masalah keempat: Orang-orang dapat menyembunyikan materi yang tidak menyenangkan dengan mengenkripsinya, dengan meletakkannya di media portabel atau yang dapat dilepas, dll. Orang-orang dapat memalsukan metadata agar terlihat seperti orang lain yang bertanggung jawab.


1
OP mengatakan ini untuk masalah pertanggungjawaban, yang masuk akal di AS. Itu berarti mengeluarkan barang dari komputer, tidak harus menyalahkan orang.
David Thornley

Saya akan mengatakan itu lebih dari itu. Pertimbangkan ujung daftar dari konten "tidak untuk bekerja" dalam pertanyaan. Sepertinya seseorang memiliki "agenda" ...
Stephen C

@ David: SELALU tentang menyalahkan orang. Jika Anda memiliki masalah tanggung jawab potensial, menemukan seseorang untuk disalahkan ("orang ini bertindak melanggar kebijakan perusahaan, dan kami dapat membuktikannya, jadi secara pribadi bertanggung jawab daripada kami sebagai perusahaan") menjadi cara standar kerja. Sebenarnya itulah yang dilakukan sebagian besar orang dalam posisi tanggung jawab di banyak perusahaan, menghabiskan waktu dengan berusaha mencari orang untuk disalahkan atas kesalahan apa pun yang mungkin terjadi dan memastikan tidak ada yang menyalahkan mereka atas masalah apa pun yang mereka alami. di.
jwenting

6

Tentang aspek hukum, di Prancis:

Bos memiliki komputer dan koneksi internet: Dia dapat melakukan apa pun yang diinginkannya.

TETAPI, privasi karyawan tidak dapat dilanggar. Jika direktori di komputer diberi label PERSONAL, bos tidak diizinkan untuk memindai itu.

Satu-satunya cara untuk memintasnya adalah dengan mendapatkan elemen bukti bahwa karyawan menyimpan materi ilegal dan meminta pengadilan meminta pemindaian komputer (Perhatikan bahwa pornografi tidak ilegal di Prancis.)


Kecuali sejauh materi yang dilindungi hak cipta, semua dapat dianggap sebagai pencurian.
TRiG

6
Di Prancis, ada gagasan pengecualian salinan pribadi: Anda tidak diperbolehkan menyalin materi berhak cipta, tetapi pemegang hak cipta tidak dapat mengklaim apa pun jika salinan Anda digunakan secara pribadi.
mouviciel

Saya ingin tinggal di Prancis ... kecuali saya tidak bisa berbahasa Prancis!
Tipe Anonim

5

Jika karyawan setuju bahwa mesin kerja mereka milik perusahaan dan harus dicari, maka ya, ini legal. Sebagai bukti, arsip file kemungkinan besar akan diperlukan.

Adapun cara benar-benar menemukan materi. Anda bisa:

  1. Pertama dan terutama, pindai nama file untuk sekumpulan kata tertentu (porno, lesbian, dll.)
  2. Pindai dokumen teks untuk kumpulan kata yang sama
  3. Untuk gambar, Anda dapat menemukan warna rata-rata dari gambar, dan jika warna itu kebetulan berada dalam kisaran yang sebagian besar akan disebut sebagai 'daging' berwarna, maka benderai gambar (seseorang yang memeriksa dua kali gambar yang ditandai ini kemungkinan besar akan diperlukan) ). Tidak ingin melaporkan seseorang untuk gambar yang akhirnya menjadi foto keluarga dari pantai.

Jika Anda memindai file saat mereka memasuki komputer (mis. Program dimuat pada setiap mesin kerja dan mencatat kasus yang ditandai ke database pusat), maka saya tidak berpikir itu akan terlalu mencolok (selain dari ketidakpercayaan yang mencolok terhadap majikan jelas memiliki untuk karyawan mereka).

Dengan file video, saya tidak yakin 100%. Mungkin pendekatan yang mirip dengan pemindaian gambar (pilih frame acak dan pindai untuk tingkat warna 'daging' tertentu).

Memindai file audio sepertinya akan masuk ke pengenalan suara, yang merupakan keseluruhan dari cacing. Memindai nama file, bagaimanapun, akan mudah dan dapat dilakukan seperti pada dokumen, gambar, dan video.


Ya, saya berpikir seperti itu. Nada daging keras dengan semua varietas. Belum lagi tembakan besar kepala seseorang (seperti gravatar saya) kemungkinan akan memicu peringatan rasio daging dan non-daging. Awal yang luar biasa.
Scant Roger

terlalu banyak risiko positif palsu (sebagian bergantung pada bisnis yang terlibat).
jwenting

Ada ruang warna di mana sebagian besar warna kulit manusia jatuh dalam kisaran yang diberikan. YCbCr jika saya ingat dengan benar. Potong gambar menjadi blok dan jika di sebagian besar blok nilai piksel rata-rata berada dalam kisaran, beri tanda flag sebagai foto "skin".
Vitor Py

Ada masalah lain. Orang yang ditugaskan memeriksa video mungkin akan menuntut Anda. Saya tentu tidak ingin melakukan itu. (Tidak semua porno sesuai selera semua orang.)
Christopher Mahan

The Green Dam (ya, dari pemerintah kakak di timur) yang konon menggunakan OpenCV untuk kemampuan deteksi wajah. Ini masih akan menghasilkan banyak kesalahan positif, bahkan ketika dikombinasikan dengan deteksi warna kulit.
rwong

4

Seperti yang dikatakan @Ryan, analisis gambar dapat fokus pada analisis warna.

Kemungkinan? Kakak perempuan saya bekerja di daerah pemerintah di mana mereka mendapatkan beberapa bentuk audit setiap tahun, dan sekali itu untuk pornografi. Dia (ahli geofisika) memiliki beberapa kesalahan positif (batu merah muda).


4

Ada, penelitian terbaru yang signifikan dalam deteksi pornografi menggunakan metode klasifikasi konvensional. Contoh tersedia di sini , dan di sini .


3
  • Apakah ini etis?

Tergantung pada implementasi dan harapan yang wajar dari karyawan. Misalnya, jika perangkat lunak Anda memindai mesin apa pun yang terhubung ke jaringan, maka ada persyaratan tambahan yang diperlukan infra untuk mencegah mesin tidak terhubung dari penyisipan. (Mungkin itu harus jelas, tetapi sering diabaikan pada jaringan yang pernah saya lihat.)

  • Apakah itu layak? Saya telah melakukan banyak pemrosesan gambar / pengindeksan tetapi ini tampak seperti dunia kompleksitas yang sama sekali baru.

Apakah layak untuk melakukan tes narkoba setiap karyawan? Mungkin begitu, tapi saya mempertanyakan nilainya. Saya akan mengacaknya. Biarkan karyawan tahu mesin mereka dapat dipindai untuk konten yang tidak pantas kapan saja.

  • Adakah referensi teknik sukses untuk menemukan porno?

Saya tidak menyentuh yang ini. Saya tidak berpikir saya bisa menjaga selera humor saya. Tapi hati-hati dengan Masalah Scunthorpe saat mencari teks.

  • Apakah pantas bagi saya untuk mengarsipkan hasilnya ketika sesuatu ditemukan?

Yang ini paling mengkhawatirkan saya, dan saya akan bertanya kepada pengacara. Saya menduga jika Anda menemukan konten ilegal, secara teknis Anda secara hukum berkewajiban untuk mengungkapkannya. Itu buruk, terutama jika pengguna tidak terkena kesalahannya sendiri. Anda (klien) akan memerlukan nasihat hukum nyata tentang cara menangani hal ini. Libatkan SDM dan pengacara.


2

Dari sudut pandang teknis murni: Ini terdengar seperti masalah pengenalan kategori objek. Saya tidak pernah melakukan hal seperti itu, tetapi dari apa yang saya baca, sistem pengenalan kategori canggih bekerja seperti ini:

  • Pertama, Anda mencari sejumlah besar poin minat (misalnya menggunakan Harris Corner Detector, titik ekstrem filter LoG / DoG dalam ruang skala; beberapa penulis bahkan menyarankan untuk memilih titik acak)
  • Kemudian Anda menerapkan transformasi fitur ke setiap titik (sesuatu seperti SIFT, SURF, GLOH atau banyak lainnya)
  • Gabungkan semua fitur yang Anda temukan ke dalam histogram (Bag-Of-Features)
  • Gunakan algoritma pembelajaran mesin standar (seperti mesin vektor dukungan) untuk mempelajari perbedaan antara kategori objek menggunakan sejumlah besar gambar pelatihan.

2

Sistem operasi komputer semua orang mungkin diinstal dari disk image.

  1. mulai dengan disk image dan dapatkan daftar file yang mungkin tidak perlu Anda pindai.
  2. dapatkan daftar semua file lain di setiap PC.
  3. tarik file aktual dari 10-20 mesin acak dan gunakan sebagai test bed
  4. mencari item-item dalam kata-kata yang tidak senonoh dan kata-kata yang dipertanyakan (keren, kendi, 'tidak legal', bercanda, dll)
  5. Lihat video - harus ada yang punya video sama sekali?
  6. Lihat foto
  7. File video atau gambar yang dipertanyakan dapat digunakan untuk mencari di komputer lain

Dibutuhkan satu atau dua karyawan untuk ditangkap sebelum ada orang yang meletakkan apa pun di komputer kerja mereka.

Bebankan sejumlah uang yang tidak senonoh untuk layanan ini. Saya akan Zappos tidak akan pernah melakukan ini kepada karyawan mereka.


2

Dengan asumsi Anda adalah admin domain di jaringan.

  1. C $ ke setiap mesin desktop pengguna.
  2. Salin file porno ke dalam bagian pribadi pribadi.
  3. Hapus dari lokasi asli.
  4. Buat popcorn.
  5. Lengkapi analisis terperinci dari semua "bukti".

1

Saya hanya ingin berkomentar, tetapi hanya memiliki 1 perwakilan, jadi saya tidak bisa.

Dalam kasus Gravatar, Anda bisa menambahkan fungsi untuk menyaring dari daftar situs bersih di lokasi cache internet. IE Gravatar dan situs lain tempat Anda tidak ingin hasil positif palsu. Anda juga dapat memfilter hal-hal seperti wallpaper desktop. Jika mereka menampilkan porno di desktop Anda akan berpikir orang akan melihat di luar audit Anda.


1

Hal-hal semacam itu tidak pernah bisa diandalkan. Anda dapat menggunakan daftar blokir untuk memblokir domain baik atas nama atau dimasukkan pada beberapa daftar (praktik umum). Tetapi daftar itu tidak pernah lengkap, dan pemblokiran nama berdasarkan kriteria dapat menyebabkan banyak kesalahan positif.

Anda dapat memblokir kata-kata yang muncul di teks situs, tetapi sekali lagi ini dapat mengarah ke positif palsu (dan menjadi sangat lambat karena Anda perlu mengurai setiap bit data yang melewati jaringan Anda untuk mendeteksi "bit nakal").

Anda dapat memblokir gambar (dan mungkin situs yang memuatnya) yang menunjukkan lebih dari persentase tertentu dari skintones. Tetapi sekali lagi itu mengarah pada banyak kesalahan positif. Sebuah departemen medis universitas yang memblokir ensiklopedia medis dengan gambar anggota badan dan dada yang menunjukkan luka dan kondisi kulit adalah contoh yang terkenal. Dan tentu saja itu akan rasis karena hanya akan memblokir skintones tertentu. Jika Anda memblokir warna yang cocok dengan kulit Kaukasia, selalu ada porno menggunakan aktor hitam misalnya.

Terbaik, percayakan saja kepada karyawan Anda, dan miliki kebijakan saat kepercayaan itu rusak.


server proxy pribadi, partisi tersembunyi terenkripsi, mesin virtual. Selalu ada cara untuk menyembunyikan barang. Tentu saja, ada smartphone android dengan 3g. Terakhir saya memeriksa tidak ada cara bagi majikan untuk menghentikan karyawan mereka menonton apa pun yang mereka inginkan di ponsel mereka sendiri dengan bandwidth mereka sendiri.
Christopher Mahan

itu sebabnya cara teknis tidak berguna, tentu tanpa kebijakan. Jika orang tahu apa yang diizinkan dan apa yang tidak (dan saya tidak bisa memikirkan orang berpendidikan yang akan menggunakan mesin kerja untuk pornografi, bahkan tanpa kebijakan seperti itu, tetapi itu masalah lain) sebagian besar akan mematuhinya. Yang tidak cepat atau lambat akan ketahuan apakah ada cara teknis di tempat atau tidak (kemungkinan besar seseorang akan melihat sesuatu di layar mereka yang tidak seharusnya mereka lihat saat berjalan melewatinya).
jwenting

1

Saya tidak tahu, harus ada jawaban tengah, yang tidak invasif, tetapi menyelesaikan masalah sebenarnya, KEWAJIBAN.

Mintalah mereka menandatangani surat pernyataan, yang membebaskan perusahaan dari segala kewajiban untuk hal-hal ilegal yang ditemukan di komputer kerja, yang tidak terkait dengan pekerjaan.


Saya tidak berpikir pengabaian akan berhasil di AS. Saya tidak tahu tentang negara lain.
David Thornley

Mengapa itu tidak berhasil? Jika pengguna memiliki kemampuan untuk mengunduh konten, menginstal perangkat lunak, maka mereka secara alami memikul tanggung jawab untuk itu.
crosenblum

Dan, jika perusahaan memiliki kemampuan untuk menyaring porno, yang umumnya dianggap, dan tidak, itu sebagian tanggung jawab perusahaan.
David Thornley

tidak di mana-mana. Di beberapa negara perusahaan bertanggung jawab atas apa pun yang terjadi dengan peralatan apa pun yang mereka miliki, terlepas dari apakah karyawan menggunakannya untuk tujuan yang dimaksudkan atau tidak. Hal ini berlaku sampai batas tertentu di AS juga, pada kenyataannya ada upaya untuk menuntut perusahaan karena menggunakan produk mereka secara ilegal setelah produk-produk tersebut dijual secara legal (lihat misalnya tuntutan hukum yang terus-menerus terhadap produsen senjata api untuk pertanggungjawaban ketika produk mereka digunakan dalam kejahatan, tuntutan hukum yang untungnya biasanya dibuang tetapi sayangnya tidak selalu).
jwenting


1

Analisis gambar dan konten untuk menentukan perbedaan antara foto yang penuh selera seseorang, foto baju renang, foto telanjang, penggambaran pornografi ... sejauh yang saya tahu tidak ada yang cukup canggih untuk dilakukan dalam perangkat lunak saja.

Untungnya crowdsourcing harus bermanfaat di sini, seperti yang disarankan @ammoQ dalam komentar. Namun saya tidak percaya anggota 4chan atau forum lain akan menghargai sejumlah besar gambar non- pornografi, seperti grafik web umum untuk tombol, bingkai, iklan, dll yang diposting.

Rekomendasi saya adalah untuk melihat solusi crowdsourcing yang ada, seperti Amazon Mechanical Turk . (Namun ketentuan layanan mungkin secara eksplisit melarang keterlibatan konten pornografi, jadi maklum Anda mungkin harus menemukan solusi lain atau menggulirkan konten Anda sendiri.)

Agar crowdsourcing layak, perangkat lunak Anda harus siap melakukan beberapa atau semua hal berikut:

  • Simpan informasi yang menautkan konten dengan komputer asalnya
  • Identifikasi duplikat yang tepat di seluruh inventaris dan hapus (tetapi informasi asal tetap dipertahankan)
  • Turunkan gambar ke beberapa dimensi, mungkin 320x200, yang cukup untuk mengidentifikasi konten gambar tanpa mempertahankan detail yang tidak perlu dan membuang ruang penyimpanan / bandwidth
  • Buat gambar diam dari konten video pada interval tertentu dan terapkan aturan downsampling yang sama

Terakhir, basis data gambar yang diperkecil yang mewakili konten gambar dan video asli diperiksa oleh pengguna (atau tim yang ditunjuk jika Anda memiliki sumber daya) sesuai dengan kode etik perusahaan Anda. Program atau antarmuka mungkin menampilkan satu gambar pada satu waktu, atau layar thumbnail - apa pun yang Anda anggap terbaik untuk mendapatkan informasi yang akurat.

Identitas komputer dari mana gambar berasal harus benar-benar rahasia dan tidak diketahui oleh orang yang mengevaluasi data. Selain itu harus diacak dan setiap gambar mungkin diperiksa lebih dari satu kali untuk menghapus bias.

Teknik yang sama dapat digunakan untuk teks, tetapi pertama konten dapat dicetak oleh peringkat kata kunci yang menghapus sebagian besar teks dari tinjauan crowdsource. Mengklasifikasikan dokumen yang panjang tentu saja akan lebih memakan waktu daripada mengklasifikasikan gambar.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.