Jika Anda siap untuk menggunakan alat baris perintah Linux standar seperti wc
dan grep
kemudian saya pikir prosesor PGN gratis saya, ekstrak pgn , akan melakukan banyak pra-pemrosesan yang diperlukan untuk menghitung game di setiap kategori. Di bawah ini adalah skrip bash dasar yang saya kumpulkan sebagai bukti konsep. Diasumsikan file game Anda disebut inputfile.pgn
- sesuaikan seperlunya, atau berikan sebagai argumen baris perintah:
#!/bin/bash
# Output stats on castling.
src=inputfile.pgn
# Pre-process the games to allow textual analysis.
pgn-extract -C -V -N --notags --nochecks --linelength 10000 -s -o stripped.pgn ${src}
# Castling by white: detect a preceding move number.
grep '\. O-O ' stripped.pgn > Wkingside.pgn
grep '\. O-O-O ' stripped.pgn > Wqueenside.pgn
# Castling by black: detect no preceding move number.
grep '[^.] O-O ' stripped.pgn > Bkingside.pgn
grep '[^.] O-O-O ' stripped.pgn > Bqueenside.pgn
# Find games in which no castling occurred.
grep -v ' O-O ' stripped.pgn | grep -v ' O-O-O ' | grep -v '^$' > nocastle.pgn
# Output the FEN of the final position to include castling rights and
# look for the presence of rights.
pgn-extract -C -V -N --notags --nomovenumbers --linelength 10000 -s nocastle.pgn --dropply -1 -F | grep ' [wb] [KkQq]' > rights.txt
# Output the results - assumes valid Result tags in the source.
echo 'Number of games: ' `grep '^\[Result ' ${src} | wc -l`
echo 'W Kingside: ' `cat Wkingside.pgn | wc -l`
echo 'W Queenside: ' `cat Wqueenside.pgn | wc -l`
echo 'B Kingside: ' `cat Bkingside.pgn | wc -l`
echo 'B Queenside: ' `cat Bqueenside.pgn | wc -l`
echo 'Neither: ' `cat nocastle.pgn | wc -l`
echo 'Rights retained: ' `cat rights.txt | wc -l`
Saya mencoba skrip pada database KingBase (Apr 2019) dan, setelah menghapus game yang rusak dan duplikatnya, dapatkan statistik berikut:
Number of games: 2072354
W Kingside: 1633762
W Queenside: 246158
B Kingside: 1670870
B Queenside: 128124
Neither: 69776
Rights retained: 24280
Angka 'keduanya' adalah sekitar 3,4% sementara angka 'hak yang dipertahankan' adalah sekitar 1,2%. Jika game dengan 20 ply atau lebih sedikit dihapus maka angka 'tidak' berkurang menjadi sekitar 2,9% dan angka 'hak dipertahankan' menjadi sekitar 0,7%.