Saya sudah memiliki beberapa juta baris di basis data saya. Saya tidak tahu tentang tipe data PostgreSQL UUID ketika saya merancang skema saya.
Salah satu tabel memiliki 16 juta baris (sekitar 3,5 juta hingga 4 juta catatan per pecahan), tumbuh sekitar 500 ribu rekor per hari. Saya masih memiliki kemewahan untuk menurunkan sistem produksi selama beberapa jam jika diperlukan. Saya tidak akan memiliki kemewahan ini dalam satu atau dua minggu.
Pertanyaan saya adalah, apakah akan bermanfaat untuk melakukannya? Saya bertanya-tanya tentang kinerja BERGABUNG, penggunaan ruang disk (dump gzip'd penuh adalah 1,25 GiB), hal-hal semacam itu.
Skema tabel adalah:
# \d twitter_interactions
Table "public.twitter_interactions"
Column | Type | Modifiers
-------------------------+-----------------------------+-----------
interaction_id | character(36) | not null
status_text | character varying(1024) | not null
screen_name | character varying(40) | not null
twitter_user_id | bigint |
replying_to_screen_name | character varying(40) |
source | character varying(240) | not null
tweet_id | bigint | not null
created_at | timestamp without time zone | not null
Indexes:
"twitter_interactions_pkey" PRIMARY KEY, btree (interaction_id)
"twitter_interactions_tweet_id_key" UNIQUE, btree (tweet_id)
"index_twitter_interactions_on_created_at" btree (created_at)
"index_twitter_interactions_on_screen_name" btree (screen_name)
Triggers:
insert_twitter_interactions_trigger BEFORE INSERT ON twitter_interactions FOR EACH ROW EXECUTE PROCEDURE twitter_interactions_insert_trigger()
Number of child tables: 9 (Use \d+ to list them.)