Upravené datové sady

V rámci dat jsou publikována nejen nově rekonstruovaná data, ale také návazné již publikované datové řady oficiální statistiky (začínající nejčastěji v roce 1920), čímž vzniká datový podklad, obsahující materiál pro analýzy od roku 1870 do současnosti. Publikované základní datové sady jsou následující:

  1. Zemřelí v členění na elementární soubory DES a HES od roku 1870 do současnoti
  2. Koncové stavy obyvatel v období 1870–1936 a 1945 do současnosti
  3. Střední stavy obyvatel od roku 1870 do současnosti
  4. Pravděpodobnosti úmrtí pro kohorty narozené v letech 1820–1922

1.         Zemřelí v členění na elementární soubory DES a HES od roku 1870

Počty událostí jsou tříděny do elementárních souborů pro všechny kalendářní roky od roku 1870. Proti zdrojovým datům jsou na DES a HES rozděleny i události v letech 1870–1894 a pro období 1870–1918 jsou mezi ostatní věkové skupiny rozpočítány i počty událostí v neznámých věcích. Otevřené věkové intervaly byly sjednoceny na 99+ nebo 100+ let. Od roku 1919 jsou publikovaná data z původních pramenných děl (viz výčet Mazoucha a Hulíkové Tesárkové, 2018) bez úprav.

2.        Koncové stavy obyvatel v období 1870–1936 a 1945 do současnosti

Stavy obyvatel k 31. 12. jednotlivých kalendářních let lze rozdělit do 4 období. V období 1870–1920 bylo využito jednotlivých sčítání lidu a koncové stavy pro intercenzální období byly dopočteny. Pro období 1921–1936 bylo využito informace o středních stavech a koncové stavy byly vypočteny jako průměry ze dvou sousedních středních stavů (po rozdělení neznámých věků do ostatních věkových skupin). Pro období 1937–1944 nejsou koncové stavy obyvatel rekonstruovány a od roku 1945 do současnosti jsou data k dispozici z původních pramenných děl bez dalších úprav. Údaje za všechny sledované roky končí otevřeným věkovým intervalem 99+ nebo 100+ let.

3.         Střední stavy obyvatelstva od roku 1870

Stavy obyvatel k 30. 6. (či k 1. 7.) za jednotlivé kalendářní roky jsou pro období 1870–1920 spočteny z dopočtených koncových stavů, jako průměry sousedních hodnot. Od roku 1921 jsou data k dispozici z původních pramenných děl bez dalších úprav. Všechny roky končí otevřeným věkovým intervalem 99+ nebo 100+ let. Pro období 1938–1944 jsou data spočtena zpětnou projekcí od roku 1945 (viz poznámku v příslušném původním datovém zdroji – pramenném díle).

4.         Pravděpodobnosti úmrtí pro kohorty narozené 1820–1922

Pramenná díla neobsahují ukazatel pravděpodobnosti úmrtí, který musel být pro jednotlivé kohorty dopočten na základě rekonstruovaných počtů událostí a koncových stavů. Třídění je zde z důvodu kohortní analýzy vždy za kombinaci jednoleté věkové kategorie, jednoleté kohorty a dvouleté období kalendářních let (viz popis kohortního přístupu v Mazoucha a Hulíkové Tesárkové, 2018).

Pro jednotlivé věkové kategorie, s výjimkou nejnižšího dokončeného věku 0 let, bylo využito vztahu popsaného Wilmothem et al. (2017, s. 40), pro nejvyšší věkové kategorie bylo z důvodu kvality datových zdrojů, kterou zmiňují také Mazouch a Hulíková Tesárková (2018, s. 45 a 46), využito jednoduchého nahrazení empirických hodnot interpolovanými hodnotami. Ty pro věky nad 95 let uvažují exponenciální růst až do věku 102, pro který je pravděpodobnost úmrtí uvažována rovna jedné. Pro kohorty, které dosahují hraničního věku v období 2. světové války bylo také využito posledních známých hodnot a analogicky i interpolace do věku 102 let (kde je uvažována pravděpodobnost úmrtí rovna jedné), pouze počáteční věk pro interpolaci není 95 let, ale pro kohortu 1842 věk 94 a postupně až po kohortu 1848 věk 88 let. Pro mladší kohorty, které 2. světovou válku přežily, byl využit předpoklad, že v období 2. světové války došlo k navýšení „standardní“ úmrtnosti (koeficienty navýšení jsou součástí publikace Mazoucha a Hulíkové Tesárkové, 2018).

Datová sada obsahuje údaje o pravděpodobnostech úmrtí pro kohorty od roku narození 1820, které však nemají kompletní data pro celé věkové spektrum (data byla rekonstruována od kalendářního roku 1870) a první generace začíná věkem 50 let (a stejně jako ostatní kohorty končí věkem 102). Následující generace mají vždy o jeden rok věku více a první kompletní kohortou jsou narození v roce 1870. Poslední kompletní kohortou jsou narození v roce 1923. Tento údaj však není konečný, protože s publikací nových dat bude každý rok docházet k prodloužení časové řady o další kohortu.

V případě využití těchto konsolidovaných zdrojů, které jsou volně k použití, žádáme o důslednou citaci buď přímo pramenného dílapřípadně zmíněné knihy nebo tohoto webu.