Dane pobrane ze strony https://basiw.mz.gov.pl/index.html#/visualization?id=3761 są w wybitnie dziwnym formacie:
Ni to indywidualne ni to pogrupowane, bo jeżeli zmarły miał tą samą płeć, wiek, powiat, dzień zgonu, choroby współistniejące, obniżoną odporność oraz status względem szczepienia, to pole `liczba_zaraportowanych_zgonow’ > 1 (no bo przez czysty przypadek takich w powiecie tego dnia zmarło dwóch, albo trzech); Nigdy bym nie wpadł, że tak można komplikować życie. Ale dla geniuszy z MZ nie ma rzeczy niemożliwych
w zasadzie są bez polskich znaków (np pelna_dawka
) ale uzupełniająca
już ma jakieś diakrytyki oczywiście nie UTF8 tylko pewnie wg Windzianego układu CP1250. Uwaga: w wersji pobranej w 2021-12-24 nie ma już diakrytyków uzupelniajaca
zamiast uzupełniająca
.
Status względem szczepień (kolumna dawka_ost
) podaje taką informację: jedna_dawka
, pelna_dawka
, przypominajaca
, uzupełniająca
. Oraz nic nie zawiera co zapewne oznacza, że nie szczepiony. Mnie uczyli że żadna rubryka nie powinna być pusta: nie szczepienie powinni być jawnie oznaczeni. Zresztą tak jest w kolumnie w_pelni_zaszczepiony
, która zawiera T
/N
a przecież mogłaby zawierać T
i nic…
Niestety już na dzień dobry można się zorientować że ten kto te dane gromadzi, no wygląda na dyletanta. Jednego z wielu, którzy się kręcą wokół tej pandemii…
Plik poprawiono (za pomocą prostego skryptu w Perlu) w ten sposób, że wiersze w których liczba_zaraportowanych_zgonow
> 1, zostały stosowną liczbę razy powtórzone.
Średnie wieku zmarłych wg tygodni (10% oznacza pierwszy decyl zmarłych, a 25% pierwszy kwartyl); Linie są wyznaczone metodą wygładzania LOESS
Średnia wieku 63770 zmarłych to 75.2 lat.
Liczba zmarłych wg tygodni. W szczególności w tych tygodniach, w których średnie wieku zmarłych były względnie niskie (32–36) liczba zgonów też była niska.
Liczba zmarłych w podziale na ogółem i tych w wieku 50 lat i mniej:
W dalszej części analizujemy tylko dane dla tzw. 4-tej fali porównując zaszczepionych i nie zaszczepionych. Nie analizujemy początku roku, bo tam zaszczepionych było mało, potem było wygaszenie pandemii. Od 35 tygodnia (który zaczynał się 30-08-2021) liczba zgonów rośnie a jednocześnie już wględnie znaczący odsetek populacji jest już zaszczepiony (około 50%)
Definiujemy 3 grupy wieku 0–39, 40–59, 60 i więcej. Szczepionych dzielimy na 3 grupy: nieszczepionych wcale (0 dawek), raz szczepionych oraz dwa lub więcej razy szczepionych:
## tylko 4 fala
d4 <- d0 %>% filter (as.numeric(week) >= first.week ) %>%
## recode dawka
mutate(dawka_ost=fct_recode(dawka_ost,
'1' = 'jedna_dawka',
'2' = 'pelna_dawka',
'2' = 'przypominajaca',
#'2' = 'uzupe\xb3niaj\xb9ca',
'2' = 'uzupelniajaca',
'0' = '')) %>%
## recode age
mutate(grupa_wieku = case_when(
vek < 40 ~ "<40]",
vek >= 40 & vek < 60 ~ "40-60]",
vek >= 60 ~ "60>" ))
lzgonow <- nrow(d4)
Liczba zgonów w tak zdefiniowanym okresie (tj od 35 tygodnia) wyniosła 17512.
Zależność wiek a zaszczepienie (0
oznacza że nie był zaszczepiony):
<40] | 40-60] | 60> | Sum | |
---|---|---|---|---|
0 | 1.4218821 | 7.7603929 | 62.191640 | 71.373915 |
1 | 0.0399726 | 0.0799452 | 1.359068 | 1.478986 |
2 | 0.1256281 | 1.3990407 | 25.622430 | 27.147099 |
Sum | 1.5874829 | 9.2393787 | 89.173138 | 100.000000 |
Zwróćmy uwagę, że 62.2% zgonów (od 35 tygodnia 2021 przypominam), to osoby niezaszczepione w wieku 60 lat i więcej. Warto też zwrócić uwagę, że na tę grupę wieku przypada 89.2% wszystkich zgonów.
Średni wiek w grupach niezaszczepionych (dawka_ost = 0
) oraz tych zaszczepionych dwa lub więcej razy (dawka_ost = 2
):
grupa_wieku | dawka_ost | średnia | mediana | n |
---|---|---|---|---|
<40] | 0 | 32.34940 | 34 | 249 |
<40] | 2 | 33.45455 | 35 | 22 |
40-60] | 0 | 51.57763 | 52 | 1359 |
40-60] | 2 | 52.94286 | 54 | 245 |
60> | 0 | 78.67184 | 80 | 10891 |
60> | 2 | 78.23156 | 78 | 4487 |
Pomijamy tych z jedną dawką bo nie wiadomo jak ich traktować i jest ich względnie mało:
d4.jednadawka <- d4 %>% filter (dawka_ost == 1)
lz.jednadawka <- nrow(d4.jednadawka)
konkretnie jest ich 259 czyli 1.4789858%.
Zatem w dalszej części analizy porównujemy zaszczepionych co najmniej dwa razy oraz nie zaszczepionych wcale. Tych co raz szczepieni pomijamy.
Tak zdefiniowana grupa liczy 17253 zmarłych. Średnia wieku w tej grupie to 75.3 lat. (Dla przypomnienia w całym roku było to 75.2 czyli praktycznie to samo)
Zgony wg grup wieku (stała skala w poszczególnych grupach wiekowych)
To samo co na poprzednim, ale różna skala w poszczególnych grupach wiekowych:
W kolejnej części analizy porównujemy dane dla 4-tej fali porównując zaszczepionych co najmniej podwójnie i nie zaszczepionych wcale w grupie tych, dla których wyłączną przyczyną zgonu był COVID19 (tzw. zmarli bez chorób współistniejących):
Tak zdefiniowana grupa liczy 4750 zmarłych. Średnia wieku w tej grupie to 73.7357895.
Zależność wiek a zaszczepienie (w grupie bez chorób współistniejących):
<40] | 40-60] | 60> | Sum | |
---|---|---|---|---|
0 | 2.0421053 | 10.673684 | 62.56842 | 75.28421 |
2 | 0.2105263 | 1.368421 | 23.13684 | 24.71579 |
Sum | 2.2526316 | 12.042105 | 85.70526 | 100.00000 |
Test chi²
##
## Pearson's Chi-squared test
##
## data: deaths.table
## X-squared = 79.764, df = 2, p-value < 0.00000000000000022