Infectia Covid-19 in Italia si poluarea aerului. Exista o corelatie?

Pentru aceasta analiza, ma voi concentra doar asupra provinciilor italiene, care sunt seturi administrative de orase.

Pentru fiecare oras din Italia, voi obtine date despre poluarea aerului ca concentratie medie de PM10 intr-o anumita perioada. escorte pt cupluri Concentratia este apoi mediata in toate orasele unei provincii. Apoi voi calcula o masura a ratei infectiei cu virus care descrie viteza infectiei in acea provincie. vand si cumpar arad matrimoniale

Poluarea aerului si rata infectiei sunt apoi reprezentate grafic impreuna si analizate cu coeficientul de corelatie al lui Spearman si testul exact al lui Fisher pentru a verifica daca exista o corelatie intre ele.

Totul a fost facut in Python. futai si curve Caietul cu toate calculele poate fi gasit aici pe GitHub: https://github.com/gianlucamalato/machinelearning/blob/master/Covid_19_Correlation_with_pollution_in_Italy. curve muie ipynb

Am colectat urmatoarele date si le-am combinat atat in ​​Python, cat si in Foi de calcul Google, pentru a curata datele si a face ca toate seturile de date sa se alature dupa numele provinciei. Unele inregistrari nu se alatura, dar asta nu este o problema, deoarece acestea sunt o mica parte. curve mehedinti

Date provinciale

Fiecare oras din Italia apartine unei provincii, asa ca am descarcat tabelul de cartografiere oras-provincie de la ISTAT, care este Institutul National Italian de Statistica.

Setul de date poate fi gasit aici: https://www. situri matrimoniale istat.it/it/archivio/6789

Date despre poluare

Datele istorice pentru orasele Italiei au fost descarcate din datele deschise ale Organizatiei Mondiale a Sanatatii, mai precis aici: https://www. curve gratis sibiu who.int/airpollution/data/cities/en/

Am folosit concentratia medie de PM10 exprimata in micrograme pe metru cub. matrimoniale publi 24 Din pacate, datele nu sunt calculate in acelasi an pentru toate orasele. Am ales ultimul an disponibil pentru fiecare oras. matrimoniale curve Vom presupune ca poluarea aerului ramane stabila sau este slab variabila intre ani.

Iata un exemplu de set de date filtrat numai pentru orasele italiene. doru octavian dumitru matrimoniale

Fuzionand acest set de date cu tabelul oras-provincie si calculand media concentratiei, obtinem concentratia medie de PM10 pe provincie.

Date despre infectie

La fel ca in articolul meu anterior, sursa mea oficiala de date privind infectia este Departamentul italian pentru protectie civila. msi afterburner curve In fiecare zi, publica cu amabilitate date deschise detaliate pana la nivelul provinciei, care pot fi gasite aici: https://github.com/pcm-dpc/COVID-19/raw/master/dati-province/dpc-covid19-ita- provincie. dame de companie alesd csv

Voi lua aceste date si voi calcula, pentru fiecare provincie, rata de infectie ca diferenta medie a numarului cumulat de persoane infectate intr-un oras (coloana „total_casi”) intre doua zile consecutive.

Este foarte dur si nu tine cont de tendinta exponentiala, dar este o masura simpla pe care o putem folosi pentru a compara orasele intre ele. dame de companie mioveni

O alta masura corecta ar fi diferenta relativa medie intre doua zile, dar efectul secundar al utilizarii unei astfel de masuri este ca provinciile cu foarte putini oameni infectati (cum ar fi 3 sau 4) vor prezenta o valoare ridicata chiar si cu o crestere de 1 persoana. De fapt, o crestere de la 3 la 4 este de aproximativ 33%, dar este de fapt doar o unitate. dame de companie drumul taberei O crestere de la 100 la 133 este, de asemenea, de 33%, dar este de 33 de unitati, care trebuie sa cantareasca mai mult. De aceea prefer sa iau diferente absolute si apoi sa le calculez in medie pentru acest scop special. dame de companie busteni



  • iasi escorte
  • escorte beasov
  • escorte targu ocna
  • matrimoniale galati femei cauta barbati
  • curve romance video
  • escorte dubai
  • yield curve
  • curve curtea de arges
  • matrimoniale focsani vrancea
  • matrimoniale az suceava
  • curve bucuresti filmate
  • curve din fetesti
  • escorte romana
  • curve in iasi
  • curve achievement
  • curve motru
  • cele mai frumoase curve
  • curve ploiesti xxx
  • matrimoniale publi24 cluj
  • curve nerva traian




Acestea sunt provinciile cu cea mai mare rata de infectie calculata astfel:

Este destul de adevarat daca vedeti distributia geografica a infectiei in Italia. Deci, aceasta masura este destul de realista in scopul acestei analize. matrimoniale facebook

Dupa unirea seturilor de date impreuna dupa numele provinciei si calcularea ratei de infectie, obtinem un set de date cu urmatoarele coloane:

Vrem sa corelam coloana 2 cu coloana 3.

Coeficientul de corelatie al lui Spearman

Primul lucru pe care il putem face este sa planificam cele doua masuri. matrimoniale libertatea

Dupa cum putem vedea, valorile scazute ale concentratiei de PM10 sunt intotdeauna legate de ratele mici de infectie. Atata timp cat concentratia de PM10 creste, tendinta ratei de infectie devine mai mare si atinge valori mai mari. escorte bucuresti video

La prima vedere, se pare ca exista un fel de relatie intre cele doua variabile. Putem calcula coeficientul de corelatie al lui Spearman pentru a evalua daca ceea ce vedem este aleatoriu sau nu. site de matrimoniale gratis

Valoarea coeficientului este 0,42 si valoarea p a unui test statistic a carui ipoteza nula afirma absenta unei corelatii este 0,00002. Deoarece valoarea p este mai mica de 5%, putem respinge ipoteza nula ca nu exista nicio corelatie. curve centru vechi

Acest lucru ar fi suficient pentru a spune ca exista dovezi statistice ale unei relatii pozitive intre poluarea aerului si rata infectiei cu Covid-19. Daca exista un nivel ridicat de poluare a aerului, infectia se raspandeste mai repede. curve mamaia

Testul exact al lui Fisher

O alta modalitate simpla de a verifica prezenta unei corelatii este de a grupa datele noastre. Voi calcula valoarea medie a fiecarei coloane si apoi voi crea doua semnalizatoare care arata daca valoarea coloanei este peste sau sub medie. curve teleorman Daca semnalizatorul este egal cu 1, valoarea masurarii corespunzatoare din setul de date este mai mare decat valoarea medie din toate inregistrarile.

Valoarea medie a ratei infectiei la nivel national este de 23 de persoane / zi, iar indicele mediu national de poluare este de 24 micrograme / metru cub.

Setul de date cu steagurile calculate astfel arata acum:

Putem crea o tabela incrucisata intre steaguri care poate fi analizata folosind testul exact al lui Fisher pentru a evalua daca exista o relatie non-aleatorie intre date.

Dupa cum puteti vedea, exista o probabilitate de 43% ca un oras cu un nivel ridicat de poluare a aerului sa aiba si o rata de infectie ridicata. Cu niveluri scazute de poluare a aerului, probabilitatea unei rate de infectie ridicate scade la 17%.

Aplicarea unui test Fisher cu doua cozi la acest tabel ne ofera o valoare p de 0,0006. Din nou, putem respinge ipoteza nula ca nu exista nicio relatie intre poluarea aerului si rata infectiei.

Se pare ca poluarea ridicata a aerului este corelata cu raspandirea rapida a infectiei cu coronavirus. Desigur, corelatia este foarte diferita de cauzalitate, dar faptele par sa o confirme. Lombardia se confrunta cu cea mai mare rata de infectie din tara noastra si este una dintre cele mai poluate zone din Europa. China insasi, unde totul a inceput, are un nivel notoriu ridicat de poluare a aerului. Deci aceasta corelatie pare destul de rezonabila.

Poate ca poluarea aerului creste rata bolilor respiratorii pe care virusul le poate agrava serios, in special la persoanele mai slabe. Sau poate PM10 este intr-adevar un vehicul bun pentru Coronavirus.

Oricare ar fi raspunsul, suntem intr-un stadiu foarte timpuriu de cunoastere a acestui nou dusman, dar daca poluarea aerului va fi confirmata ca un accelerator al infectiei, poate ca aceasta ciuma poate deveni sansa de a indica energia verde si sa renunte la distrugerea Pamantul nostru.