Tietokanta
Tietokanta on
“IF … THEN …” rules base
soveltuu hyvin applikaation käyttösovellukseen.
Sairauksien valinta
Valintaprosessi perustuu ajantasaisiin tilastoihin ja tietoihin johtavilta terveysjärjestöiltä, kuten Maailman terveysjärjestöltä (WHO, https://www.cdc.gov/nndss/index.html 23. helmikuuta 2024 mennessä) Global Health Observatoryn (GHO) kautta, tautien valvonta- ja ehkäisykeskukset (CDC, https://www.cdc.gov/nndss/index.html, pääsy 23. helmikuuta 2024 mennessä) kansallisen ilmoitettavien tautien seurantajärjestelmän (NNDSS) kautta ja Euroopan tautien keskus Ennaltaehkäisy ja valvonta (ECDC, https://atlas.ecdc.europa.eu/public/index.aspx, pääsy 23. helmikuuta 2023 mennessä) tartuntatautien valvontakartassansa kautta olemme tunnistaneet 22 tautia keskitettyä analysointia ja seurantaa varten. tämän projektin laajuus. Nämä taudit on valittu niiden merkittävän vaikutuksen maailmanlaajuiseen terveyteen, esiintyvyyden ja viimeaikaisissa tiedoissa havaittujen trendien perusteella. Näin varmistetaan, että järjestelmämme on varustettu käsittelemään merenkulkutoiminnalle uhkia aiheuttavia tartuntatauteja. - - -- - -
Valittavana olevat sairaudet |
|
Vesirokko |
Sikotauti |
Chikungunya |
Norovirus |
Kolera |
Hinkuyskä |
COVID-19 |
Raivotauti |
Dengue-kuume |
Vihurirokko |
Kurkkumätä |
Jäykkäkouristus |
Ebola |
Tuberkuloosi |
Tarttuva mononukleoosi |
Lavantauti ja paratyfoidi |
Influenssa |
A-hepatiitti |
Malaria |
Keltakuume |
Meningokokkitauti |
Zika |
Lääketieteellisen tiedon hankkiminen
Ensin tunnistettiin valikoituja sairauksia koskeva kirjallisuus, erilaisten infektioiden diagnostiset kriteerit ja ohjeet tartuntatautien diagnosointiin. Kirjallisuus sisältää kansainvälisiä vertaisarvioituja artikkeleita, verkkoraportteja, kommentteja, pääkirjoituksia, sähköisiä kirjoja sekä yliopistojen ja tutkimuslaitosten lehdistötiedotteita, jotka sisältävät asiantuntijalausuntoja. Mukana oli myös WHO:n, Yhdysvaltain tautien valvonta- ja ehkäisykeskusten (CDC) ja muiden paikallishallinnon julkaisujen ja tiedotuspisteiden julkaisemaa harmaata kirjallisuutta. Tutkimustietokantoihin kuuluivat PubMed, Google Scholar, Embase, Medline ja Science Direct.
Chickenpox: presentation and complications in adults Abro AH, Ustadi AM, Das K, Abdou AM, Hussaini HS, Chandra FS.
Clinical manifestations, complications and management of chickenpox infection in pediatric Bereda G.
Chickenpox Clinical Presentation Anthony J Papadopoulos, MD
Interna Szczeklika 2022 Group work
Chronic Joint Pain 3 Years after Chikungunya Virus Infection Largely Characterized by Relapsing-remitting Symptoms Sarah R. Tritsch, Liliana Encinales, Nelly Pacheco, et al.
Manifestations of Atypical Symptoms of Chikungunya during the Dhaka Outbreak (2017) in Bangladesh Deeba IM, Hasan MM, Al Mosabbir A, Siam MHB, Islam MS, Raheem E, Hossain MS.
Overview on Chikungunya Virus Infection: From Epidemiology to State-of-the-Art Experimental Models Constant LEC, Rajsfus BF, Carneiro PH, Sisnande T, Mohana-Borges R and Allonso D
Chikungunya virus: A general overview K.A. Galán-Huerta, A.M. Rivas-Estilla, I. Fernández-Salas, J.A. Farfan-Ale, J. Ramos-Jiménez
Chikungunya virus disease European Centre for Disease Prevention and Control (ECDC) 2024
Parazytologia medyczna kompendium Morozinska- Gogol
A prolonged, community-wide cholera outbreak associated with drinking water contaminated by sewage in Kasese District, western Uganda Kwesiga, B., Pande, G., Ario, A.R. et al.
Cholera — the new strike of an old foe Anna Kuna, Michał Gajewski
Kolera Matthew Fanous; Kevin C. King
Sensitivity, Specificity, and Public-Health Utility of Clinical Case Definitions Based on the Signs and Symptoms of Cholera in Africa Nadri J, Sauvageot D, Njanpop-Lafourcade BM, Baltazar CS et al.
Factsheet on COVID-19 European Centre for Disease Prevention and Control (ECDC) 2024
COVID-19 diagnosis and management: a comprehensive review Pascarella G, Strumia A, Piliego C, Bruno F et al.
COVID-19 patients’ clinical characteristics, discharge rate, and fatality rate of meta-analysis Li L-q, Huang T, Wang Y-q, et al.
Clinical profile of Dengue fever in an urban tertiary care hospital in South India Dhivya P., Monica A., Jayaramachandran S.
Dengue—How Best to Classify It Anon Srikiatkhachorn, Alan L. Rothman, Robert V. Gibbons et al.
Dengue hemorrhagic fever – A systemic literature review of current perspectives on pathogenesis, prevention and control Wen-Hung Wang, Aspiro Nayim Urbina, Max R. Chang et al.
Clinical Characteristics and Management of 676 Hospitalized Diphtheria Cases, Kyrgyz Republic, 1995 R. Kadirova, H. Ü. Kartoglu, P. M. Strebel
Corynebacterium Diphtheriae Anmol Chaudhary; Shivlal Pandey
Association of clinical signs and symptoms of Ebola viral disease with case fatality: a systematic review and meta-analysis Harsha Moole , Swetha Chitta , Darlyn Victor et al.
Clinical Manifestations and Laboratory Diagnosis of Ebola Virus Infection. Qureshi AI.
The Reemergence of Ebola Hemorrhagic Fever, Democratic Republic of the Congo, 1995 Ali S. Khan, F. Kweteminga Tshioko, David L. Heymann et al.
Acute and Chronic Symptoms of Mononucleosis Sanjay Lambore, MB, MSc, James McSherry, MB ChB, and Arthur S. Kraus, ScD
Infectious mononucleosis in children – one centre experience Joanna Maria Wrembel, Tomasz Jarmoliński
Clinical Signs and Symptoms Predicting Influenza Infection Monto AS, Gravenstein S, Elliott M, Colopy M, Schweinle J.
An Office-Based Approach to Influenza: Clinical Diagnosis and Laboratory Testing NORMAN J. MONTALTO, D.O.
Travelers Malaria Patricia Schlagenhauf-Lawlor
Sensitivity of fever for diagnosis of clinical malaria in a Kenyan area of unstable, low malaria transmission. utanda, Albino & Cheruiyot, Priscah & Hodges, James & Ayodo, George & Odero, Wilson & John, Chandy
Plasmodium falciparum clinical malaria in Dielmo, a holoendemic area in Senegal: No influence of acquired immunity on initial symptomatology and severity of malaria attacks Rogier, Christophe & Ly, Alioune & Adama, Tall & Cissé, Badara & Trape, J.
Invasive Meningococcal Infection: Analysis of 110 cases from a Tertiary Care Centre in North East India Dass Hazarika, R., Deka, N.M., Khyriem, A.B. et al.
Which early ‘red flag’ symptoms identify children with meningococcal disease in primary care? Tanya Ali Haj-Hassan, Matthew J Thompson, Richard T Mayon-White et al.
Mumps Virus: Modification of the Identify-Isolate-Inform Tool for Frontline Healthcare Providers Koenig KL, Shastry S, Mzahim B, Almadhyan A, Burns MJ.
Characteristics of a large mumps outbreak: Clinical severity, complications and association with vaccination status of mumps outbreak cases Stein Zamir, H Schroeder, H Shoob, N Abramson & G Zentner
Mumps outbreak and laboratory diagnosis Mylène Maillet, Eric Bouvat, Nicole Robert et al.
An outbreak of norovirus-related acute gastroenteritis associated with delivery food in Guangzhou, southern China Lu Y, Ma M, Wang H, Wang D, Chen C, Jing Q, Geng J, Li T, Zhang Z, Yang Z.
Vomiting as a Symptom and Transmission Risk in Norovirus Illness: Evidence from Human Challenge Studies Amy E. Kirby, Ashleigh Streby, Christine L. Moe
Clinical Manifestation of Norovirus Gastroenteritis in Health Care Settings Ben A. Lopman, Mark H. Reacher, Ian B. Vipond, Joyshri Sarangi, David W. G. Brown
Clinical manifestation of norovirus infection in children aged less than five years old admitted with acute diarrhea in Surabaya, Indonesia: a cross-sectional study Fardah Athiyyah A, Shigemura K, Kitagawa K et al.
Diagnostic value of symptoms and laboratory data for pertussis in adolescent and adult patients Miyashita N, Akaike H, Teranishi H, Kawai Y, Ouchi K, Kato T, Hayashi T, Okimoto N.
Pertussis (Whooping Cough) Centers for Disease Control and Prevention
Pertussis prevalence among adult patients with acute cough İlbay A, Tanrıöver MD, Zarakol P, Güzelce EÇ, Bölek H, Ünal S.
Clinical aspects of human rabies in the state of Ceará, Brazil: an overview of 63 cases Duarte NFH, Pires Neto RDJ, Viana VF, Feijão LX, Alencar CH, Heukelbach J.
Epidemiological and clinical features of human rabies cases in Bali 2008-2010 Susilawathi NM, Darwinata AE, Dwija IB, Budayanti NS et al.
Rubella outbreak among workers in three small- and medium-size business establishments associated with imported genotype 1E rubella virus-Shizuoka, Japan, 2015 Kato H, Kamiya H, Mori Y, Yahata Y, Morino S, Griffith M et al.
Rubella (German Measles, Three-Day Measles) Centers for Disease Control and Prevention
Five years review of cases of adult tetanus managed at Gondar University Hospital, North West Ethiopia (Gondar, Sep. 2003-Aug. 2008) Tadesse A, Gebre-Selassie S.
Clinical features and outcomes of tetanus: a retrospective study Fan Z, Zhao Y, Wang S, Zhang F, Zhuang C.
Jäykkäkouristus Louise Thwaites, MD
Tetanus: Presentation and outcome in adults. Younas NJ, Abro AH, Das K, Abdou AMS, Ustadi AM, Afzal S.
Miliary tuberculosis: Clinical manifestations, diagnosis and outcome in 38 adults Mert, A., Bilir, M., Tabak, F., Ozaras, R., Ozturk, R. et al.
A Population-Based Survey of Tuberculosis Symptoms: How Atypical Are Atypical Presentations? Loren G. Miller, Steven M. Asch, Emily I. Yu, Laura Knowles, Lillian Gelberg, Paul Davidson
Alert sign and symptoms for the early diagnosis of pulmonary tuberculosis: analysis of patients followed by a tertiary pediatric hospital Farina, E., D’Amore, C., Lancella, L. et al.
Clinical and epidemiological characteristics of HIV/AIDS patients diagnosed with tuberculosis in the Integral Care Service of the Dr. Robert Reid Cabral Children’s Hospital during the period 2010-2016 Ricardo Elías-Melgen, Rosa Abreu, Milandres García
Typhoid FeverAn Epidemic With Remarkably Few Clinical Signs and Symptoms Klotz SA, Jorgensen JH, Buckwold FJ, Craven PC.
Current trends in typhoid fever Crum, N.F.
Characteristic features of culture positive enteric fever in pediatric teaching hospital in Sulaimani governorate Tyib, Tara & Fakhir, Haydar & Mohammad, Hayder
Enteric fever Basnyat B, Qamar FN, Rupali P, Ahmed T, Parry CM.
Clinical Manifestations Of Hepatitis A: Recent Experience In A Community Teaching Hospital Myron J. Tong, Neveen S. El-Farra, Marianne I. Grew,
Natural History, Clinical Manifestations, and Pathogenesis of Hepatitis A Shin EC, Jeong SH
Clinical and Epidemiological Spectrum of Acute Viral Hepatitis Due to Hepatitis A and E in Children: A Descriptive, Cross-Sectional, Hospital-Based Study Javaria Rasheed, Muhammad Khalid, Sobia Rubab, Bushra Iqbal, Iram Nawaz, Asad Shahzad
Assessing yellow Fever risk in the ecuadorian Amazon. Izurieta RO, Macaluso M, Watts DM, Tesh RB, Guerra B, Cruz LM, Galwankar S, Vermund SH
Clinical features of yellow fever cases at Vom Christian Hospital during the 1969 epidemic on the Jos Plateau, Nigeria Evan M Jones and D. C. Wilson
Clinical and epidemiological characteristics of yellow fever in Brazil: analysis of reported cases 1998-2002 Tuboi, Suely & Costa, Zouraide & Vasconcelos, Pedro & Hatch, Douglas.
An Overview of Yellow Fever Virus Disease McGuinness I, Beckham JD, Tyler KL, Pastula DM.
Yellow fever outbreak in Kenya: A review Olivier Uwishema, Stanley Chinedu Eneh, Anyike Goodness Chiburoma et al.
Yellow Fever Leslie V. Simon; Muhammad F. Hashmi; Klaus D. Torp.
Zika Virus The Johns Hopkins University
Clinical, laboratory and virological data from suspected ZIKV patients in an endemic arbovirus area Tatiana Elias Colombo, Cássia Fernanda Estofolete, Andréia Francesli Negri Reis et al.
Clinical relevance of Zika symptoms in the context of a Zika Dengue epidemic Humberto Guanche Garcell, Francisco Gutiérrez García, Manuel Ramirez Nodal et al.
The Clinical Spectrum of Zika Virus in Returning Travelers Eyal Meltzer, Eyal Leshem, Yaniv Lustig, Giora Gottesman, Eli Schwartz
Jokainen sairaus kuvattiin sitten useilla merkeillä, jotka oli ryhmitelty tiettyyn 8 luokkaan. Kohdennettuja haastatteluja suoritettiin lääketieteen asiantuntijoiden kanssa, jotta selvitettiin tartuntatautien diagnosoinnin keskeiset tekijät ja niiden suhde kliinisiin päätöksentekoparametreihin. Olemme kehittäneet taulukon, joka edustaa eri sairauksien oireiden esiintymistiheyttä. Jokainen taulukon rivi vastaa tiettyä sairautta, ja jokainen sarake vastaa tiettyä oiretta. Rivin ja sarakkeen leikkauskohta sisältää tietyn sairauden tietyn oireen esiintymistiheyden tai esiintymisen
Tartuntatautien oireiden ryhmät | |||
1. General/systemic signs |
| 5. Hematological symptoms |
|
2. Respiratory signs |
| 6. Gastric symptoms: |
|
3. Musculoskeletal signs |
| 7. Dermatological or associated signs:
|
|
4. Neurological signs |
| 8. Others signs:
|
|
Ennustusalgoritmi
Potilas | Oire 1 | Oire 2 | Oire 3 |
1 | 1 | 1 | 1 |
2 | 1 | 1 | |
3 | 1 | 1 | |
4 | 1 | ||
5 | 1 | 1 | |
6 | 1 | ||
7 | 1 | 1 | |
8 | 1 | ||
25% | 50% | 100% |
3. Random Forest-malli perustuu Decision Tree-malliin, mutta Random Forest synnyttää metsän (iso määrä) päätöspuita (Decision Tree) ottaen huomioon vain jotkin oireet jokaiselle päätöspuulle. Random Forest- mallin tuotos on useimpien päätöspuiden valitsema tauti.Random Forest-malli perustuu päätöspuumalliin, mutta Random Forest -malli synnyttää metsän (iso määrä) päätöspuita ottaen huomioon vain jotkin oireet jokaiselle päätöspuulle. Random Forest-mallin tuotos on siis useimpien päätöspuiden (Decision Tree) valitsema tauti.
Kaikkien kolmen mallin rakentamiseen käytettiin oranssia tiedonlouhintaohjelmistoa (Orange data mining). Orange tiedonlouhintaohjelmisto on yksi koneoppimisen ja tiedonlouhinnan ohjelmistoista. Käytimme sitä, koska se on ilmainen, laajalti käytetty ohjelmisto, josta luodut mallit voidaan viedä ja sitten käyttää melkein missä tahansa Orange python -kirjaston avulla (Demsar J, Curk T, Erjavec A, Gorup C, Hocevar T, Milutinovic M, Mozina M, Polajnar M, Toplak M, Staric A, Stajdohar M, Umek L, Zagar L, Zbontar J, Zitnik M, Zupan B (2013) Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research 14 (elokuu): 2349–2353. http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf). Näin voimme helposti integroida ennustusalgoritmin verkkosivustoon ja mobiilisovellukseen ja tehdä sen julkisesti saataville.
Seuraavassa kuvassa on projektin visualisointi Orange-tiedonlouhintaohjelmistossa.
Arvioinnin tulokset
Tämä osio esittelee kolmen eri koneoppimismallin arvioinnin: Random Forest, Naive Bayes ja Decision Tree. Mallit arvioitiin erilaisten suorituskykymittareiden avulla niiden soveltuvuuden määrittämiseksi käyttöön.
Käytetty tietojoukko
Keräsimme testidataksi pienen määrän todellisia potilaiden oireita ja sairausyhdistelmiä. On syytä korostaa, että testitietoja ei käytetty koulutusprosessin aikana näitä malleja rakennettaessa.
Validointitekniikat
Projektissa sovellettiin Cross Validation- ja Random Sampling -tekniikoita mallien tarkkuuden testaamiseen. Ristivalidoinnin ja satunnaisnäytteenoton yhdistelmä mahdollistaa koneoppimismallien suorituskyvyn kattavan arvioinnin. Tämä kaksoisvalidointimenetelmä varmistaa perusteellisen ymmärryksen siitä, kuinka malli toimii eri skenaarioissa.
Ristivalidointitekniikka ja näytteenottoasetukset
Ristiinvalidointi
- Kerrosten lukumäärä: 5
- Stratifield-kerrostus: käytössä (varmistaa, että jokaisella taitolla on samanlainen luokkajakauma)
Satunnaisotos
- Toista testi kymmenen kertaa
- Harjoitussarjan koko: 66 %
- Stratifiel-kerrostus: Käytössä
Arviointimittarit
- AUC (Area Under Curve)Measures the model’s ability to differentiate between classes.
- CA (Classification Accuracy)Oikein ennustettujen tapausten suhde esiintymien kokonaismäärään.
- F1 ScoreTarkkuuden ja muistamisen harmoninen keskiarvo.
- TarkkuusOikein ennustettujen positiivisten havaintojen suhde ennustettujen positiivisten havaintojen kokonaismäärään.
- MuistiOikein ennustettujen positiivisten havaintojen suhde kaikkiin todellisen luokan havaintoihin.
- MCC (Matthews Correlation Coefficient)Binääriluokitusten laadun mitta.
Mallin suorituskyky
Alla on taulukko, jossa on yhteenveto kolmen koneoppimismallin arviointituloksista: Random Forest, Naive Bayes ja Decision Tree.
Metric | Random forest | Naive bayes | Decision tree |
AUC | 1.000 | 0.998 | 0.802 |
CA | 0.952 | 0.857 | 0.571 |
F1 | 0.937 | 0.825 | 0.500 |
Tarkkuus | 0.929 | 0.810 | 0.468 |
Muisti | 0.952 | 0.857 | 0.571 |
MCC | 0.952 | 0.854 | 0.559 |
Tämä taulukko kaappaa kunkin mallin suorituskyvyn DESSEV-projektissa käytettyjen keskeisten arviointimittojen välillä. Mallien vertailu alueittain ROC-käyrän alla osoittaa, että Random Forest -malli on ylivoimainen, jota seuraa Naive Bayes, ja päätöspuu on vähiten tehokas.
Koska Random Forest -malli toimii parhaiten, sitä käytetään sairauden ennustamiseen verkkosivuillamme ja mobiilisovelluksessamme.