Baza znanja

Baza znanja v obliki
“ČE … POTEM…”,
ki se z lahkoto vključi v sistem za podporo pri odločanju.

Izbira bolezni

Na podlagi trenutne statistike in podatkov vodilnih zdravstvenih organizacij, kot je Svetovna zdravstvena organizacija (WHO, https://www.cdc.gov/nndss/index.html na dan 23. februar 2024) prek Globalnega zdravstvenega observatorija (GHO), centrov za nadzor in preprečevanje bolezni (CDC, https://www.cdc.gov/nndss/index.htmlna dan 23. februar 2024) prek nacionalnega sistema za spremljanje bolezni, ki jih je treba prijaviti (NNDSS), in Evropskega centra za preprečevanje in obvladovanje bolezni (ECDC, https://atlas.ecdc.europa.eu/public/index.aspx na dan 23. februar 2023) prek njegovega Surveillance Atlas of Infectious Diseases, smo identificirali 22 bolezni za koncentrirano analizo in spremljanje v okviru tega projekta. Te bolezni so bile izbrane na podlagi njihovega pomembnega vpliva na globalno zdravje, njihove razširjenosti in trendov, opaženih v zadnjih podatkih, s čimer zagotavljamo, da je naš sistem opremljen za obvladovanje nalezljivih bolezni, ki ogrožajo pomorske operacije.

Seznam izbranih bolezni

Norice

Mumps

Čikungunja

Norovirus

Kolera

Oslovski kašelj

COVID-19

Steklina

Denga

Rdečke

Davica

Tetanus

Ebola

Tuberkuloza

Mononukleoza

Tifus ali paratifus

Gripa

Hepatitis A

Malarija

Rumena mrzlica

Meningokokna okužba

Zika

Pridobivanje medicinskega znanja

Najprej je bila opredeljena relevantna literatura o izbranih boleznih, diagnostičnih kriterijih za različne okužbe in smernicah za diagnosticiranje nalezljivih bolezni. Literatura vključuje mednarodne recenzirane članke, spletna poročila, komentarje, uvodnike, elektronske knjige ter sporočila za javnost univerz in raziskovalnih ustanov, ki vključujejo strokovna mnenja. Vključena je bila tudi siva literatura, ki so jo izdali WHO, ameriški centri za nadzor in preprečevanje bolezni (CDC) ter druge lokalne vladne publikacije in informacijske postaje. Črpali smo iz naslednjih raziskovalnih zbirk podatkov: PubMed, Google Scholar, Embase, Medline in Science Direct.

Chickenpox: presentation and complications in adults Abro AH, Ustadi AM, Das K, Abdou AM, Hussaini HS, Chandra FS.
Clinical manifestations, complications and management of chickenpox infection in pediatric Bereda G. 
Chickenpox Clinical Presentation Anthony J Papadopoulos, MD
Interna Szczeklika 2022 Group work
Chronic Joint Pain 3 Years after Chikungunya Virus Infection Largely Characterized by Relapsing-remitting Symptoms Sarah R. Tritsch, Liliana Encinales, Nelly Pacheco, et al. 
Manifestations of Atypical Symptoms of Chikungunya during the Dhaka Outbreak (2017) in Bangladesh Deeba IM, Hasan MM, Al Mosabbir A, Siam MHB, Islam MS, Raheem E, Hossain MS.
Overview on Chikungunya Virus Infection: From Epidemiology to State-of-the-Art Experimental Models Constant LEC, Rajsfus BF, Carneiro PH, Sisnande T, Mohana-Borges R and Allonso D
Chikungunya virus: A general overview K.A. Galán-Huerta, A.M. Rivas-Estilla, I. Fernández-Salas, J.A. Farfan-Ale, J. Ramos-Jiménez
Chikungunya virus disease European Centre for Disease Prevention and Control (ECDC) 2024
Parazytologia medyczna kompendium Morozinska- Gogol
A prolonged, community-wide cholera outbreak associated with drinking water contaminated by sewage in Kasese District, western Uganda Kwesiga, B., Pande, G., Ario, A.R. et al. 
Cholera — the new strike of an old foe Anna Kuna, Michał Gajewski
Kolera Matthew Fanous; Kevin C. King
Sensitivity, Specificity, and Public-Health Utility of Clinical Case Definitions Based on the Signs and Symptoms of Cholera in Africa Nadri J, Sauvageot D, Njanpop-Lafourcade BM, Baltazar CS et al. 
Factsheet on COVID-19 European Centre for Disease Prevention and Control (ECDC) 2024
COVID-19 diagnosis and management: a comprehensive review Pascarella G, Strumia A, Piliego C, Bruno F et al. 
COVID-19 patients’ clinical characteristics, discharge rate, and fatality rate of meta-analysis Li L-q, Huang T, Wang Y-q, et al. 
Clinical profile of Dengue fever in an urban tertiary care hospital in South India Dhivya P., Monica A., Jayaramachandran S.
Dengue—How Best to Classify It Anon Srikiatkhachorn, Alan L. Rothman, Robert V. Gibbons et al. 
Dengue hemorrhagic fever – A systemic literature review of current perspectives on pathogenesis, prevention and control Wen-Hung Wang, Aspiro Nayim Urbina, Max R. Chang et al. 
Clinical Characteristics and Management of 676 Hospitalized Diphtheria Cases, Kyrgyz Republic, 1995 R. Kadirova, H. Ü. Kartoglu, P. M. Strebel
Corynebacterium Diphtheriae Anmol Chaudhary; Shivlal Pandey
Association of clinical signs and symptoms of Ebola viral disease with case fatality: a systematic review and meta-analysis Harsha Moole , Swetha Chitta , Darlyn Victor et al. 
Clinical Manifestations and Laboratory Diagnosis of Ebola Virus Infection. Qureshi AI. 
The Reemergence of Ebola Hemorrhagic Fever, Democratic Republic of the Congo, 1995  Ali S. Khan, F. Kweteminga Tshioko, David L. Heymann et al. 
Acute and Chronic Symptoms of Mononucleosis Sanjay Lambore, MB, MSc, James McSherry, MB ChB, and Arthur S. Kraus, ScD
Infectious mononucleosis in children – one centre experience Joanna Maria Wrembel, Tomasz Jarmoliński
Clinical Signs and Symptoms Predicting Influenza Infection Monto AS, Gravenstein S, Elliott M, Colopy M, Schweinle J. 
An Office-Based Approach to Influenza: Clinical Diagnosis and Laboratory Testing NORMAN J. MONTALTO, D.O.
Travelers Malaria Patricia Schlagenhauf-Lawlor
Sensitivity of fever for diagnosis of clinical malaria in a Kenyan area of unstable, low malaria transmission. utanda, Albino & Cheruiyot, Priscah & Hodges, James & Ayodo, George & Odero, Wilson & John, Chandy
Plasmodium falciparum clinical malaria in Dielmo, a holoendemic area in Senegal: No influence of acquired immunity on initial symptomatology and severity of malaria attacks Rogier, Christophe & Ly, Alioune & Adama, Tall & Cissé, Badara & Trape, J.
Invasive Meningococcal Infection: Analysis of 110 cases from a Tertiary Care Centre in North East India Dass Hazarika, R., Deka, N.M., Khyriem, A.B. et al.
Which early ‘red flag’ symptoms identify children with meningococcal disease in primary care? Tanya Ali Haj-Hassan, Matthew J Thompson, Richard T Mayon-White et al. 
Mumps Virus: Modification of the Identify-Isolate-Inform Tool for Frontline Healthcare Providers Koenig KL, Shastry S, Mzahim B, Almadhyan A, Burns MJ. 
Characteristics of a large mumps outbreak: Clinical severity, complications and association with vaccination status of mumps outbreak cases Stein Zamir, H Schroeder, H Shoob, N Abramson & G Zentner 
Mumps outbreak and laboratory diagnosis Mylène Maillet, Eric Bouvat, Nicole Robert et al. 
An outbreak of norovirus-related acute gastroenteritis associated with delivery food in Guangzhou, southern China  Lu Y, Ma M, Wang H, Wang D, Chen C, Jing Q, Geng J, Li T, Zhang Z, Yang Z. 
Vomiting as a Symptom and Transmission Risk in Norovirus Illness: Evidence from Human Challenge Studies Amy E. Kirby, Ashleigh Streby, Christine L. Moe
Clinical Manifestation of Norovirus Gastroenteritis in Health Care Settings Ben A. Lopman, Mark H. Reacher, Ian B. Vipond, Joyshri Sarangi, David W. G. Brown
Clinical manifestation of norovirus infection in children aged less than five years old admitted with acute diarrhea in Surabaya, Indonesia: a cross-sectional study Fardah Athiyyah A, Shigemura K, Kitagawa K et al. 
Diagnostic value of symptoms and laboratory data for pertussis in adolescent and adult patients Miyashita N, Akaike H, Teranishi H, Kawai Y, Ouchi K, Kato T, Hayashi T, Okimoto N.
Pertussis (Whooping Cough) Centers for Disease Control and Prevention
Pertussis prevalence among adult patients with acute cough İlbay A, Tanrıöver MD, Zarakol P, Güzelce EÇ, Bölek H, Ünal S. 
Clinical aspects of human rabies in the state of Ceará, Brazil: an overview of 63 cases Duarte NFH, Pires Neto RDJ, Viana VF, Feijão LX, Alencar CH, Heukelbach J. 
Epidemiological and clinical features of human rabies cases in Bali 2008-2010 Susilawathi NM, Darwinata AE, Dwija IB, Budayanti NS et al. 
Rubella outbreak among workers in three small- and medium-size business establishments associated with imported genotype 1E rubella virus-Shizuoka, Japan, 2015 Kato H, Kamiya H, Mori Y, Yahata Y, Morino S, Griffith M et al. 
Rubella (German Measles, Three-Day Measles) Centers for Disease Control and Prevention
Five years review of cases of adult tetanus managed at Gondar University Hospital, North West Ethiopia (Gondar, Sep. 2003-Aug. 2008) Tadesse A, Gebre-Selassie S. 
Clinical features and outcomes of tetanus: a retrospective study Fan Z, Zhao Y, Wang S, Zhang F, Zhuang C. 
Tetanus Louise Thwaites, MD
Tetanus: Presentation and outcome in adults.  Younas NJ, Abro AH, Das K, Abdou AMS, Ustadi AM, Afzal S. 
Miliary tuberculosis: Clinical manifestations, diagnosis and outcome in 38 adults Mert, A., Bilir, M., Tabak, F., Ozaras, R., Ozturk, R. et al. 
A Population-Based Survey of Tuberculosis Symptoms: How Atypical Are Atypical Presentations? Loren G. Miller, Steven M. Asch, Emily I. Yu, Laura Knowles, Lillian Gelberg, Paul Davidson
Alert sign and symptoms for the early diagnosis of pulmonary tuberculosis: analysis of patients followed by a tertiary pediatric hospital Farina, E., D’Amore, C., Lancella, L. et al. 
Clinical and epidemiological characteristics of HIV/AIDS patients diagnosed with tuberculosis in the Integral Care Service of the Dr. Robert Reid Cabral Children’s Hospital during the period 2010-2016 Ricardo Elías-Melgen, Rosa Abreu, Milandres García
Typhoid FeverAn Epidemic With Remarkably Few Clinical Signs and Symptoms Klotz SA, Jorgensen JH, Buckwold FJ, Craven PC.
Current trends in typhoid fever Crum, N.F. 
Characteristic features of culture positive enteric fever in pediatric teaching hospital in Sulaimani governorate Tyib, Tara & Fakhir, Haydar & Mohammad, Hayder
Enteric fever Basnyat B, Qamar FN, Rupali P, Ahmed T, Parry CM.
Clinical Manifestations Of Hepatitis A: Recent Experience In A Community Teaching Hospital Myron J. Tong, Neveen S. El-Farra, Marianne I. Grew,
Natural History, Clinical Manifestations, and Pathogenesis of Hepatitis A Shin EC, Jeong SH
Clinical and Epidemiological Spectrum of Acute Viral Hepatitis Due to Hepatitis A and E in Children: A Descriptive, Cross-Sectional, Hospital-Based Study Javaria Rasheed, Muhammad Khalid, Sobia Rubab, Bushra Iqbal, Iram Nawaz, Asad Shahzad
Assessing yellow Fever risk in the ecuadorian Amazon.  Izurieta RO, Macaluso M, Watts DM, Tesh RB, Guerra B, Cruz LM, Galwankar S, Vermund SH
Clinical features of yellow fever cases at Vom Christian Hospital during the 1969 epidemic on the Jos Plateau, Nigeria Evan M Jones and D. C. Wilson
Clinical and epidemiological characteristics of yellow fever in Brazil: analysis of reported cases 1998-2002 Tuboi, Suely & Costa, Zouraide & Vasconcelos, Pedro & Hatch, Douglas.
An Overview of Yellow Fever Virus Disease McGuinness I, Beckham JD, Tyler KL, Pastula DM.
Yellow fever outbreak in Kenya: A review Olivier Uwishema, Stanley Chinedu Eneh, Anyike Goodness Chiburoma et al. 
Yellow Fever Leslie V. Simon; Muhammad F. Hashmi; Klaus D. Torp.
Zika Virus The Johns Hopkins University
Clinical, laboratory and virological data from suspected ZIKV patients in an endemic arbovirus area Tatiana Elias Colombo, Cássia Fernanda Estofolete, Andréia Francesli Negri Reis et al. 
Clinical relevance of Zika symptoms in the context of a Zika Dengue epidemic Humberto Guanche Garcell, Francisco Gutiérrez García, Manuel Ramirez Nodal et al. 
The Clinical Spectrum of Zika Virus in Returning Travelers Eyal Meltzer, Eyal Leshem, Yaniv Lustig, Giora Gottesman, Eli Schwartz

Vsako bolezen smo nato opisali z več simptomi, razvrščenimi v 8 kategorij. Opravljeni so bili ciljno usmerjeni intervjuji z medicinskimi strokovnjaki, da bi ugotovili ključne elemente pri diagnozi nalezljivih bolezni in njihov odnos do kliničnih parametrov odločanja. Oblikovali smo tabelo, ki predstavlja pogostnost različnih simptomov bolezni. Vsaka vrstica v tabeli ustreza določeni bolezni, vsak stolpec pa določenemu simptomu. Presečišče vrstice in stolpca vsebuje pogostost ali pojav določenega simptoma pri določeni bolezni.

Skupine simptomov nalezljivih bolezni

1. Splošni/sistemski simptomi

  • stalna vročina ali vročina s presledki, krajšimi od enega dneva
  • vročina s prekinitvami, vsake 2-4 dni
  • letargija
  • potenje in/ali mrazenje
  • glavobol
  • pomanjkanje apetita in/ali izguba teže

5. Hematološki simptomi:

  • krvavitve

2. Dihalni simptomi: 

  • bolečina v prsih
  • kašelj
  • katar
  • zasoplost
  • boleče grlo/žrelo
  • izcedek iz nosu

6. Prebavni simptomi:

  • bolečina v trebuhu
  • driska
  • slabost
  • bruhanje

3. Mišično-skeletni simptomi:

  • boleč hrbet
  • bolečina v sklepih
  • bolečina v mišicah
  • otrplost žvekalnih mišic (trizmus)

7. Dermatološki ali povezani simptomi:

 

  • otekanje vratu
  • kožni izpuščaj
  • rumena koža in/ali temen urin

4. Nevrološki simptomi:

  • zamegljen vid
  • kognitivni upad
  • težave s požiranjem
  • omotičnost
  • agitacija ali razdražljivost
  • nevrološke težave s čutili in gibanjem
  • spazmični krči
  • otrdel vrat in občutljivost na svetlobo

8. Drugi simptomi

 

  • strah pred vodo
  • bolečine v modih
  • pordečele oči

 

Algoritem napovedovanja

Cilj algoritma za napovedovanje je napovedati morebitno nalezljivo bolezen/bolezni, ki bi jo lahko imel pacient, na podlagi njenih/njegovih simptomov. Algoritem za napovedovanje je za potrebe odločanja treba najprej naučiti in naučili smo ga z bazo znanja o simptomih in nalezljivih boleznih. Bazo znanja o simptomih in nalezljivih boleznih smo izrazili v odstotkih, to je, koliko pacientov od 100 bi izrazilo določen simptom, če bi bili okuženi z določeno nalezljivo boleznijo. Na podlagi teh podatkov smo naključno ustvarili na stotine umetnih pacientov s pripadajočimi simptomi. Vsi simptomi teh pacientov v odstotkih ustrezajo pogostosti pojavljanja simptomov, ki smo jih pridobili iz baze znanja. Npr. če ima za določeno bolezen 25 % pacientov simptom 1, 50 % jih ima simptom 2 in 100 % jih ima simptom 3, bi lahko iz teh podatkov ustvarili naslednjih 5 pacientov in skupni odstotki bi še vedno ustrezali začetnim podatkom. Ta pristop naključnega generiranja umetnih pacientov smo uporabili, da bi upoštevali, da je vsak človek edinstven, zato so simptomi, ki se pojavijo po okužbi, pri vsaki osebi nekoliko drugačni.
Pacient Simptom 1 Simptom 2 Simptom 3
1 1 1 1
2 1 1
3 1 1
4 1
5 1 1
6 1
7 1 1
8 1
25% 50% 100%
Te naključno ustvarjene podatke smo uporabili za učenje našega algoritma za napovedovanje. V našem napovednem algoritmu smo testirali tri modele umetne inteligence, da bi jih lahko primerjali in izbrali najbolj natančnega: naključni gozd, odločitveno drevo in naivni Bayes. Vsi ti modeli se uporabljajo za napovedovanje bolezni neposredno na podlagi danih simptomov. 1. Naivni Bayesov model je klasifikator, ki predpostavlja, da so simptomi pogojno neodvisni glede na ciljno bolezen. Moč te predpostavke (naivnost) je tisto, zaradi česar je klasifikator dobil ime. 2. Model odločitveno drevo je drevesu podoben model simptomov in njihovih možnih bolezni, vključno z izidi naključnih dogodkov, stroški virov in uporabnostjo. Vsaka veja predstavlja izid testa (če je simptom prisoten ali ne), vsak listni vozel pa predstavlja bolezen. Na naslednji sliki je celotno odločitveno drevo.
decision tree

3. Model naključnega gozda temelji na modelu odločitvenega drevesa, vendar se v modelu naključnega gozda ustvari gozd (veliko število) odločitvenih dreves ob upoštevanju le nekaterih simptomov za vsako odločitveno drevo. Rezultat naključnega gozda je bolezen, ki jo izbere večina odločitvenih dreves.

Za izdelavo vseh treh modelov je bila uporabljena programska oprema Orange podatkovnega rudarjenja. Orange programska oprema za rudarjenje podatkov je eden izmed programov za strojno učenje in rudarjenje podatkov. Uporabili smo ga, saj gre za brezplačno, široko uporabljeno programsko opremo, iz katere je mogoče izvoziti ustvarjene modele in jih nato uporabiti skoraj povsod z uporabo knjižnice Orange python (Demšar J, Curk T, Erjavec A, Gorup C, Hočevar T, Milutinović M, Možina M, Polajnar M, Toplak M, Starič A, Štajdohar M, Umek L, Žagar L, Zbontar J, Žitnik M, Zupan B (2013) Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research 14 (avgust): 2349−2353. http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf). To nam omogoča, da algoritem za napovedovanje enostavno integriramo v spletno mesto in mobilno aplikacijo ter ga naredimo javno dostopnega.

Na naslednji sliki je vizualizacija projekta v programski opremi Orange za podatkovno rudarjenje.

Rezultati evaluacije

Ta razdelek predstavlja oceno treh različnih modelov strojnega učenja: naključni gozd, naivni Bayes in odločitveno drevo. Modeli so bili ocenjeni z različnimi merili uspešnosti, da bi ugotovili njihovo primernost za uporabo.


Uporabljeni podatki

Za testne podatke smo zbrali majhno število realnih bolnikovih s pripadajočimi simptomi in boleznijo. Poudariti je treba, da med procesom učenja pri gradnji modelov umetne inteligence niso bili uporabljeni testni podatki.


Tehnike vrednotenja

Uporabili smo tehnike navzkrižnega vrednotenja in naključnega vzorčenja za testiranje uspešnosti različnih modelov. Kombinacija navzkrižnega vrednotenja in naključnega vzorčenja omogoča celovito oceno uspešnosti modelov strojnega učenja. Ta pristop dvojnega vrednotenja zagotavlja temeljito razumevanje delovanja modela v različnih scenarijih.


Tehnike navzkrižnega vrednotenja in postavitev vzorcev

Navzkrižno vrednotenje

  • Število podmnožic podatkov: 5
  • Stratificiranje: Vključeno (zagotavlja, da ima vsaka podmnožica podatkov podobno porazdelitev razredov)

Naključno vzorčenje

  • Število ponovitev učenja/testiranja: 10
  • Velikost učne množice: 66%
  • Stratificiranje: Vključeno
Merila vrednotenja
  1. AUC (Area Under Curve): meri sposobnost modela za razlikovanje med razredi.
  2. CA (Classification Accuracy): Razmerje med pravilno predvidenimi primeri in skupnim številom primerov.
  3. F1 Score: Harmonična sredina natančnosti in priklica.
  4. Precision: Razmerje med pravilno napovedanimi pozitivnimi opazovanji in skupnimi predvidenimi pozitivnimi rezultati.
  5. Recall: Razmerje med pravilno napovedanimi pozitivnimi opazovanji in vsemi opazovanji v dejanskem razredu.
  6. MCC (Matthews Correlation Coefficient): Merilo kakovosti binarnih klasifikacij.
Uspešnost modelov

Spodaj je tabela, ki povzema rezultate ocenjevanja treh modelov strojnega učenja: naključni gozd, naivni Bayes in odločitveno drevo.

Merilo/model Naključni gozd Naivni Bayes Odločitveno drevo
AUC 1.000 0.998 0.802
CA 0.952 0.857 0.571
F1 0.937 0.825 0.500
Precision 0.929 0.810 0.468
Recall 0.952 0.857 0.571
MCC 0.952 0.854 0.559

Ta tabela zajema uspešnost vsakega modela v ključnih merilih vrednotenja, uporabljenih v projektu DESSEV. Primerjava modelov s krivuljo Area Under ROC kaže, da je model naključni gozd boljši, sledi naivni Bayes, pri čemer je odločitveno drevo najmanj učinkovito.


Ker je model naključni gozd najuspešnejši, smo ga uporabili za napovedovanje bolezni na našem spletnem mestu in v mobilni aplikaciji.

sl_SISlovenian
Scroll to Top