Kunskapsbas

Kunskapsbas i form av
“IF … THEN …” rules base
som enkelt kan implementeras i beslutsstödsystem.

Urval av sjukdomar

Baserat på aktuell statistik och data från ledande hälsoorganisationer som Världshälsoorganisationen (WHO), https://www.cdc.gov/nndss/index.html med åtkomst per den 23 februari 2024) genom dess Globala Hälsoobservatorium (GHO), Centers for Disease Control and Prevention (CDC), https://www.cdc.gov/nndss/index.htmlmed åtkomst per den 23 februari 2024) via det nationella systemet för övervakning av anmälningspliktiga sjukdomar (NNDSS), och Europeiska centrumet för förebyggande och kontroll av sjukdomar (ECDC), https://atlas.ecdc.europa.eu/public/index.aspx med åtkomst per den 23 februari 2023) genom dess Övervakningsatlas för smittsamma sjukdomar, har vi identifierat 22 sjukdomar för koncentrerad analys och övervakning inom ramen för detta projekt. Dessa sjukdomar har valts utifrån deras betydande inverkan på global hälsa, deras förekomst och de trender som observerats i nyligen data, vilket säkerställer att vårt system är rustat för att hantera smittsamma sjukdomar som utgör hot mot maritima operationer.

Urvalet av sjukdomar

Vattkoppor

Partit (påssjuka)

Chikungunya

Norovirus (vinterkräksjuka)

Kolera

Kikhosta

COVID-19

Rabies

Dengue

Röda hund

Difteri

Stelkramp

Ebola

Tuberkulos

Mononukleos (körtelfeber)

Tyfoidfeber

Influensa

Hepatit A

Malaria

Gula febern

Meningokockinfektion

Zika

Förvärv av medicinsk kunskap

Relevant litteratur angående valda sjukdomar, diagnostiska kriterier för olika infektioner och riktlinjer för att diagnostisera infektionssjukdomar identifierades först. Litteraturen inkluderar internationella peer-review-artiklar, online-rapporter, kommentarer, ledare, elektroniska böcker och pressmeddelanden från universitet och forskningsinstitutioner, som inkluderar expertutlåtanden. Grå litteratur publicerad av WHO, US Centers for Disease Control and Prevention (CDC) och andra lokala regeringspublikationer och informationskanaler inkluderades också. Forskningsdatabaser som undersöktes inkluderade PubMed, Google Scholar, Embase, Medline och Science Direct.

Chickenpox: presentation and complications in adults Abro AH, Ustadi AM, Das K, Abdou AM, Hussaini HS, Chandra FS.
Clinical manifestations, complications and management of chickenpox infection in pediatric Bereda G. 
Chickenpox Clinical Presentation Anthony J Papadopoulos, MD
Interna Szczeklika 2022 Group work
Chronic Joint Pain 3 Years after Chikungunya Virus Infection Largely Characterized by Relapsing-remitting Symptoms Sarah R. Tritsch, Liliana Encinales, Nelly Pacheco, et al. 
Manifestations of Atypical Symptoms of Chikungunya during the Dhaka Outbreak (2017) in Bangladesh Deeba IM, Hasan MM, Al Mosabbir A, Siam MHB, Islam MS, Raheem E, Hossain MS.
Overview on Chikungunya Virus Infection: From Epidemiology to State-of-the-Art Experimental Models Constant LEC, Rajsfus BF, Carneiro PH, Sisnande T, Mohana-Borges R and Allonso D
Chikungunya virus: A general overview K.A. Galán-Huerta, A.M. Rivas-Estilla, I. Fernández-Salas, J.A. Farfan-Ale, J. Ramos-Jiménez
Chikungunya virus disease European Centre for Disease Prevention and Control (ECDC) 2024
Parazytologia medyczna kompendium Morozinska- Gogol
A prolonged, community-wide cholera outbreak associated with drinking water contaminated by sewage in Kasese District, western Uganda Kwesiga, B., Pande, G., Ario, A.R. et al. 
Cholera — the new strike of an old foe Anna Kuna, Michał Gajewski
Kolera Matthew Fanous; Kevin C. King
Sensitivity, Specificity, and Public-Health Utility of Clinical Case Definitions Based on the Signs and Symptoms of Cholera in Africa Nadri J, Sauvageot D, Njanpop-Lafourcade BM, Baltazar CS et al. 
Factsheet on COVID-19 European Centre for Disease Prevention and Control (ECDC) 2024
COVID-19 diagnosis and management: a comprehensive review Pascarella G, Strumia A, Piliego C, Bruno F et al. 
COVID-19 patients’ clinical characteristics, discharge rate, and fatality rate of meta-analysis Li L-q, Huang T, Wang Y-q, et al. 
Clinical profile of Dengue fever in an urban tertiary care hospital in South India Dhivya P., Monica A., Jayaramachandran S.
Dengue—How Best to Classify It Anon Srikiatkhachorn, Alan L. Rothman, Robert V. Gibbons et al. 
Dengue hemorrhagic fever – A systemic literature review of current perspectives on pathogenesis, prevention and control Wen-Hung Wang, Aspiro Nayim Urbina, Max R. Chang et al. 
Clinical Characteristics and Management of 676 Hospitalized Diphtheria Cases, Kyrgyz Republic, 1995 R. Kadirova, H. Ü. Kartoglu, P. M. Strebel
Corynebacterium Diphtheriae Anmol Chaudhary; Shivlal Pandey
Association of clinical signs and symptoms of Ebola viral disease with case fatality: a systematic review and meta-analysis Harsha Moole , Swetha Chitta , Darlyn Victor et al. 
Clinical Manifestations and Laboratory Diagnosis of Ebola Virus Infection. Qureshi AI. 
The Reemergence of Ebola Hemorrhagic Fever, Democratic Republic of the Congo, 1995  Ali S. Khan, F. Kweteminga Tshioko, David L. Heymann et al. 
Acute and Chronic Symptoms of Mononucleosis Sanjay Lambore, MB, MSc, James McSherry, MB ChB, and Arthur S. Kraus, ScD
Infectious mononucleosis in children – one centre experience Joanna Maria Wrembel, Tomasz Jarmoliński
Clinical Signs and Symptoms Predicting Influenza Infection Monto AS, Gravenstein S, Elliott M, Colopy M, Schweinle J. 
An Office-Based Approach to Influenza: Clinical Diagnosis and Laboratory Testing NORMAN J. MONTALTO, D.O.
Travelers Malaria Patricia Schlagenhauf-Lawlor
Sensitivity of fever for diagnosis of clinical malaria in a Kenyan area of unstable, low malaria transmission. utanda, Albino & Cheruiyot, Priscah & Hodges, James & Ayodo, George & Odero, Wilson & John, Chandy
Plasmodium falciparum clinical malaria in Dielmo, a holoendemic area in Senegal: No influence of acquired immunity on initial symptomatology and severity of malaria attacks Rogier, Christophe & Ly, Alioune & Adama, Tall & Cissé, Badara & Trape, J.
Invasive Meningococcal Infection: Analysis of 110 cases from a Tertiary Care Centre in North East India Dass Hazarika, R., Deka, N.M., Khyriem, A.B. et al.
Which early ‘red flag’ symptoms identify children with meningococcal disease in primary care? Tanya Ali Haj-Hassan, Matthew J Thompson, Richard T Mayon-White et al. 
Mumps Virus: Modification of the Identify-Isolate-Inform Tool for Frontline Healthcare Providers Koenig KL, Shastry S, Mzahim B, Almadhyan A, Burns MJ. 
Characteristics of a large mumps outbreak: Clinical severity, complications and association with vaccination status of mumps outbreak cases Stein Zamir, H Schroeder, H Shoob, N Abramson & G Zentner 
Mumps outbreak and laboratory diagnosis Mylène Maillet, Eric Bouvat, Nicole Robert et al. 
An outbreak of norovirus-related acute gastroenteritis associated with delivery food in Guangzhou, southern China  Lu Y, Ma M, Wang H, Wang D, Chen C, Jing Q, Geng J, Li T, Zhang Z, Yang Z. 
Vomiting as a Symptom and Transmission Risk in Norovirus Illness: Evidence from Human Challenge Studies Amy E. Kirby, Ashleigh Streby, Christine L. Moe
Clinical Manifestation of Norovirus Gastroenteritis in Health Care Settings Ben A. Lopman, Mark H. Reacher, Ian B. Vipond, Joyshri Sarangi, David W. G. Brown
Clinical manifestation of norovirus infection in children aged less than five years old admitted with acute diarrhea in Surabaya, Indonesia: a cross-sectional study Fardah Athiyyah A, Shigemura K, Kitagawa K et al. 
Diagnostic value of symptoms and laboratory data for pertussis in adolescent and adult patients Miyashita N, Akaike H, Teranishi H, Kawai Y, Ouchi K, Kato T, Hayashi T, Okimoto N.
Pertussis (Whooping Cough) Centers for Disease Control and Prevention
Pertussis prevalence among adult patients with acute cough İlbay A, Tanrıöver MD, Zarakol P, Güzelce EÇ, Bölek H, Ünal S. 
Clinical aspects of human rabies in the state of Ceará, Brazil: an overview of 63 cases Duarte NFH, Pires Neto RDJ, Viana VF, Feijão LX, Alencar CH, Heukelbach J. 
Epidemiological and clinical features of human rabies cases in Bali 2008-2010 Susilawathi NM, Darwinata AE, Dwija IB, Budayanti NS et al. 
Rubella outbreak among workers in three small- and medium-size business establishments associated with imported genotype 1E rubella virus-Shizuoka, Japan, 2015 Kato H, Kamiya H, Mori Y, Yahata Y, Morino S, Griffith M et al. 
Rubella (German Measles, Three-Day Measles) Centers for Disease Control and Prevention
Five years review of cases of adult tetanus managed at Gondar University Hospital, North West Ethiopia (Gondar, Sep. 2003-Aug. 2008) Tadesse A, Gebre-Selassie S. 
Clinical features and outcomes of tetanus: a retrospective study Fan Z, Zhao Y, Wang S, Zhang F, Zhuang C. 
Stelkramp Louise Thwaites, MD
Tetanus: Presentation and outcome in adults.  Younas NJ, Abro AH, Das K, Abdou AMS, Ustadi AM, Afzal S. 
Miliary tuberculosis: Clinical manifestations, diagnosis and outcome in 38 adults Mert, A., Bilir, M., Tabak, F., Ozaras, R., Ozturk, R. et al. 
A Population-Based Survey of Tuberculosis Symptoms: How Atypical Are Atypical Presentations? Loren G. Miller, Steven M. Asch, Emily I. Yu, Laura Knowles, Lillian Gelberg, Paul Davidson
Alert sign and symptoms for the early diagnosis of pulmonary tuberculosis: analysis of patients followed by a tertiary pediatric hospital Farina, E., D’Amore, C., Lancella, L. et al. 
Clinical and epidemiological characteristics of HIV/AIDS patients diagnosed with tuberculosis in the Integral Care Service of the Dr. Robert Reid Cabral Children’s Hospital during the period 2010-2016 Ricardo Elías-Melgen, Rosa Abreu, Milandres García
Typhoid FeverAn Epidemic With Remarkably Few Clinical Signs and Symptoms Klotz SA, Jorgensen JH, Buckwold FJ, Craven PC.
Current trends in typhoid fever Crum, N.F. 
Characteristic features of culture positive enteric fever in pediatric teaching hospital in Sulaimani governorate Tyib, Tara & Fakhir, Haydar & Mohammad, Hayder
Enteric fever Basnyat B, Qamar FN, Rupali P, Ahmed T, Parry CM.
Clinical Manifestations Of Hepatitis A: Recent Experience In A Community Teaching Hospital Myron J. Tong, Neveen S. El-Farra, Marianne I. Grew,
Natural History, Clinical Manifestations, and Pathogenesis of Hepatitis A Shin EC, Jeong SH
Clinical and Epidemiological Spectrum of Acute Viral Hepatitis Due to Hepatitis A and E in Children: A Descriptive, Cross-Sectional, Hospital-Based Study Javaria Rasheed, Muhammad Khalid, Sobia Rubab, Bushra Iqbal, Iram Nawaz, Asad Shahzad
Assessing yellow Fever risk in the ecuadorian Amazon.  Izurieta RO, Macaluso M, Watts DM, Tesh RB, Guerra B, Cruz LM, Galwankar S, Vermund SH
Clinical features of yellow fever cases at Vom Christian Hospital during the 1969 epidemic on the Jos Plateau, Nigeria Evan M Jones and D. C. Wilson
Clinical and epidemiological characteristics of yellow fever in Brazil: analysis of reported cases 1998-2002 Tuboi, Suely & Costa, Zouraide & Vasconcelos, Pedro & Hatch, Douglas.
An Overview of Yellow Fever Virus Disease McGuinness I, Beckham JD, Tyler KL, Pastula DM.
Yellow fever outbreak in Kenya: A review Olivier Uwishema, Stanley Chinedu Eneh, Anyike Goodness Chiburoma et al. 
Yellow Fever Leslie V. Simon; Muhammad F. Hashmi; Klaus D. Torp.
Zika Virus The Johns Hopkins University
Clinical, laboratory and virological data from suspected ZIKV patients in an endemic arbovirus area Tatiana Elias Colombo, Cássia Fernanda Estofolete, Andréia Francesli Negri Reis et al. 
Clinical relevance of Zika symptoms in the context of a Zika Dengue epidemic Humberto Guanche Garcell, Francisco Gutiérrez García, Manuel Ramirez Nodal et al. 
The Clinical Spectrum of Zika Virus in Returning Travelers Eyal Meltzer, Eyal Leshem, Yaniv Lustig, Giora Gottesman, Eli Schwartz

Varje sjukdom beskrevs sedan av flera tecken grupperade i åtta specifika kategorier. Målriktade intervjuer genomfördes med medicinska experter för att fastställa de avgörande elementen i diagnosen av infektionssjukdomar och deras relation till kliniska beslutsparametrar. Vi har utvecklat en tabell som representerar frekvenserna av olika sjukdomssymtom. Varje rad i tabellen motsvarar en specifik sjukdom, och varje kolumn motsvarar ett särskilt symtom. Korsningen av en rad och kolumn innehåller frekvensen eller förekomsten av ett specifikt symtom för en särskild sjukdom.

Grupper av symptom på infektionssjukdomar

1. Allmänna / generella tecken:

  • Kontinuerlig feber eller feber med intervall kortare än 1 dag.
  • periodisk feber varannan till var fjärde dag
  • slöhet
  • svettningar och/eller frossa
  • huvudvärk
  • brist på aptit och/eller viktminskning

5. Hematologiska symptom

  • peteckier

2. Andningsrelaterade tecken: 

  • bröstsmärta
  • hosta
  • slem
  • andnöd
  • halsont
  • rinnande näsa

6. Magrelaterade symptom

  • buksmärtor
  • diarré
  • illamående
  • kräkningar

3. Muskuloskeletala tecken:

  • ryggont
  • ledvärk
  • muskelvärk
  • stelkramp

7. Dermatologiskt relaterade tecken:

 

  • svullnad i nacke
  • hudutslag
  • gulnad i huden och/eller mörkt urin

4. Neurologiska tecken:

  • suddig syn
  • kognitiva svårigheter
  • svårt att svälja
  • yrsel
  • känslomässig irritation
  • neurologiska problem med känsel och rörlighet
  • kramper / anfall
  • stel nacke och ljuskänslighet

8. Övriga symptom:

 

  • rädsla för vatten
  • smärta i testiklar
  • ögonrodnad

 

Prediktionsalgoritm

Kunskapsbasen för symtom och smittsamma sjukdomar uttrycktes i procent, det vill säga hur många patienter av 100 som skulle uppvisa ett specifikt symtom när de var infekterade av en specifik smittsam sjukdom. Baserat på dessa data genererade vi slumpmässigt hundratals artificiella patienter med specifika symtom, men vi nådde alla exakt de procentandelar som fanns i kunskapsbasen. Till exempel, om 25 % av patienterna för en specifik sjukdom har symtom 1, 50 % har symtom 2 och 100 % har symtom 3, kunde vi generera följande 5 patienter från dessa data och de övergripande procentandelarna skulle fortfarande stämma överens med de ursprungliga uppgifterna. Vi använde denna metod för att slumpmässigt generera artificiella patienter för att ta hänsyn till att varje människa är unik, så symtomen som uppstår efter infektion är något olika för varje person.
Patient Symptom 1 Symptom 2 Symptom 3
1 1 1 1
2 1 1
3 1 1
4 1
5 1 1
6 1
7 1 1
8 1
25% 50% 100%
Vi använde dessa slumpmässigt genererade data för att träna vår förutsägelsealgoritm. För att kunna jämföra och välja den mest precisa modellen testade vi tre olika AI-modeller: random forest, decision tree och naive Bayes. Dessa modeller används alla för att förutsäga en sjukdom baserat på givna symtom. Naive Bayes-modellen är en klassificerare som förutsätter att symtomen är villkorligt oberoende, givet den specifika sjukdomen. Detta antagande om oberoende, eller "naivitet", ger modellen sitt namn. Decision tree-modellen är en träd-liknande struktur som visar symtom och deras möjliga sjukdomar, inklusive utfall av slumpmässiga händelser, resurskostnader och nytta. Varje gren representerar resultatet av ett test (om ett symtom är närvarande eller inte), medan varje bladnod representerar en potentiell sjukdom. En komplett decision tree visas på följande bild.
decision tree

3. Random forest-modellen är baserad på beslutsträdsmodellen, men i random forest-modellen genereras en skog (ett stort antal) beslutsträd med endast några symtom för varje beslutsträd. Utmatningen från random forest är den sjukdom som väljs av flest beslutsträd.

Orange data mining-programvaran användes för att bygga alla tre modellerna. Orange data mining-programvaran är en av programvarorna för maskininlärning och datautvinning. Vi använde den eftersom det är en gratis, allmänt använd programvara från vilken de genererade modellerna kan exporteras och sedan användas nästan överallt genom att använda ett Orange Python-bibliotek (Demsar J, Curk T, Erjavec A, Gorup C, Hocevar T, Milutinovic M, Mozina M, Polajnar M, Toplak M, Staric A, Stajdohar M, Umek L, Zagar L, Zbontar J, Zitnik M, Zupan B (2013) Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research 14(Aug): 2349−2353. http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf). Detta gör det möjligt för oss att enkelt integrera prediktionsalgoritmen på webbplatsen och mobilappen och göra den tillgänglig för allmänheten.

På följande bild är visualiseringen av projektet i Orange data mining mjukvara.

Utvärderingsresultat

Denna Denna sektion presenterar utvärderingen av tre olika maskininlärningsmodeller: Random Forest, Naive Bayes och Decision Tree. Modellerna bedömdes med hjälp av olika prestandamått för att fastställa deras lämplighet för implementering.


Använt dataset

Vi samlade en liten mängd symtom och sjukdomskombinationer från verkliga patienter som testdata. Det bör betonas att testdatan inte användes under träningsprocessen när dessa modeller byggdes.


Valideringstekniker

Projektet tillämpade teknikerna Korsvalidering och Slumptagning för att testa modellernas noggrannhet. Kombinationen av Korsvalidering och Slumptagning möjliggör en omfattande utvärdering av maskininlärningsmodellernas prestanda. Denna dubbelvalideringsmetod säkerställer en grundlig förståelse för hur modellen presterar under olika scenarier.


Korsvalideringsteknik och Urvalsinställningar

Korsvalidering

  • Antal vikter: 5
  • Stratifiering: Aktiverad (säkerställer att varje viktsättning har en liknande fördelning av klasser)

Slumptagning

  • Upprepa träning/test: 10 gånger
  • Övningsset storlek: 66%
  • Stratifiering: Aktiverad
Utvärderingsmatriser
  1. AUC (Area Under Curve): Mäter modellens förmåga att särskilja mellan klasser.
  2. CA (Classification Accuracy): Förhållandet mellan korrekt förutsagda instanser och totala instanser.
  3. F1 poäng: Det harmoniska medelvärdet av precision och återkallelse.
  4. Precision: Förhållandet mellan korrekt förutsagda positiva observationer och totala förutsagda positiva.
  5. Återkallelse: Förhållandet mellan korrekt förutsagda positiva observationer och alla observationer i den aktuella klassen.
  6. MCC (Matthews Correlation Coefficient): Ett mått på kvaliteten av binära klassificeringar.
Modellens prestanda

Nedan följer en tabell som sammanfattar utvärderingsresultaten för de tre maskininlärningsmodellerna: Random Forest, Naive Bayes och Decision Tree.

Metric Random forest Naive bayes Decision tree
AUC 1.000 0.998 0.802
CA 0.952 0.857 0.571
F1 0.937 0.825 0.500
Precision 0.929 0.810 0.468
Återkallelse 0.952 0.857 0.571
MCC 0.952 0.854 0.559

Denna tabell visar prestandan för varje modell utifrån de nyckelutvärderingsmått som användes i DESSEV-projektet. Jämförelsen av modeller efter Area Under ROC Curve visar att Random Forest-modellen är överlägsen, följd av Naive Bayes, medan Decision Tree är den minst effektiva.


Eftersom random forest-modellen presterar bäst är det random forest-modellen som används för sjukdomsprediktion på vår webbplats och vår mobilapp.

sv_SESwedish
Rulla till toppen