Baza danych

Baza wiedzy w postaci
“IF … THEN …” rules base
które można łatwo zaimplementować w systemie wspomagania decyzji.

Selekcja chorób

Opierając się na aktualnych statystykach i danych z wiodących organizacji zdrowotnych, takich jak Światowa Organizacja Zdrowia (WHO, https://www.cdc.gov/nndss/index.html dostęp dnia 23 lutego 2024 r.) Globalne Obserwatorium Zdrowia (GHO), Centrum Kontroli i Zapobiegania Chorobom (CDC, https://www.cdc.gov/nndss/index.html, dostęp dnia 23 lutego 2024 r.) Krajowy System Nadzoru Nad Chorobami Wymagającymi Zgłaszania (NNDSS) oraz Europejskiego Centrum Zapobiegania i Kontroli Chorób (ECDC, https://atlas.ecdc.europa.eu/public/index.aspx dostęp dnia 23 lutego 2023 r.) za pośrednictwem Atlasu Nadzoru Chorób Zakaźnych zidentyfikowaliśmy 22 choroby do skoncentrowanej analizy i monitorowania w ramach tego projektu. Choroby te zostały wybrane na podstawie ich znaczącego wpływu na zdrowie na świecie, ich rozpowszechnienia i trendów zaobserwowanych w ostatnich danych, zapewniając w ten sposób, że nasz system jest przygotowany do obsługi chorób zakaźnych, które stanowią zagrożenie dla operacji morskich.

Lista wybranych schorzeń

Ospa wietrzna

Świnka

Chikungunya

Norowirus

Cholera

Krztusiec

COVID-19

Wścieklizna

Dengue

Różyczka

Błonica

Tężec

Choroba wirusowa Ebola

Gruźlica

Mononukleoza zakaźna

Dur brzuszny i gorączka paratyfusowa

Influenza

Wirusowe zapalenie wątroby typu A

Malaria

Żółta gorączka

Choroba meningokokowa

Zika

Pozyskiwanie wiedzy medycznej

W pierwszej kolejności zidentyfikowano odpowiednią literaturę dotyczącą wybranych chorób, kryteria diagnostyczne dla różnych infekcji oraz wytyczne dotyczące diagnozowania chorób zakaźnych. Literatura obejmuje międzynarodowe recenzowane artykuły, raporty online, komentarze, artykuły redakcyjne, książki elektroniczne i komunikaty prasowe z uniwersytetów i instytucji badawczych, które zawierają opinie ekspertów. Uwzględniono również szarą literaturę opublikowaną przez WHO, amerykańskie Centra Kontroli i Zapobiegania Chorobom (CDC) oraz inne lokalne publikacje rządowe i punkty informacyjne. Badane bazy danych obejmowały PubMed, Google Scholar, Embase, Medline i Science Direct.

Ospa wietrzna: objawy i powikłania u dorosłych Abro AH, Ustadi AM, Das K, Abdou AM, Hussaini HS, Chandra FS.
Objawy kliniczne, powikłania i leczenie zakażenia ospą wietrzną u dzieci i młodzieży Bereda G. 
Obraz kliniczny ospy wietrznej Anthony J Papadopoulos, MD
Interna Szczeklika 2022 Group work
Przewlekły ból stawów 3 lata po zakażeniu wirusem Chikungunya w dużej mierze charakteryzujący się nawracającymi objawami Sarah R. Tritsch, Liliana Encinales, Nelly Pacheco, i in. 
Przejawy nietypowych objawów Chikungunya podczas epidemii w Dhace (2017) w Bangladeszu Deeba IM, Hasan MM, Al Mosabbir A, Siam MHB, Islam MS, Raheem E, Hossain MS.
Przegląd infekcji wirusem Chikungunya: Od epidemiologii do najnowocześniejszych modeli eksperymentalnych Constant LEC, Rajsfus BF, Carneiro PH, Sisnande T, Mohana-Borges R and Allonso D
Wirus chikungunya: Ogólny przegląd K.A. Galán-Huerta, A.M. Rivas-Estilla, I. Fernández-Salas, J.A. Farfan-Ale, J. Ramos-Jiménez
Choroba wywołana wirusem Chikungunya European Centre for Disease Prevention and Control (ECDC) 2024
Parazytologia medyczna kompendium Morozinska- Gogol
Długotrwały, obejmujący całą społeczność wybuch cholery związany z wodą pitną zanieczyszczoną ściekami w dystrykcie Kasese w zachodniej Ugandzie Kwesiga, B., Pande, G., Ario, A.R. i in. 
Cholera - nowe uderzenie starego wroga Anna Kuna, Michał Gajewski
Cholera Matthew Fanous; Kevin C. King
Czułość, swoistość i użyteczność dla zdrowia publicznego definicji przypadków klinicznych opartych na oznakach i objawach cholery w Afryce Nadri J, Sauvageot D, Njanpop-Lafourcade BM, Baltazar CS i in. 
Arkusz informacyjny na temat COVID-19 European Centre for Disease Prevention and Control (ECDC) 2024
Diagnostyka i leczenie COVID-19: kompleksowy przegląd Pascarella G, Strumia A, Piliego C, Bruno F i in. 
Charakterystyka kliniczna pacjentów z COVID-19, wskaźnik wypisów i wskaźnik śmiertelności w metaanalizie Li L-q, Huang T, Wang Y-q, i in. 
Profil kliniczny gorączki denga w miejskim szpitalu trzeciego stopnia w południowych Indiach Dhivya P., Monica A., Jayaramachandran S.
Denga - jak najlepiej ją sklasyfikować? Anon Srikiatkhachorn, Alan L. Rothman, Robert V. Gibbons i in. 
Gorączka krwotoczna denga - systemowy przegląd literatury dotyczący aktualnych perspektyw patogenezy, zapobiegania i kontroli Wen-Hung Wang, Aspiro Nayim Urbina, Max R. Chang i in. 
Charakterystyka kliniczna i postępowanie w 676 hospitalizowanych przypadkach błonicy, Republika Kirgiska, 1995 r. R. Kadirova, H. Ü. Kartoglu, P. M. Strebel
Corynebacterium Diphtheriae Anmol Chaudhary; Shivlal Pandey
Związek objawów klinicznych choroby wirusowej Ebola ze śmiertelnością: przegląd systematyczny i metaanaliza Harsha Moole , Swetha Chitta , Darlyn Victor i in. 
Objawy kliniczne i diagnostyka laboratoryjna zakażenia wirusem Ebola. Qureshi AI. 
Ponowne pojawienie się gorączki krwotocznej Ebola, Demokratyczna Republika Konga, 1995 r.  Ali S. Khan, F. Kweteminga Tshioko, David L. Heymann i in. 
Ostre i przewlekłe objawy mononukleozy Sanjay Lambore, MB, MSc, James McSherry, MB ChB, and Arthur S. Kraus, ScD
Mononukleoza zakaźna u dzieci - doświadczenie jednego ośrodka Joanna Maria Wrembel, Tomasz Jarmoliński
Objawy kliniczne przewidujące zakażenie grypą Monto AS, Gravenstein S, Elliott M, Colopy M, Schweinle J. 
Biurowe podejście do grypy: Diagnostyka kliniczna i badania laboratoryjne NORMAN J. MONTALTO, D.O.
Malaria wśród podróżnych Patricia Schlagenhauf-Lawlor
Czułość gorączki w diagnostyce klinicznej malarii w kenijskim obszarze niestabilnej, niskiej transmisji malarii. utanda, Albino & Cheruiyot, Priscah & Hodges, James & Ayodo, George & Odero, Wilson & John, Chandy
Malaria kliniczna Plasmodium falciparum w Dielmo, holoendemicznym obszarze w Senegalu: Brak wpływu nabytej odporności na początkową symptomatologię i nasilenie ataków malarii Rogier, Christophe & Ly, Alioune & Adama, Tall & Cissé, Badara & Trape, J.
Inwazyjna infekcja meningokokowa: Analiza 110 przypadków z ośrodka opieki trzeciego stopnia w północno-wschodnich Indiach Dass Hazarika, R., Deka, N.M., Khyriem, A.B. i in.
Jakie wczesne objawy "czerwonej flagi" identyfikują dzieci z chorobą meningokokową w podstawowej opiece zdrowotnej? Tanya Ali Haj-Hassan, Matthew J Thompson, Richard T Mayon-White i in. 
Wirus świnki: Modyfikacja narzędzia Identyfikuj-Isoluj-Informuj dla pracowników służby zdrowia pierwszej linii Koenig KL, Shastry S, Mzahim B, Almadhyan A, Burns MJ. 
Charakterystyka dużej epidemii świnki: Nasilenie kliniczne, powikłania i związek ze statusem szczepień przypadków świnki Stein Zamir, H Schroeder, H Shoob, N Abramson & G Zentner 
Wybuch epidemii świnki i diagnostyka laboratoryjna Mylène Maillet, Eric Bouvat, Nicole Robert i in. 
Ognisko ostrego zapalenia żołądka i jelit związanego z norowirusami w dostawie żywności w Guangzhou w południowych Chinach  Lu Y, Ma M, Wang H, Wang D, Chen C, Jing Q, Geng J, Li T, Zhang Z, Yang Z. 
Wymioty jako objaw i ryzyko transmisji w chorobie norowirusowej: Dowody z badań na ludziach Amy E. Kirby, Ashleigh Streby, Christine L. Moe
Objawy kliniczne norowirusowego zapalenia żołądka i jelit w placówkach opieki zdrowotnej Ben A. Lopman, Mark H. Reacher, Ian B. Vipond, Joyshri Sarangi, David W. G. Brown
Objawy kliniczne zakażenia norowirusem u dzieci w wieku poniżej pięciu lat przyjętych z ostrą biegunką w Surabaya w Indonezji: badanie przekrojowe Fardah Athiyyah A, Shigemura K, Kitagawa K i in. 
Wartość diagnostyczna objawów i danych laboratoryjnych krztuśca u nastolatków i dorosłych pacjentów Miyashita N, Akaike H, Teranishi H, Kawai Y, Ouchi K, Kato T, Hayashi T, Okimoto N.
Krztusiec (koklusz) Centers for Disease Control and Prevention
Częstość występowania krztuśca wśród dorosłych pacjentów z ostrym kaszlem İlbay A, Tanrıöver MD, Zarakol P, Güzelce EÇ, Bölek H, Ünal S. 
Kliniczne aspekty wścieklizny u ludzi w stanie Ceará w Brazylii: przegląd 63 przypadków Duarte NFH, Pires Neto RDJ, Viana VF, Feijão LX, Alencar CH, Heukelbach J. 
Epidemiologiczne i kliniczne cechy przypadków wścieklizny u ludzi na Bali w latach 2008-2010 Susilawathi NM, Darwinata AE, Dwija IB, Budayanti NS i in. 
Wybuch różyczki wśród pracowników trzech małych i średnich przedsiębiorstw związany z importowanym wirusem różyczki o genotypie 1E - Shizuoka, Japonia, 2015 r. Kato H, Kamiya H, Mori Y, Yahata Y, Morino S, Griffith M et al. 
Różyczka (odra niemiecka, odra trzydniowa) Centers for Disease Control and Prevention
Pięcioletni przegląd przypadków tężca u dorosłych leczonych w Szpitalu Uniwersyteckim w Gondar, północno-zachodnia Etiopia (Gondar, wrzesień 2003-sierpień 2008) Tadesse A, Gebre-Selassie S. 
Cechy kliniczne i wyniki leczenia tężca: badanie retrospektywne Fan Z, Zhao Y, Wang S, Zhang F, Zhuang C. 
Tężec Louise Thwaites, MD
Tężec: Występowanie i wyniki u dorosłych.  Younas NJ, Abro AH, Das K, Abdou AMS, Ustadi AM, Afzal S. 
Gruźlica dróg żółciowych: Objawy kliniczne, diagnoza i wyniki u 38 osób dorosłych Mert, A., Bilir, M., Tabak, F., Ozaras, R., Ozturk, R. i in. 
Populacyjne badanie objawów gruźlicy: Jak nietypowe są objawy gruźlicy? Loren G. Miller, Steven M. Asch, Emily I. Yu, Laura Knowles, Lillian Gelberg, Paul Davidson
Oznaki i objawy alarmowe dla wczesnego rozpoznania gruźlicy płuc: analiza pacjentów obserwowanych przez trzeciorzędowy szpital pediatryczny Farina, E., D’Amore, C., Lancella, L. i in. 
Charakterystyka kliniczna i epidemiologiczna pacjentów z HIV/AIDS, u których zdiagnozowano gruźlicę w Integralnej Opiece Szpitala Dziecięcego im. dr Roberta Reida Cabrala w latach 2010-2016 Ricardo Elías-Melgen, Rosa Abreu, Milandres García
Dur brzuszny - epidemia z niezwykle małą liczbą objawów klinicznych Klotz SA, Jorgensen JH, Buckwold FJ, Craven PC.
Aktualne trendy w duru brzusznym Crum, N.F. 
Charakterystyczne cechy gorączki jelitowej z dodatnim wynikiem hodowli w pediatrycznym szpitalu klinicznym w gubernatorstwie Sulaimani Tyib, Tara & Fakhir, Haydar & Mohammad, Hayder
Gorączka jelitowa Basnyat B, Qamar FN, Rupali P, Ahmed T, Parry CM.
Objawy kliniczne wirusowego zapalenia wątroby typu A: najnowsze doświadczenia w szpitalu klinicznym Myron J. Tong, Neveen S. El-Farra, Marianne I. Grew,
Historia naturalna, objawy kliniczne i patogeneza wirusowego zapalenia wątroby typu A Shin EC, Jeong SH
Kliniczne i epidemiologiczne spektrum ostrego wirusowego zapalenia wątroby typu A i E u dzieci: Opisowe, przekrojowe badanie szpitalne Javaria Rasheed, Muhammad Khalid, Sobia Rubab, Bushra Iqbal, Iram Nawaz, Asad Shahzad
Ocena ryzyka żółtej gorączki w ekwadorskiej Amazonii.  Izurieta RO, Macaluso M, Watts DM, Tesh RB, Guerra B, Cruz LM, Galwankar S, Vermund SH
Cechy kliniczne przypadków żółtej febry w Vom Christian Hospital podczas epidemii w 1969 r. na płaskowyżu Jos w Nigerii Evan M Jones and D. C. Wilson
Charakterystyka kliniczna i epidemiologiczna żółtej gorączki w Brazylii: analiza zgłoszonych przypadków w latach 1998-2002 Tuboi, Suely & Costa, Zouraide & Vasconcelos, Pedro & Hatch, Douglas.
Przegląd choroby wirusowej żółtej gorączki McGuinness I, Beckham JD, Tyler KL, Pastula DM.
Wybuch żółtej febry w Kenii: Przegląd Olivier Uwishema, Stanley Chinedu Eneh, Anyike Goodness Chiburoma i in. 
Żółta gorączka Leslie V. Simon; Muhammad F. Hashmi; Klaus D. Torp.
Wirus Zika The Johns Hopkins University
Dane kliniczne, laboratoryjne i wirusologiczne od pacjentów z podejrzeniem ZIKV w endemicznym obszarze arbowirusowym Tatiana Elias Colombo, Cássia Fernanda Estofolete, Andréia Francesli Negri Reis i in. 
Znaczenie kliniczne objawów zakażenia wirusem Zika w kontekście epidemii dengi Humberto Guanche Garcell, Francisco Gutiérrez García, Manuel Ramirez Nodal i in. 
Spektrum kliniczne wirusa Zika u powracających podróżnych Eyal Meltzer, Eyal Leshem, Yaniv Lustig, Giora Gottesman, Eli Schwartz

Każda choroba została następnie opisana za pomocą kilku objawów pogrupowanych w określone 8 kategorii. Przeprowadzono ukierunkowane wywiady z ekspertami medycznymi w celu określenia kluczowych elementów w diagnostyce chorób zakaźnych i ich związku z parametrami podejmowania decyzji klinicznych. Opracowaliśmy tabelę przedstawiającą częstotliwość występowania różnych objawów chorobowych. Każdy wiersz w tabeli odpowiada konkretnej chorobie, a każda kolumna odpowiada konkretnemu objawowi. Przecięcie wiersza i kolumny zawiera częstotliwość lub występowanie określonego objawu dla danej choroby.

Grupy objawów chorób zakaźnych

1. Objawy ogólne/układowe

  • ciągła gorączka lub gorączka występująca w odstępach krótszych niż 1 dzień
  • przerywana gorączka co 2-4 dni
  • senność
  • pocenie się i/lub dreszcze
  • ból głowy
  • brak apetytu i/lub utrata masy ciała

5. Objawy hematologiczne

  • objawy związane z krwawieniem

2. Objawy ze strony układu oddechowego 

  • ból w klatce piersiowej
  • kaszel
  • flegma
  • duszności
  • ból gardła
  • katar

6. Objawy żołądkowe:

  • ból brzucha
  • biegunka
  • nudności
  • wymioty

3. Objawy mięśniowo-szkieletowe

  • ból pleców
  • ból stawów
  • ból mięśni
  • szczękościsk

7. Objawy dermatologiczne lub towarzyszące:

 

  • obrzęk szyi
  • wysypka skórna
  • żółty kolor skóry i/lub ciemny mocz

4. Objawy neurologiczne

  • niewyraźne widzenie
  • trudności poznawcze
  • trudności w połykaniu
  • zawroty głowy
  • emocjonalne pobudzenie
  • problemy neurologiczne związane z czuciem i ruchem
  • drgawki
  • sztywny kark i wrażliwość na światło

8. Inne znaki:

 

  • strach przed wodą
  • ból jąder
  • zaczerwienienie oczu

 

Algorytm predykcji

Celem algorytmu predykcji jest podanie możliwych chorób zakaźnych, na które może cierpieć pacjent, na podstawie jego objawów. Algorytm predykcji musi zostać przeszkolony, a my przeszkoliliśmy go przy użyciu bazy wiedzy o objawach i chorobach zakaźnych. Baza wiedzy o objawach i chorobach zakaźnych została wyrażona w procentach, tj. ilu pacjentów na 100 wyraziłoby określony objaw, gdyby zostali zarażeni określoną chorobą zakaźną. Na podstawie tych danych losowo wygenerowaliśmy setki sztucznych pacjentów z określonymi objawami, ale do wszystkich z nich dotarliśmy z dokładnymi wartościami procentowymi z bazy wiedzy. Np. jeśli w przypadku określonej choroby 25% pacjentów ma objaw 1, 50% z nich objaw 2 i 100% z nich objaw 3, moglibyśmy wygenerować kolejnych 5 pacjentów z tych danych, a ogólne wartości procentowe nadal pasowałyby do danych początkowych. Zastosowaliśmy to podejście losowego generowania sztucznych pacjentów, aby wziąć pod uwagę, że każdy człowiek jest wyjątkowy, więc objawy pojawiające się po zakażeniu są nieco inne dla każdej osoby.
Pacjent Symptom 1 Symptom 2 Symptom 3
1 1 1 1
2 1 1
3 1 1
4 1
5 1 1
6 1
7 1 1
8 1
25% 50% 100%
Wykorzystaliśmy te losowo wygenerowane dane do wytrenowania naszego algorytmu predykcji. W naszym algorytmie predykcji testowaliśmy trzy modele sztucznej inteligencji, aby móc je porównać i wybrać najdokładniejszy: losowy las (ang. random forest), drzewo decyzyjne (ang. decision tree) i naiwny Bayes (ang. naive Bayes). Wszystkie te modele są używane do przewidywania choroby bezpośrednio na podstawie danych objawów. 1. Naiwny model Bayesa (ang. naive Bayes) to klasyfikator, który zakłada, że objawy są warunkowo niezależne, biorąc pod uwagę chorobę docelową. Siła tego założenia (naiwność) jest tym, co nadaje klasyfikatorowi jego nazwę. 2. Model drzewa decyzyjnego (ang. decision tree) jest drzewiastym modelem objawów i ich możliwych chorób, w tym wyników zdarzeń losowych, kosztów zasobów i użyteczności. Każda gałąź reprezentuje wynik testu (czy objaw jest obecny, czy nie), a każdy węzeł liścia reprezentuje chorobę. Na poniższym obrazku znajduje się kompletne drzewo decyzyjne.
decision tree

3. Model losowego lasu (ang. random forest) opiera się na modelu drzewa decyzyjnego, ale w modelu losowego lasu generowany jest las (duża liczba) drzew decyzyjnych, biorąc pod uwagę tylko niektóre objawy dla każdego drzewa decyzyjnego. Wynikiem losowego lasu jest choroba wybrana przez większość drzew decyzyjnych.

Do stworzenia wszystkich trzech modeli wykorzystano oprogramowanie do eksploracji danych Orange. Oprogramowanie do eksploracji danych Orange jest jednym z programów do uczenia maszynowego i eksploracji danych. Użyliśmy go, ponieważ jest to darmowe, szeroko stosowane oprogramowanie, z którego wygenerowane modele można eksportować, a następnie używać niemal wszędzie za pomocą biblioteki Orange Python (Demsar J, Curk T, Erjavec A, Gorup C, Hocevar T, Milutinovic M, Mozina M, Polajnar M, Toplak M, Staric A, Stajdohar M, Umek L, Zagar L, Zbontar J, Zitnik M, Zupan B (2013) Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research 14(Aug): 2349-2353. http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf). Dzięki temu możemy łatwo zintegrować algorytm przewidywania ze stroną internetową i aplikacją mobilną oraz udostępnić go publicznie.

Na poniższym obrazku znajduje się wizualizacja projektu w oprogramowaniu do eksploracji danych Orange.

Wyniki oceny

Ta sekcja przedstawia ocenę trzech różnych modeli uczenia maszynowego: Random Forest, Naive Bayes i Decision Tree. Modele zostały ocenione przy użyciu różnych wskaźników wydajności w celu określenia ich przydatności do wdrożenia.


Wykorzystany zestaw danych

Zebraliśmy niewielką liczbę rzeczywistych objawów i kombinacji chorób pacjentów jako dane testowe. Należy podkreślić, że dane testowe nie były wykorzystywane w procesie uczenia podczas tworzenia tych modeli.


Techniki weryfikacji

W projekcie zastosowano techniki Cross Validation i Random Sampling w celu przetestowania dokładności modeli. Połączenie walidacji krzyżowej i losowego próbkowania ułatwia kompleksową ocenę wydajności modeli uczenia maszynowego. Podejście oparte na podwójnej walidacji zapewnia dogłębne zrozumienie działania modelu w różnych scenariuszach.


Technika walidacji krzyżowej i konfiguracja próbkowania

Walidacja krzyżowa

  • Liczba powtórzeń: 5
  • Rozkład warstwowy: Włączony (zapewnia, że każde miejsce ma podobny rozkład klas)

Losowe próbkowanie

  • Powtórz trening / test: 10 razy
  • Rozmiar zestawu treningowego: 66%
  • Rozkład warstwowy: Włączony
Wskaźniki oceny
  1. AUC (ang. Area Under Curve - pole pod krzywą): Mierzy zdolność modelu do rozróżniania klas.
  2. CA (ang. Classification Accuracy - dokładność klasyfikacji): Stosunek poprawnie przewidzianych przypadków do wszystkich przypadków.
  3. Wynik F1: Średnia harmoniczna precyzji i skuteczności.
  4. Precyzja: Stosunek poprawnie przewidywanych pozytywnych obserwacji do całkowitej liczby przewidywanych pozytywnych obserwacji.
  5. Skuteczność: Stosunek poprawnie przewidzianych pozytywnych obserwacji do wszystkich obserwacji w rzeczywistej klasie.
  6. MCC (ang. Matthews Correlation Coefficient - współczynnik korelacji Matthewsa): Miara jakości klasyfikacji binarnych.
Model wydajności

Poniżej znajduje się tabela podsumowująca wyniki oceny dla trzech modeli uczenia maszynowego: Random Forest, Naive Bayes i Decision Tree.

Metryka Random forest Naive bayes Decision tree
AUC 1.000 0.998 0.802
CA 0.952 0.857 0.571
F1 0.937 0.825 0.500
Precyzja 0.929 0.810 0.468
Skuteczność 0.952 0.857 0.571
MCC 0.952 0.854 0.559

Tabela przedstawia wydajność każdego modelu w kluczowych wskaźnikach oceny stosowanych w projekcie DESSEV. Porównanie modeli według obszaru pod krzywą ROC wskazuje, że model Random Forest jest lepszy, a następnie Naive Bayes, a drzewo decyzyjne jest najmniej skuteczne.


Ponieważ model Random Forest osiąga najlepsze wyniki, jest to model używany do przewidywania chorób na naszej stronie internetowej i w aplikacji mobilnej.

pl_PLPolish
Scroll to Top