Sztuczna inteligencja w ochronie zdrowia: pacjenci chętni, ale obawiają się o bezpieczeństwo danych
Dane medyczne są bazą, na której szkolą się algorytmy sztucznej inteligencji. W kolejnych latach będą one coraz częściej wykorzystywane w ochronie zdrowia m.in. do automatyzacji diagnostyki, prognozowania wyników czy wspomagania decyzji lekarzy. Aby zbudować solidną bazę takich informacji, potrzebne są jednak chęci i zgody pacjentów na przetwarzanie dokumentacji na cele badawczo-naukowe. Polscy pacjenci są coraz bardziej zainteresowani przekazywaniem swoich danych, przynajmniej w deklaracjach, ale wciąż obawiają się o ich bezpieczeństwo i ryzyko wykorzystania w innych celach niż naukowe.
– Polacy przede wszystkim są chętni, żeby móc zarządzać swoimi danymi, również medycznymi. Widzimy coraz bardziej rosnący megatrend polegający na tym, żeby móc decydować o tym, co się dzieje z naszymi danymi. To samo dzieje się w sektorze ochrony zdrowia. Bazując na ostatnich wynikach ankiety Fundacji My Pacjenci z listopada 2022 roku, ponad 70 proc. pacjentów chciałoby zarządzać swoimi danymi – informuje w rozmowie z agencją Newseria Innowacje Ligia Kornowska, dyrektor zarządzająca Polskiej Federacji Szpitali, prezes Fundacji Podaruj Dane.
Zarządzanie danymi medycznymi staje się łatwiejsze dzięki kolejnym usługom e-Zdrowia. Poprzez Internetowe Konto Pacjenta można udostępniać dane o zdarzeniach medycznych lekarzowi, pielęgniarce, przychodni lub aptece. Jest to istotne ułatwienie, które pomaga wyeliminować niebezpieczne sytuacje, wynikające chociażby z interakcji między lekami ordynowanymi przez różnych lekarzy.
Dane medyczne są jednak cenne również w procesie opracowywania nowych terapii.
– Mamy różne statystyki, które pokazują, że między 50 a 77 proc. pacjentów chciałoby takie dane przekazać na cel badawczo-naukowy. Już mieliśmy okazję przeprowadzić pilotażową kampanię Idei Dawstwa Danych Medycznych i udało nam się osiągnąć wskaźnik 31 proc. pacjentów, którzy rzeczywiście wyrazili zgodę na przekazanie swoich danych medycznych na cele badawczo-rozwojowe – podaje Ligia Kornowska.
Aby zostać dawcą danych medycznych, należy wypełnić specjalny formularz i udzielić niezbędnych zgód. Cały proces jest realizowany online. Dane zostają udostępnione przez placówki medyczne, a następnie są anonimizowane i przekazywane ośrodkom badawczym.
Stosowany przez Fundację Podaruj Dane system IT – zwany Data Lake – wykorzystuje technologię rozproszonej bazy danych (blockchain) do odnotowywania informacji o tym, co się dzieje z danymi pacjenta. Przekazanie ich instytucjom badawczo rozwojowym jest możliwe wyłącznie po kompletnej anonimizacji, czyli po usunięciu wszystkich informacji, które mogłyby wskazywać konkretną osobę. System jest na bieżąco monitorowany przez firmy od cyberbezpieczeństwa i regularnie przechodzi testy penetracyjne.
– Największą obawą związaną z jakimkolwiek wykorzystaniem danych medycznych czy innych jest, po pierwsze, cyberbezpieczeństwo tych danych i pewność, że one nie wyciekną nigdzie np. w postaci niezanonimizowanej, czyli z imieniem i nazwiskiem konkretnego pacjenta. Nawet jeśli mówimy o danych anonimowych, to musimy pamiętać, że w sektorze zdrowia również one mogą nieść pewną wrażliwość, np. na podstawie kodu pocztowego była dostosowana cena ubezpieczenia dla pacjenta ubezpieczenia zdrowotnego. Dlatego kolejną wątpliwością pacjentów jest to, że dane mogą być wykorzystane przeciwko nim – nie w celach pozytywnych dla pacjenta, w tych celach rozwoju medycyny – wyjaśnia prezeska Fundacji Podaruj Dane.
W ramach systemu blockchain każda operacja pobrania i przekazania danych jest odnotowana, co pozwala sprawdzić pacjentom, jakie informacje na ich temat trafiają do instytucji badawczo-rozwojowych. Zgoda może także zostać w każdej chwili wycofana.
– Gromadzenie danych to faktycznie jest dopiero początek drogi. Po tym, jak mamy prawo dostępu do tych danych, musimy je, po pierwsze, zanonimizować, czyli usunąć wszelkie wskaźniki, które mogłyby kierować te dane do konkretnego pacjenta. Następnie, jak już mamy anonimowy rekord danych czy set danych, musimy te dane wyczyścić i przygotować do wykorzystania w procesach np. nauki algorytmów sztucznej inteligencji – wyjaśnia Ligia Kornowska.
Informacje takie jak historia leczenia, parametry życiowe, opisy i zdjęcia z badań obrazowych czy wyniki badań laboratoryjnych pozwalają doskonalić algorytmy uczenia maszynowego. Dzięki temu lekarze zyskują dostęp do coraz dokładniejszych narzędzi wspierających ich w diagnostyce. Sztuczna inteligencja może przeanalizować dane z prędkością nieosiągalną dla lekarza i postawić wstępną diagnozę, którą lekarz może potem potwierdzić lub zanegować.
– Musimy zadbać także o interoperacyjność i porównywalność tych danych. Niektóre dane faktycznie już teraz mają określony jednolity standard na całym świecie. Na przykład badania obrazowe mają określony format DICOM, również nawet jeśli chodzi o dokumentację medyczną w Polsce, pewne dane są ustrukturyzowane, zesłownikowane, one również są łatwiejsze do porównania. Natomiast na pewno wyzwaniem będzie ustrukturyzowanie notatek lekarskich i słowa pisanego, które jest umieszczone np. w kartach wypisowych – przyznaje prezeska Fundacji Podaruj Dane.
Nad modelami językowymi pozwalającymi przetwarzać język naturalny, który można znaleźć np. w kartach wypisowych, na dane użyteczne dla algorytmów pracują obecnie naukowcy z całego świata. Jednym z takich modeli jest opisany w czasopiśmie „npj Digital Medicine” GatorTron, bazujący na notatkach lekarzy ze szpitala uniwersyteckiego w amerykańskim stanie Floryda. Modele GatorTron zwiększają zasób języka klinicznego ze 110 mln do 8,9 mld rekordów. Język ten ma być użyteczny właśnie w medycznych systemach sztucznej inteligencji.
Źródło: newseria.pl