Partners dhealth
Onderzoek naar het gebruik van federated learning (FL) methoden voor het trainen van AI als mogelijke oplossing om het verwerken en uitwisseling van gevoelige informatie te beperken en tegelijkertijd algoritmes te kunnen trainen op basis van een grote hoeveelheid representatieve data
Het doel van deze dHealth use case is om FL methodes toe te passen en te kijken naar de kwaliteit van de resulterende algoritmes t.o.v. traditioneel gecentraliseerde training methodes. Op basis hiervan zullen de dHealth partners veel leren over de technisch haalbaarheid, voordelen en beperkingen van FL als oplossing om innovatie mogelijk te maken maar tegelijk de veiligheid van patiëntdata te garanderen.
Federated learning is een veelbelovende methode voor het trainen van machine learning algoritmes zonder eerst alle training data gecentraliseerd te verzamelen. Omdat gecentraliseerde data verzameling veel technische, juridische en organisatorische uitdagingen met zich meebrengt kan het beter zijn – of soms enkel mogelijk zijn – om training data in afzonderlijk (lokale) datasets te houden. Een voorbeeld hiervan is het behouden van patiënt data lokaal bij een ziekenhuis en deze data te gebruiken om lokaal een machine learning classifier te trainen voor computer aided diagnosis. Deze use case draagt bij aan de dHealth WP2 & 3 onderwerpen uitwisseling van data, dataportabiliteit en verwerken van persoonsgegevens. De uitkomsten zullen mogelijk ook toepasbaar zijn om federated analysis software.
Een rapport over de technische haalbaarheid, voordelen en beperkingen van FL als oplossing om de veiligheid van patiëntdata te garanderen. Dit rapport wordt opgesteld aan de hand van technische resultaten uit onderzoek naar en het ontwikkelen van FL oplossingen.
Dit project zou uitgevoerd kunnen worden door b.v. een ZiuZ onderzoeker samen met een DASH onderzoeker onder de vlag van het dHealth project. De twee onderzoekers zouden in parallel FL methodes toe kunnen toepassen op twee verschillende datasets en inzichten uitwisselen. Geschat op circa 0.5fte totaal.
We zijn van plan om met zowel echte geanonimiseerde patiëntdata te werken als met andere datasets. In beide gevallen zal de data reeds beschikbaar zijn als één dataset die we vervolgens kunnen verdelen en alloceren aan kleinere afzonderlijk datasets. Zo kunnen we de resultaten van centraal vs. FL vergelijken. Eventueel wordt er gekeken maar meerdere manieren om FL algoritmes te trainen.
Belangrijkste risico’s:
Eyssoniusplein 18, 9714 CE Groningen The Netherlands
email | +31614977343