Compleet 100%

Federated learning

210008

17/09/2020

Opdrachtgever

dHealth

Omschrijving

Compleet 25%

Onderzoek naar het gebruik van federated learning (FL) methoden voor het trainen van AI als mogelijke oplossing om het verwerken en uitwisseling van gevoelige informatie te beperken en tegelijkertijd algoritmes te kunnen trainen op basis van een grote hoeveelheid representatieve data

Doelstelling

Compleet 50%

Het doel van deze dHealth use case is om FL methodes toe te passen en te kijken naar de kwaliteit van de resulterende algoritmes t.o.v. traditioneel gecentraliseerde training methodes. Op basis hiervan zullen de dHealth partners veel leren over de technisch haalbaarheid, voordelen en beperkingen van FL als oplossing om innovatie mogelijk te maken maar tegelijk de veiligheid van patiëntdata te garanderen.

Aanleiding

Compleet 25%

Federated learning is een veelbelovende methode voor het trainen van machine learning algoritmes zonder eerst alle training data gecentraliseerd te verzamelen. Omdat gecentraliseerde data verzameling veel technische, juridische en organisatorische uitdagingen met zich meebrengt kan het beter zijn – of soms enkel mogelijk zijn – om training data in afzonderlijk (lokale) datasets te houden. Een voorbeeld hiervan is het behouden van patiënt data lokaal bij een ziekenhuis en deze data te gebruiken om lokaal een  machine learning classifier te trainen voor computer aided diagnosis. Deze use case draagt bij aan de dHealth WP2 & 3 onderwerpen uitwisseling van data, dataportabiliteit en verwerken van persoonsgegevens. De uitkomsten zullen mogelijk ook toepasbaar zijn om federated analysis software.

Resultaten

Compleet 25%

Een rapport over de technische haalbaarheid, voordelen en beperkingen van FL als oplossing om de veiligheid van patiëntdata te garanderen. Dit rapport wordt opgesteld aan de hand van technische resultaten uit onderzoek naar en het ontwikkelen van FL oplossingen.

Financiering

Compleet 50%

Dit project zou uitgevoerd kunnen worden door b.v. een ZiuZ onderzoeker samen met een DASH onderzoeker onder de vlag van het dHealth project. De twee onderzoekers zouden in parallel FL methodes toe kunnen toepassen op twee verschillende datasets en inzichten uitwisselen. Geschat op circa 0.5fte totaal.

Bereik

Compleet 45%
  • Stakeholders:
    -onderzoekers en data scientists die zich bezig houden met het gebruiken van geannoteerde (patiënt)data om ML algoritmes te trainen
    -artsen en medische specialisten die gebruik kunnen maken van algoritmes getraind op patiëntdata om een hoger niveau van zorg te kunnen bieden
    -Zorg-IT specialisten die verantwoordelijk zijn voor het implementeren van veilige oplossingen voor het uitwisselen van (patiënt)data
  • Dit project is verwant aan de “centrale dataverzameling” use case waarin we kijken naar het alternatief: een veilige manier om patiëntdata centraal te verzamelen

Randvoorwaarden

Compleet 100%

We zijn van plan om met zowel echte geanonimiseerde patiëntdata te werken als met andere datasets. In beide gevallen zal de data reeds beschikbaar zijn als één dataset die we vervolgens kunnen verdelen en alloceren aan kleinere afzonderlijk datasets. Zo kunnen we de resultaten van centraal vs. FL vergelijken. Eventueel wordt er gekeken maar meerdere manieren om FL algoritmes te trainen.

Belangrijkste risico’s:

  • De hoeveelheid beschikbare geanonimiseerde patiëntdata is voldoende om methodes toe te passen
  • In het geval dat we POLAR data gebruiken moeten we toestemming verkrijgen van de POLAR partners om het voor deze dHealth use case te gebruiken
Partners dhealth
In samenwerking met: