Magnet.me  -  Het slimme netwerk waarop hbo‑ en wo‑studenten hun baan of stage vinden.

Het slimme netwerk waarop hbo‑ en wo‑studenten hun baan of stage vinden.

Deze vacature is verlopen. Je kunt daarom niet meer liken of solliciteren.

Vergelijkbare vacatures bekijken

Stage: Automatic Machine Learning

Geplaatst 25 mrt. 2024
Werkervaring
0 tot 1 jaar
Full-time / part-time
Full-time
Functie
Soort opleiding
Taalvereiste
Nederlands (Vloeiend)

Je carrière begint op Magnet.me

Maak een profiel aan en ontvang slimme aanbevelingen op basis van je gelikete vacatures.

Zoek jij een uitdagende stage bij een bedrijf waar jij je zo goed mogelijk kan ontwikkelen? Welkom bij ChipSoft! Voor onze vestiging in Heerenveen zoeken wij studenten die het leuk vinden om door middel van onderzoek een product te bouwen op het gebied van zorg-ICT.

Aanleiding

Er zijn veel verschillende machine learning modellen die voor dezelfde doeleinden gebruikt kunnen worden. Momenteel wordt er gebruik gemaakt van onder andere Random Forest, lineaire regressie en beslisbomen.

Probleemstelling

Door de grote hoeveelheid van modellen en wellicht beperkte aanwezigheid van kennis kan een suboptimaal wiskundig machine learning model worden gekozen. Naast deze problemen zou het ook klantafhankelijk kunnen zijn welk machine learning model goed bij hun data past voor bijvoorbeeld een opnameduurvoorspelling.

Doelstelling

Het doel van deze opdracht is onderzoek doen naar/en het ontwikkelen van een systeem dat automatisch het juiste machine learning model kiest voor een vraagstuk zoals de operatieduur, opnameduur en radiologieduur.

Beoogd product

Een onderzoek en script waarmee automatisch het juiste machine learning model kan worden gekozen om zo tot de beste resultaten te komen. Vanuit het onderzoek kan geadviseerd worden bij wie de keuze tot een goed model hoort te liggen (klant of intern) en hoe de werking kan worden uitgelegd aan de klant.

Vraagstelling

Hoofdvraag: Hoe kan er een systeem worden gemaakt die automatisch het beste machine learning model kiest voor een bepaald probleem (zoals classificatie/regressieproblemen)

  • Welke (soort) machine learning modellen zijn er?
  • Welke verschillen zijn er tussen de machine learning modellen (qua input van data, etc)?
  • Wat hebben de verschillende modellen nodig om te kunnen draaien?
  • Hoe kan ervoor gezorgd worden dat verschillende modellen automatisch worden getraind?
  • Hoe kan het beste model gekozen worden (beoordelen van kwaliteit)?
  • Wanneer zou de keuze voor een model moeten worden gemaakt?
  • Wat zijn de voor- en nadelen van automatic machine learning?
  • Hoe is de performance van automatic machine learning in vergelijking met de bestaande modellen (denk hierbij aan trainsnelheid en nauwkeurigheid)?

Onderzoeksmethoden

Er zijn verschillende machine learning modellen die automatisch zouden kunnen worden getraind. Ook is er een voorbeeld aanwezig van een dergelijke automatic machine learning model.

Er zijn verschillende modelleringstechnieken voor het vinden van een voorspellingsmodel. De onderstaande methodes zijn mogelijk voor een regressie- of classificatieprobleem.

  • Random Forest
  • Neurale Netwerken
  • XGBoost
  • Generalized Linear Models

Random Forest

Random Forest is een Machine Learning algoritme dat uit verschillende beslisbomen bestaat. Het aantal beslisbomen wordt zelf bepaald. De beslisbomen worden op een willekeurig deel van de data getraind. Het algoritme kan voor veel doeleinden gebruikt worden waaronder het schatten van kansen op gebeurtenissen. Het opsporen van patronen, of in de classificatie van verbanden, of in kenmerken in een dataset.

Neurale Netwerken

Een neurale netwerk is een leermodel dat gebaseerd is op het brein. In een neuraal netwerk bevinden zich neuronen die input inlezen, verwerken en genereren van output. Een netwerk van veel verbonden neuronen kunnen verbanden leggen, waardoor een neuraal netwerk bijzonder intelligent gedrag kan vertonen. Over het algemeen bestaat een neuraal netwerk uit meerdere lagen met neuronen. Een neuraal netwerk leert door betrouwbare data in het neuraal netwerk te stoppen en vervolgens met behulp van backpropagation de gewichten en drempels aan te passen.

XGBoost

XGBoost is een Machine Learning algoritme dat net als Random Forest uit verschillende beslisbomen bestaat. De beslisbomen worden op een willekeurig deel van de data getraind en vervolgens verbetert met een methode genaamd boosting. XGboost kan voor dezelfde doeleinden worden gebruikt als Random Forest

Generalized Linear Models

De bekendste regressiemodel uit de familie van generalized linear models (GLM) is de lineaire regressie. Regressieanalyse in een statistische analysemethode om de relatie tussen variabelen te schatten. Als er meerdere voorspellers de duur moeten voorspellen dan spreken we van meervoudige lineaire regressie. GLM kan voor verschillende verdelingen de relatie tussen de variabelen inschatten en daardoor preciezer inspelen op de dataset.

Beschikbare informatie

Er is beschikking over data vanuit voorgaande modellen samen met kennis over deze betreffende modellen. Voorbeelden hiervan zijn de operatieduurvoorspelling, opnameduurvoorspelling of de radiologieduurvoorspelling. Ook is er literatuur beschikbaar over het automatisch laten trainen van machine learning modellen (H2O link)

Software

De software die gebruikt kan worden bij ChipSoft en relevant zijn voor het onderzoek zijn voornamelijk R en SQL.

Wij zoeken

Derdejaars Studenten Toegepaste Wiskunde (HBO)

Wij bieden

  • Een riante vergoeding met uitzicht op een vaste baan
  • Een uitgebreide kennismaking met de meest uiteenlopende methodes en ontwikkeltools binnen de zorg-ICT en onze programmeer- en dataomgeving
  • Uitgebreide interne opleidingsmogelijkheden via onze eigen ChipSoft Academy daarnaast is het ook mogelijk om externe opleidingen te volgen.
  • Veel sociale activiteiten denk aan: bedrijfshockey/voetbal team, squashtoernooien, wielrentochten, get together workshops, bedrijfsbarbecues, CS-Bios en natuurlijk de maandelijkse bedrijfsborrel.
  • Veel vrijheid en verantwoordelijkheid in het uitvoeren van je werkzaamheden
  • Goede werk/privé balans

Zorgprofessionals ondersteunen met de beste zorg-ICT. Dat is wat we bij ChipSoft doen. Onze software zorgt ervoor dat iedereen in de zorg zich volledig kan richten op zijn belangrijkste taak. Met gebruiksvriendelijke oplossing, HiX en Zorgplatform, ondersteunen we zorgprofessionals bij elk denkbaar werkproces in de zorgketen. En die oplossingen perfectioneren en vernieuwen we iedere dag.

ICT
Amsterdam
Actief in 2 landen
1.000 medewerkers
50% mannen - 50% vrouwen
Gemiddeld 32 jaar oud

Dit zeggen medewerkers

Jeroen van der Aa

Product Specialist Eerstelijn

Jeroen van der Aa

Iedere dag breng ik mijn enthousiasme over ons product over op zorgverleners en IT-professionals. Dat enthousiasme komt o.a. doordat ons product hen helpt hun werk beter te doen, waardoor de zorg in Nederland verbetert. De aangename sfeer die er bij ons heerst laat je helemaal thuis voelen!

Anouar El Abdellaoui

.Net Developer

Anouar El Abdellaoui

Aan alles merk je dat ChipSoft een grote organisatie is, maar intern voelt het aan als een familiebedrijf. Je krijgt veel ruimte en mogelijkheden om jezelf te ontwikkelen en iedereen staat open voor nieuwe ideeën rondom de zorg-ICT. Fijn gevoel om op die manier iets toe te kunnen voegen aan de zorg.