Your career starts on Magnet.me
Create a profile and receive smart job recommendations based on your liked jobs.
Python notebooks wordt veel gebruikt, maar heeft veel nadelen. Onderzoek tijdens deze opdracht aan de hand van best-practices hoe je met Python op Apache Spark ETL jobs kan maken. Het resultaat van deze opdracht gaat medebepalen of we afscheid gaan nemen van Python notebooks.
Data engineers werken met verschillende tools om systemen te bouwen die ruwe data verzamelen, beheren en transformeren in bruikbare informatie. Databricks en Azure Synaps Analytics zijn voorbeelden van relatief nieuwe oplossingen die veel gebruikt worden in een cloud-based data platform. Development wordt binnen deze oplossingen gedaan met notebooks. Een notebook is een web-based interface voor een document met uitvoerbare code, visualisaties en documentatie. Het werken met notebooks biedt zeker voordelen. Lokale installaties zijn bijvoorbeeld overbodig, je kan documentatie en code mixen en je hebt built-in support voor visualisaties. Er zijn echter ook nadelen. Voorbeelden daarvan zijn:
Kortom, het volledig toepassen van DevOps principes (automatisering, monitoring, testen, deployment) zoals dat kan bij een reguliere software applicatie is niet mogelijk wanneer enkel gewerkt wordt met notebooks.
Onderzoek hoe je op basis van best-practices met Python op Apache Spark ETL jobs kan maken, zodat we afscheid kunnen nemen van onze huidige werkwijze met Python notebooks. Denk hierbij aan oplossingen voor vragen als:
Maak vervolgens op basis van een praktijkcase een Proof of Concept om te bewijzen dat de onderzochte concepten werken. Beschrijf tot slot de werkwijze en geef een advies hoe we onze bestaande notebooks kunnen omzetten naar jobs.
Uiteraard bieden we je een uitstekend pakket aan afstudeervoorwaarden met verschillende keuzemogelijkheden. Denk hierbij aan:
Tijdens je afstudeerstage word je opgenomen in een van onze business units. Zo krijg je direct een goed beeld van de ontwikkelingen binnen onze projecten.
Daarnaast biedt Info Support jou:
Over Info Support
Info Support is specialist in maatwerksoftware, data/AI solutions, beheer en trainingen en actief in de sectoren Finance, Industry, Agriculture, Food & Retail, Mobility & Public en Healthcare. Wij bieden solide en innovatieve oplossingen voor complexe en bedrijfkritische softwarevraagstukken. Onze hoofdkantoren zijn gevestigd in Veenendaal (NL) en Mechelen (BE). Op dit moment zijn er circa 500 medewerkers bij Info Support in dienst.
De werkwijze van Info Support kenmerkt zich door een aantal kernwaarden: soliditeit, integriteit, vakmanschap en passie. Deze kernwaarden zijn verweven in ons werk en de manier waarop we met elkaar omgaan. Ook dit jaar zijn we uitgeroepen tot Top Employer Nederland!
Om te zorgen dat alle medewerkers altijd op de hoogte kunnen zijn van de nieuwste ontwikkelingen beschikt Info Support over een inhouse kenniscentrum waar graag wordt voldaan aan de honger naar meer of andere kennis en vaardigheden.
B2-taalvaardigheid in het Nederlands is vereist.
Maatwerksoftware bouwen waar miljoenen mensen dagelijks gebruik van maken. Dat is ons werk. Voor grote gerenommeerde klanten in Nederland en België. Betrouwbaar, schaalbaar en onderhoudbaar. Wij gaan voor software oplossingen van zeer hoge kwaliteit. Binnen de afgesproken tijd en het budget.
Door samen continu te vernieuwen helpen we klanten en de wereld significant vooruit. Onze ambitie en drive maakt ons vastberaden om topkwaliteit te leveren en voorop te lopen. Can you do IT?
Change language to: Dutch
This page is optimised for people from the Netherlands. View the version optimised for people from the UK.