Een praktische gids voor data-analisten en marketeers.

Voor een data-analist of marketeer zijn spreadsheets waarschijnlijk niets nieuws. De kans is zeer groot dat je dagelijks met spreadsheets te maken hebt. De hoeveelheid data die beschikbaar is van de verschillende marketingplatforms is overweldigend, maar voordat iemand er enig inzicht uit kan halen moeten de data worden opgeschoond en verwerkt.

Het meest gebruikte hulpmiddel voor gegevensverwerking en -analyse is Microsoft Excel. Hoewel Excel een handig hulpmiddel kan zijn voor analyses, is het vaak tijdrovend om gegevens op te schonen en te analyseren. Vooral wanneer dezelfde acties moeten worden uitgevoerd op elk gedownload rapport. Om nog maar te zwijgen over de frustraties bij het kopiëren en plakken van formules naar andere cellen of het per ongeluk klikken op een cel. Dit leidt allemaal tot onnauwkeurigheden, wat bedrijven miljoenen aan inkomsten kan kosten. Het is geen verrassing dat veel data-analisten en anderen die met data werken zijn overgestapt op betere alternatieven, zoals R.

Wat is R?

R is een programmeertaal die gespecialiseerd is in het opschonen van gegevens. Het wordt veel gebruikt door data-analisten en wetenschappers in verschillende disciplines. Je kunt R zien als een spreadsheet, maar in plaats van ermee te werken met een muis, gebruik je een command line. Voor veel mensen klinkt het leren van een programmeertaal misschien als te veel moeite, maar geloof me, iedereen kan het leren en het is absoluut de moeite waard. Investeer een paar uur per dag voor een paar weken en je zult in staat zijn om scripts te schrijven die automatisch gegevens opschonen en analyseren, deze naar de cloud uploaden of binnen enkele seconden naar een lokaal bestand schrijven. Het verbaast me nog steeds hoeveel tijd het schrijven van scripts in R me dagelijks bespaart. Als je nog steeds twijfelt is deze blog van Chris Bow een uitstekende uiteenzetting over waarom R een onderdeel zou moeten zijn van je marketing toolbox.

Hoe start je om R te gebruiken?

Het is belangrijk om te weten dat R helemaal gratis is, kosten vormen dus geen drempel om het uit te proberen. De laatste versie kun je hier downloaden. Om met R te werken gebruiken de meeste mensen een interactieve ontwikkelomgeving (IDE) genaamd RStudio. Met RStudio kun je je code en projecten organiseren, waardoor het werken met R veel beter beheersbaar wordt. je kunt RStudio hier gratis downloaden.

Nadat je R en RStudio hebt gedownload en geïnstalleerd, is het tijd om de essentiële dingen te leren. De beste manier om vertrouwd te raken met de R en programmeren in het algemeen, is door middel van een introductiecursus. Er zijn veel onlinecursussen voor R, sommige zijn ook (gedeeltelijk) gratis. Hier is een lijst met online introductiecursussen voor R die ik kan aanbevelen:

1.Codecademy

Deze cursus is nuttig voor iedereen met weinig tot geen ervaring met programmeren. Er zijn interactieve lessen over het opschonen van dataframes, het samenvoegen van tabellen, aggregatie, datavisualisatie en zelfs het testen van hypothesen. De lessen zijn gratis, maar voor extra content zoals quizzen en projectopdrachten is een Pro-account nodig (€ 36/maand). De cursus kan 10 tot maximaal 20 uur duren.

2.Datacamp

Deze track bevat 5 cursussen, waarvoor geen ervaring vereist is. Het heeft een introductiecursus R, die ongeveer 4 uur duurt. De eerste les is gratis, maar voor de rest van de lessen is een standaard account nodig (€ 25/maand). Het is sterk aan te raden om naast de introductiecursus in ieder geval deze 2 andere cursussen te volgen: Data manipulation with dplyr en Joining Data with dplyr, die ook ongeveer 4 uur duren. In totaal zullen deze cursussen dus ongeveer 12 tot 22 uur in beslag nemen.

3.Coursera and Udemy

Zowel Coursera als Udemy hebben een aantal gratis online R-cursussen beschikbaar. Deze is voor beginners en duurt slechts 10 uur om te voltooien. Houd er echter rekening mee dat deze gratis onlinecursussen meestal niet zo compleet zijn als Codecademy en Datacamp cursussen en dat de lessen minder interactief zijn. Om echt grip op R te krijgen, moet je wellicht aanvullende cursussen volgen. U kunt door de cursuscatalogi van Coursera en Udemy bladeren om meer betaalde of gratis onlinecursussen te zoeken.

Zorg er bij het zoeken naar online cursussen altijd voor dat het niveau voor beginners is en dat de syllabus gegevensopschoning of gegevensbewerking bevat, of namen van packages als tidyr of dplyr (daarover later meer). R heeft veel toepassingen, dus het is gemakkelijk om te verdwalen in alle verschillende manieren waarop R wordt gebruikt. Door je te concentreren op één usecase, zoals het opschonen van gegevens, kun je de taal sneller onder de knie krijgen en vergroot je de kans dat je het geleerde toepast in je dagelijkse activiteiten. Repetitieve activiteiten die veel tijd in beslag nemen in Excel, zijn over het algemeen een perfecte kandidaat voor automatisering in R. Na het leren van de basis is het automatiseren van een van uw gegevenstaken meestal de beste manier om je kennis in praktijk te brengen.

Wanneer je begint met een programmeertaal zoals R, is het erg belangrijk om te onthouden dat er meestal meer dan één oplossing is voor een bepaald probleem. Hoe je een probleem aanpakt, hangt meestal sterk af van persoonlijke voorkeur. Soms werkt een oplossing voor de een het beste, maar is deze voor de ander minder logisch omdat deze minder leesbaar of minder herbruikbaar is. De meest elegante oplossing is vaak degene die minder regels code nodig heeft of die gemakkelijker te begrijpen is. Een manier om de beste oplossing voor een probleem te vinden, is door online naar het antwoord te zoeken. Geloof me, 99% van de problemen die zich voordoen zijn al door iemand anders opgelost. Google gewoon het probleem in het Engels en specificeer de gebruikte packages, dan verschijnen er vaak meerdere oplossingen. Een geweldige site om oplossingen te vinden is Stackoverflow, die vaak als eerste in uw zoekresultaten verschijnt. Op deze site stelt een grote gemeenschap van ontwikkelaars vragen over en oplossingen voor programmeer-problemen. De beste oplossing is over het algemeen degene met de meeste “up-votes”, dus dat is degene die je het eerst moet proberen, maar soms kunnen andere oplossingen ook werken.


Enthousiast geworden? Hopelijk kun je aan de slag met één van de cursussen die we je aanbevelen. Mocht je meer willen weten over de toepassing op onze klanten of heb je andere vragen naar aanleiding van dit artikel? Neem contact met ons op, we drinken graag een digitale kop koffie!

Nieuwsgierig?

We komen graag met u in contact om te kijken wat voor u kunnen betekenen.