Soms lijkt machine learning net zo mythisch als de geheime toverdrankjes van magiërs en druïden. Maar als je door de rook van de magie heen kijkt, blijkt machine learning simpelweg een efficiënte en snelle manier om een probleem op te lossen met een algoritme. In dit blog ontrafel ik de mystiek rondom machine learning en waarschuw ik je voor vier gevaarlijke valkuilen.
De creaties van magiërs, druïden en alchemisten zijn altijd voer voor speculatie geweest. Wat doen ze precies? Hoe maken ze het? En werkt het echt? Aan vrijwel iedere grote technologische ontwikkeling gaat ook heel wat onduidelijkheid vooraf. Dat is niet anders bij machine learning en data science. Bedrijven willen ‘er iets mee doen’, terwijl ze vaak niet eens een idee hebben wat deze technologie precies is. Tijd om daar verandering in te brengen.
Zo werkte het vroeger
Als een bedrijf voorheen een computer een probleem liet oplossen of een advies liet genereren, waren er uren programmeerwerk nodig. Neem bijvoorbeeld Google Search: de eerste versies van zoekresultaten die context van gebruikers meenamen, waren vrijwel volledig geprogrammeerd. Denk daarbij aan de locatie van een gebruiker, het geslacht, leeftijd en voorkeuren. Knap, maar natuurlijk handenvol werk en niet erg flexibel. Het meenemen van nieuwe context betekent opnieuw programmeren.
Een algoritme zoekt razendsnel naar verbanden in data, waardoor het zelfstandig oplossingen voor een probleem kan genereren.
Verbanden leggen dankzij machine learning
Met machine learning is dat vele malen makkelijker. Een algoritme zoekt razendsnel naar verbanden in data, waardoor het zelfstandig oplossingen voor een probleem kan genereren. Denk bijvoorbeeld aan de kijkadviezen van Netflix voor series. Dat algoritme bepaalt echter niet op eigen houtje waar het verbanden tussen legt. Daar zijn de magiërs van vandaag voor nodig: data scientists. Zij stellen een impliciet raamwerk van variabelen op waarbinnen het algoritme te werk gaat, bijvoorbeeld leeftijd van de kijker, geslacht, maand van het jaar en genres van eerder gekeken series, zonder dat deze variabelen expliciet hoeven te worden voorgeschreven. Op basis van deze input gaat het algoritme aan de slag.
Schaalbaar dankzij machine learning
Het grote voordeel van machine learning is dat het processen schaalbaar maakt. De algoritmes en modellen zijn zelflerend: ze worden slimmer en leggen dus steeds complexere verbanden. Zo kunnen ze inspelen op bijvoorbeeld trends, zonder dat een programmeur daar nieuwe programmeercode voor hoeft te schrijven. Dat maakt het toepassen van de techniek zo interessant. Want waarom zou je een mens complete datasets laten doorspitten om regels te destilleren als een computer dat veel sneller en nauwkeuriger kan?
Whitepaper
We apply AI for you
In deze whitepaper geven we je uitleg over Artificial Intelligence (AI), Machine Learning en Data Science. Wat houden deze domeinen precies in? En op welke manier maken ze waardevolle data oplossingen mogelijk? Tot slot gaan we in op de samenhang tussen de drie domeinen.
De valkuilen van machine learning
Geen enkele druïde maakte met zijn eerste brouwsel meteen het perfecte toverdrankje. Dat geldt ook voor machine learning. Er zijn enkele valkuilen waar bedrijven voor moeten waken:
Valkuil 1: onderschatting
Directies onderschatten machine learning regelmatig. De gedachte heerst vaak dat alles vanzelf goed komt wanneer ze machine learning inzetten. Niets is minder waar, want het vraagt nog altijd veel energie en voorwerk. Het algoritme vereist periodieke controle: algoritmes werken weliswaar generieker dan voorgeprogrammeerde code, maar dat betekent niet dat de stand van de vorige maand nog steeds geldig is voor vandaag. Algoritmes zijn haast menselijk, ze dienen net als mensen bij de tijd te blijven.
Valkuil 2: overschatting
Andere directies denken weer te moeilijk over machine learning. Ze zien het als iets heel groots, denken enkel na over ingewikkelde toepassingen of vinden hun organisatie te klein om deze technologie toe te passen. Maar machine learning kun je zo groot (of klein) inzetten als je wil of nodig hebt. En vergeet niet, de ontwikkelingen zijn al zo ver dat er compleet voorgetrainde algoritmes en modellen in de cloud bestaan. Denk aan Vision API’s voor het herkennen van objecten in beelden of Speech API’s voor het herkennen van uitgesproken zinnen.
Valkuil 3: ethiek en regelgeving
Als een organisatie een algoritme inschakelt om advies te geven over autoverzekeringen, dan zal dat algoritme bepaalde variabelen meenemen, zoals geslacht, leeftijd en eerdere autoschades. Het is echter belangrijk om ook rekening te houden met ethische aspecten en de Nederlandse wetgeving. Een algoritme kan namelijk constateren dat vrouwen veiliger rijden dan mannen en daardoor mannen een duurdere autoverzekering aanbieden. Het algoritme maakt daarbij onderscheid op basis van geslacht en dat mag niet volgens de wet. Hoe los je dat op? Simpel. Betrek altijd een mens in het proces, als controleur van de uitkomsten van het algoritme.
Valkuil 4: te weinig data
Machine learning werkt alleen optimaal bij voldoende data. Hoe meer relevante en niet-gefilterde data, hoe nauwkeuriger het algoritme verbanden legt. Ga maar na: als je over een product adviezen wil geven voor mensen van alle leeftijden, móet je alle leeftijden en alle geslachten meenemen in het algoritme. Het is dus belangrijk om non-stop je data te blijven verzamelen en gebruikte algoritmes hiermee scherper te maken.
Lees ook:
3 tips om een goede start te maken met data science
De mystiek voorbij
Hoewel machine learning nog vaak omgeven is door mystiek en onduidelijkheid, biedt het ongekende kansen. Daarom zijn veel bedrijven, waaronder Inergy, al druk in de weer met de toepassing ervan. En zo zal machine learning voor bedrijven uiteindelijk een volwaardige techniek worden om hun eigen werkzaamheden makkelijker te maken en klanten beter van dienst te kunnen zijn.
Aan de slag met data science
Wil je aan de slag met data science en machine learning, maar weet je niet goed hoe je dit aan moet pakken? Wij geven je graag een data science kickstart.