Tech

Een reële toepassing van diepgelegen leren op industriële schaal

Nutsbedrijven bezitten miljoenen kilometers aan elektriciteitskabels en moeten deze regelmatig inspecteren. Anomalieën op elektriciteitskabels kunnen enorme gevolgen hebben, zoals grote stroomstoringen, bosbranden en het in gevaar brengen van mensenlevens. Miljoenen stroomleidingpolen moeten vanuit verschillende hoeken worden geïnspecteerd om defecten te vinden die slechts enkele millimeters breed kunnen zijn.

Het handmatig doorlopen van een ongelofelijke hoeveelheid beelden om deze gebreken te vinden is een schrijnende taak.

Sterblue Het is gelukt om menselijke niveaus te bereiken in verschillende anomalie- en apparatuursegmentatietaken op stroomlijnapparatuur, door gebruik te maken van state-of-the-art deep-learning en datawetenschappelijke methoden.

Defecten gedetecteerd in een Sterbluewolk op een windturbine
Een deel van de uiteindelijke levering: Een overzicht van de geconstateerde gebreken aan een windturbine

Hier delen we enkele basisinzichten uit onze groeiende ervaring, ver van de clichés van AI als een magische tool die alle problemen in één klik oplost.

Het begint allemaal met goede gegevens

Zeer hoge kwaliteit gelabelde data is nodig om neurale netwerken succesvol te trainen. Feit is dat in 2019, om succes te hebben in het machinaal leren, je een bijna perfecte dataset nodig hebt.

Daarom Sterblueis het de strategie om een end-to-end inspectieoplossing te bieden die zowel de geautomatiseerde gegevensanalyse als de geautomatiseerde gegevensregistratie omvat. Het hebben van een schoon, deterministisch en reproduceerbaar vluchtplan van drones rond hoogspanningslijnen is cruciaal voor het verkrijgen van een mooie homogene dataset.

Nadat we zijn begonnen met het gebruik van beelden die zijn vastgelegd met onze drone-software, merkten we een grote verbetering in de resultaten in vergelijking met het gebruik van beelden die met andere middelen zijn vastgelegd.

Veel gegevens

Hoogwaardige data is één ding. Maar om een verschil te maken in de wereld van toegepaste AI is het noodzakelijk om toegang te hebben tot veel data.

Nicolas Draber van de Sterblueopleiding van drone-operators
Opleiding van operatoren in het veld

Elk AI-project dat een enorme hoeveelheid trainingsgegevens ontbeert, wordt geacht te mislukken, behalve in uiterst zeldzame gevallen waarin een revolutionaire aanpak met succes wordt ontwikkeld, maar we hebben het hier over een eenmalige gebeurtenis. Voor ons, de rest van de wereld, is het hebben van een grote trechter om data in het systeem te krijgen een must-have om waardevolle resultaten te krijgen.

SterblueDe data-acquisitie-instrumenten helpen ons bij het verkrijgen van deze grote hoeveelheden gegevens. Maar zelfs dan is het een absolute noodzaak om veel energie te steken in het operationeel inzetten van de data capture oplossing op grote schaal. Elke dag zijn er tientallen mensen betrokken bij het vastleggen van data in het veld, wat een kostbare logistieke voorbereiding vereist.

Kwaliteitslabels van hoge kwaliteit

Het hebben van veel goede beelden is nutteloos als de image-labeling niet top-notch is. SterblueBegonnen met het trainen van neurale netwerken met behulp van beelden die gelabeld zijn door onze eindgebruikers (nutsbedrijven) op ons platform. We merkten echter dat de kwaliteit niet altijd perfect was.

Dat is logisch: onze eindgebruikers zijn de exacte mensen die ons betalen om te voorkomen dat ze zelf beelden moeten etiketteren. In eerste instantie labelen ze graag datasets om de AI-pijplijn op gang te brengen, maar 2019 AI heeft meer data nodig dan dat, en hogere kwaliteitsnormen die onze klanten niet kunnen leveren zonder al te veel pijn aan hun kant.

Distributiepaal Labeling op SterblueCloud
Kwalitatieve labeling op ons cloud platform

Daarom maken we gebruik van externe leveranciers van data-etikettering om datasets op te schonen, zodat we uiteindelijk perfecte gegevens hebben voor AI-trainingen. Deze overstap enkele maanden geleden was de meest ingrijpende verandering die we hebben doorgevoerd om ons doel te bereiken.

Het bedrijfsdomein kennen

SterblueDe strategie is altijd geweest om de ene na de andere business verticals aan te pakken. Dit is zeer waardevol gebleken omdat we ons realiseerden dat diepgaande kennis van het bedrijfsdomein een kritische factor is voor het succes van toegepast machinaal leren.

Deze zakelijke kennis stelde ons in staat om de juiste datarepresentaties te ontwerpen, etiketteringstools te optimaliseren, de kwaliteit van de gegevens te waarborgen en vele andere aspecten van de datawetenschappelijke pijplijn.

Ooievaarsnest gedetecteerd op de distributielijn op Sterb
Een van de vele klassen van defecten gevonden op distributiekabels

Het trainen van diepe neurale netwerken zonder zakelijke kennis zou zijn als het onderwijzen van een onderwerp waar je niets van weet door het volgen van een boek: je zou denken dat het in theorie zou kunnen werken, maar het faalt slecht in de praktijk.

Aan de andere kant is de gedetailleerde zakelijke kennis die we in de loop van enkele jaren hebben opgedaan door de interactie met reële gegevens van onschatbare waarde voor ons.

Harde wetenschap laten gebeuren

Zoals de naam al aangeeft, is datawetenschap een wetenschap. Sommige mensen schilderen het af als een kunstvorm, maar ze kunnen zich niet meer vergissen.

Datawetenschap is wetenschap, en dat betekent dat de resultaten moeten worden beoordeeld aan de hand van objectieve metingen in de praktijk en dat de harde waarheid nooit uit het oog mag worden verloren. Het is gemakkelijk om jezelf voor de gek te houden en enthousiast te zijn als je kijkt naar deze paar verbazingwekkende resultaten die je AI heeft geleverd, terwijl er overal een zee van afvalresultaten is. Consistente objectieve metingen zijn een goede manier om te weten waar je precies bent en of je de goede kant op gaat. Anekdotische resultaten zijn dat niet.

Monitoring van het neurale netwerk
Monitoring van het neurale netwerk

Succes in AI wordt niet bereikt door het uitvoeren van one-of-a-kind stunts, maar door het methodisch toepassen van state-of-the-art methoden, met een gezonde dosis pragmatisme en creativiteit onderweg.

De kracht van het mengen

Machinaal leren is geen volledig opgelost probleem. Dit betekent dat voor één bepaald probleem verschillende methoden goede resultaten kunnen opleveren. Als datawetenschapper is het noodzakelijk om open te staan voor verschillende benaderingen en deze uit te proberen om de meest relevante te vinden voor de use case.

Neurale netwerkarchitectuur
Een neurale netwerkarchitectuur

Vaak wordt de robuustheid van de uiteindelijke oplossing bereikt door een slimme mix van verschillende oplossingen. Een illustratie hiervan zijn tegenstrijdige voorbeelden: een eenvoudige sticker of een paar veranderde pixels kunnen sommige neurale netwerkarchitecturen voor de gek houden om een object te verwarren met een ander schijnbaar ongerelateerd object.

Net zoals raszuivere dieren het meest fragiel zijn en raszuivere dieren robuuster zijn, is de toepassing van neurale netten soms fragiel. Een product dat verschillende toegepaste machinale leerbenaderingen mengt zal robuuster zijn.

Gereedschapsondersteuning

We zien dat het bereiken van waardevolle resultaten in toegepast machinaal leren afhankelijk is van een aantal belangrijke elementen die hierboven in deze post zijn opgesomd.

Waar ik nog niet over gesproken heb, is dat elk van deze elementen afhankelijk is van veel gereedschap om efficiënt te kunnen worden uitgevoerd. Het ontwikkelen van tools die al deze stappen ondersteunen en optimaliseren is eigenlijk waar het gaat om toegepast machinaal leren.

Diverse Sterbluehulpmiddelen op het platform
Diverse Sterbluehulpmiddelen op het platform

Het ontwikkelen van nieuwe neurale netwerkmodellen is slechts een klein onderdeel van wat een succes maakt in toegepast machinaal leren. Het grootste deel van het werk is eigenlijk al het ondersteunende gereedschap dat er omheen gaat.

Van super efficiënte data labelling interfaces tot optimale drone vluchtplanning, alle Sterbluetools dragen bij aan het ondersteunen van een efficiënte use case voor het leren van machines op schaal.