Vad är maskininlärning? Definition, typer och exempel
Att lära sig från data och förbättra prestanda utan explicit programmering, maskininlärning är en avgörande del av artificiell intelligens. Detta innebär att skapa modeller och algoritmer som gör det möjligt för maskiner att lära av erfarenheter och fatta beslut baserat på den kunskapen. Datavetenskap är grunden för maskininlärning och tillhandahåller de nödvändiga algoritmerna och teknikerna för att bygga och träna modeller för att fatta förutsägelser och fatta beslut. Kostnadsfunktionen är en viktig komponent i maskininlärningsalgoritmer eftersom den hjälper till att mäta hur bra modellen presterar och vägleder optimeringsprocessen. Ställ in och justera hyperparametrar, träna och validera modellen och optimera den sedan.
Vid övervakad inlärning får datorn en uppsättning träningsdata som människor har märkt med korrekta svar eller klassificeringar för varje exempel. Algoritmen lär sig sedan från denna data hur man förutsäger nya modeller baserat på deras egenskaper (element som beskriver modellen). Om du till exempel vill att din dator ska lära sig att identifiera bilder på katter och hundar, skulle du tillhandahålla tusentals bilder märkta som antingen katt eller hund (eller båda). Baserat på dessa träningsdata kan din algoritm göra korrekta förutsägelser med nya bilder som innehåller katter eller hundar (eller båda).
Andra typer
Under 2022 kommer sådana enheter att fortsätta förbättras eftersom de kan möjliggöra interaktioner och samtal ansikte mot ansikte med vänner och familj bokstavligen varifrån som helst. Detta är en av anledningarna till att utvecklare av augmented reality är mycket efterfrågade idag. Dessa röstassistenter utför olika uppgifter som att boka flygbiljetter, betala räkningar, spela användares favoritlåtar och till och med skicka meddelanden till kollegor.
När det gäller Netflix använder systemet en kombination av samarbetsbaserad filtrering och innehållsbaserad filtrering för att rekommendera filmer och TV-program till användare baserat på deras tittarhistorik, betyg och andra faktorer som genrepreferenser. Robotinlärning är inspirerad av en mängd olika maskininlärningsmetoder, från övervakad inlärning, förstärkningsinlärning,[74][75] och slutligen meta-inlärning (t.ex. MAML). Detta är särskilt viktigt eftersom system kan luras och undermineras, eller helt enkelt misslyckas med vissa uppgifter, som även människor kan utföra enkelt. Till exempel kan justering av metadata i bilder förvirra datorer – med några få justeringar identifierar en maskin en bild av en hund som en struts.
Det presenterar dock också etiska överväganden som integritet, datasäkerhet, transparens och ansvarsskyldighet. Genom att följa bästa praxis, använda rätt verktyg och ramverk och hålla oss uppdaterade med den senaste utvecklingen kan vi utnyttja kraften i maskininlärning samtidigt som vi tar itu med dessa etiska problem. Flera inlärningsalgoritmer syftar till att upptäcka bättre representationer av de indata som ges under träning.[61] Klassiska exempel inkluderar principalkomponentanalys och klusteranalys. Denna teknik möjliggör rekonstruktion av indata som kommer från den okända datagenererande fördelningen, utan att nödvändigtvis vara trogen konfigurationer som är osannolika under den fördelningen.
Läkemedelsutveckling i tidigt skede är en annan viktig tillämpning som involverar tekniker som precisionsmedicin och nästa generations sekvensering. Kliniska prövningar kostar mycket tid och pengar att genomföra och leverera resultat. Att tillämpa ML-baserad prediktiv analys skulle kunna förbättra dessa faktorer och ge enkel definition av maskininlärning bättre resultat. Maskininlärningsalgoritmer visar sig vara utmärkta på att upptäcka bedrägerier genom att övervaka varje användares aktiviteter och bedöma om en försökt aktivitet är typisk för den användaren eller inte. Finansiell övervakning för att upptäcka penningtvätt är också ett kritiskt säkerhetsfall.
Generativt adversariellt nätverk (GAN)
Det är studiet av att göra maskiner mer människolika i sitt beteende och sina beslut genom att ge dem möjligheten att lära sig och utveckla sina egna program. Detta görs med minimal mänsklig inblandning, d.v.s. ingen explicit programmering. Inlärningsprocessen automatiseras och förbättras baserat på maskinernas erfarenheter under hela processen. Maskininlärning (ML) är en typ av artificiell intelligens (AI) som fokuserar på att bygga datorsystem som lär sig av data. Det breda utbudet av ML-tekniker som omfattar gör det möjligt för programvaruapplikationer att förbättra sin prestanda över tid. Inlärningsprocessen börjar med observationer eller data, såsom exempel, direkt erfarenhet eller instruktioner, i syfte att leta efter mönster i data och fatta bättre beslut i framtiden baserat på de exempel vi ger.
Det är här mätvärden som noggrannhet, precision, återkallelse och F1-poäng är användbara. Regulariseringstermen som används i de föregående ekvationerna kallas L2, eller åsregularisering. Vi tar sedan absolutvärdet av felet för att ta hänsyn till både positiva och negativa felvärden. Slutligen beräknar vi medelvärdet för alla registrerade absoluta fel eller den genomsnittliga summan av alla absoluta fel. Regression är en teknik som används för att förutsäga värdet av responsvariabler (beroende variabler) från en eller flera prediktorvariabler (oberoende variabler). Alan Turings banbrytande artikel introducerade en riktmärkesstandard för att demonstrera maskinintelligens, enligt vilken en maskin måste vara intelligent och responsiv på ett sätt som inte kan särskiljas från en människas.
Maskininlärning är ett knepigt område, men vem som helst kan lära sig hur maskininlärningsmodeller byggs med rätt resurser och bästa praxis. Enligt Statista förväntas marknaden för maskininlärning växa från cirka 140 miljarder till nästan 142 biljoner år 2030. Maskininlärning är redan inbäddat i många tekniker som vi använder idag – inklusive självkörande bilar och smarta hem. Det kommer att fortsätta att göra våra liv och företag enklare och effektivare i takt med att innovationer som utnyttjar maskinläsningstekniken ökar inom en snar framtid. Responsvariabeln modelleras som en funktion av en linjär kombination av ingångsvariablerna med hjälp av den logistiska funktionen. Ett mer populärt sätt att mäta modellers prestanda är att använda medelkvadratfelet (MSE).
I USA utvecklar enskilda stater policyer, såsom California Consumer Privacy Act (CCPA), som infördes 2018 och kräver att företag informerar konsumenter om insamlingen av deras data. Lagstiftning som denna har tvingat företag att ompröva hur de lagrar och använder personligt identifierbar information (PII). Som ett resultat har investeringar i säkerhet blivit en allt större prioritet för företag i deras strävan att eliminera alla sårbarheter och möjligheter till övervakning, hacking och cyberattacker. Systemet använde förstärkningsinlärning för att lära sig när man skulle försöka sig på ett svar (eller en fråga, så att säga), vilken ruta man skulle välja på spelplanen och hur mycket man skulle satsa – särskilt på dagliga dubblar. Se en diskussion med två AI-experter om framsteg och begränsningar inom maskininlärning. Genom intellektuell stringens och erfarenhetsbaserat lärande utvecklar detta heltids tvååriga MBA-program ledare som gör skillnad i världen.
Dessutom drivs detaljhandelswebbplatser med virtuella assistenter eller konversationella chattrobotar som utnyttjar ML, naturlig språkbehandling (NLP) och naturlig språkförståelse (NLU) för att automatisera kundernas shoppingupplevelser. För att ta itu med dessa problem har företag som Genentech samarbetat med GNS Healthcare för att utnyttja maskininlärning och simuleringsplattformar för AI, och förnya biomedicinska behandlingar. ML-teknik letar efter patienters responsmarkörer genom att analysera enskilda gener, vilket ger riktade behandlingar till patienter. Dessutom hjälper tekniken läkare att analysera trender eller flagga händelser som kan bidra till förbättrade patientdiagnoser och behandlingar.
Skillnaden mellan djupinlärning och maskininlärning ligger i hur varje algoritm lär sig. "Djup" maskininlärning kan använda märkta datamängder, även känt som övervakad inlärning, för att informera sin algoritm, men det kräver inte nödvändigtvis Chatt PG en märkt datauppsättning. Djupinlärningsprocessen kan ta in ostrukturerad data i sin råa form (t.ex. text eller bilder), och den kan automatiskt bestämma den uppsättning funktioner som skiljer olika datakategorier från varandra.
Detta ersätter manuell funktionsutveckling och gör det möjligt för en maskin att både lära sig funktionerna och använda dem för att utföra en specifik uppgift. I övervakat lärande förser datavetare algoritmer med märkta träningsdata och definierar de variabler de vill att algoritmen ska bedöma för korrelationer. Både algoritmens in- och utdata specificeras vid övervakad inlärning. Inledningsvis arbetade de flesta maskininlärningsalgoritmer med övervakad inlärning, men oövervakade metoder blir alltmer populära. Förstärkande lärande är ett område inom maskininlärning som handlar om hur programvaruagenter bör vidta åtgärder i en miljö för att maximera en viss uppfattning om kumulativ belöning.
Till exempel, även om du inte skriver in en fråga helt korrekt när du ställer en fråga till en kundtjänstbot, kan den fortfarande känna igen det allmänna syftet med din fråga tack vare data från maskininlärningsmönsterigenkänning. Till exempel kan en maskininlärningsmodell ta en dataström från en fabriksgolv och använda den för att förutsäga när komponenter i monteringslinjen kan komma att gå sönder. Det kan också förutsäga sannolikheten för att vissa fel ska inträffa i den färdiga produkten. En ingenjör kan sedan använda denna information för att justera maskinernas inställningar på fabriksgolvet för att öka sannolikheten för att den färdiga produkten blir som önskat. I modelloptimeringsprocessen jämförs modellen med punkterna i en datauppsättning.
Kvaliteten på de data du använder för att träna din maskininlärningsmodell är avgörande för dess effektivitet. Ta bort alla dubbletter, saknade värden eller extremvärden som kan påverka modellens noggrannhet. Maskininlärning har också många tillämpningar inom detaljhandeln, inklusive att förutsäga kundbortfall och förbättra lagerhanteringen.
Den vanligaste applikationen är ansiktsigenkänning, och det enklaste exemplet på denna applikation är iPhone. Det finns många användningsområden för ansiktsigenkänning, främst för säkerhetsändamål som att identifiera brottslingar, söka efter försvunna personer, underlätta forensiska utredningar etc. Intelligent marknadsföring, diagnostisera sjukdomar, spåra närvaro i skolor är några andra användningsområden.
Även om maskininlärning är ett kraftfullt verktyg för att lösa problem, förbättra affärsverksamheten och automatisera uppgifter, är det också en komplex och utmanande teknik som kräver djupgående expertis och betydande resurser. Att välja rätt algoritm för en uppgift kräver goda kunskaper i matematik och statistik. Träning av maskininlärningsalgoritmer kräver ofta stora mängder data av god kvalitet för att producera korrekta resultat.
Dessutom använder resebranschen maskininlärning för att analysera användarrecensioner. Användarkommentarer klassificeras genom sentimentanalys baserat på positiva eller negativa poäng. Detta används för kampanjövervakning, varumärkesövervakning, efterlevnadsövervakning etc. av företag inom resebranschen. Dessutom hjälper datautvinningsmetoder cyberövervakningssystem att identifiera varningstecken på bedrägerier och därefter neutralisera dem. Flera finansinstitut har redan samarbetat med teknikföretag för att utnyttja fördelarna med maskininlärning. Här inventerar AI-komponenten automatiskt sin omgivning med hjälp av hit & trial-metoden, vidtar åtgärder, lär sig av erfarenheter och förbättrar prestandan.
På liknande sätt kan partiskhet och diskriminering som uppstår vid tillämpningen av maskininlärning oavsiktligt begränsa framgången för ett företags produkter. Du kan hitta ytterligare information om AI-kundtjänst och artificiell intelligens och NLP. Om algoritmen studerar användarvanorna hos människor i en viss stad och avslöjar att de är mer benägna att dra nytta av en produkts funktioner, kan företaget välja att rikta in sig på just den marknaden. En grupp människor i ett helt annat område kan dock använda produkten lika mycket, om inte mer, än de i den staden. De har helt enkelt inte upplevt något liknande och är därför osannolikt att de kommer att identifieras av algoritmen som individer som attraheras av dess funktioner. Om till exempel maskininlärning används för att hitta en brottsling med hjälp av ansiktsigenkänningsteknik, kan andra människors ansikten skannas och deras data loggas i ett datacenter utan deras vetskap.
Beslutsträdsinlärning använder ett beslutsträd som en prediktiv modell för att gå från observationer om ett objekt (representerade i grenarna) till slutsatser om objektets målvärde (representerat i löven). Det är en av de prediktiva modelleringsmetoder som används inom statistik, datautvinning och maskininlärning. Beslutsträd där målvariabeln kan anta kontinuerliga värden (vanligtvis reella tal) kallas regressionsträd. I beslutsanalys kan ett beslutsträd användas för att visuellt och explicit representera beslut och beslutsfattande. Inom data mining beskriver ett beslutsträd data, men det resulterande klassificeringsträdet kan vara en input för beslutsfattande. Förstärkande maskininlärningsalgoritmer är en inlärningsmetod som interagerar med sin omgivning genom att producera handlingar och upptäcka fel eller belöningar.
Den tränade maskinen kontrollerar objektets olika egenskaper, såsom färg, ögon, form etc., i inmatningsbilden, för att göra en slutgiltig förutsägelse. Detta är processen för objektidentifiering i övervakad maskininlärning. Standardalgoritmer som används inom maskininlärning inkluderar linjär regression, logistisk regression, beslutsträd, slumpmässiga skogar och neurala nätverk.
Dessa kommer att inkludera avancerade tjänster som vi generellt sett drar nytta av genom mänskliga agenter, såsom att göra researrangemang eller träffa en läkare när vi är sjuka. Flera företag har redan använt AI-baserade lösningar eller självbetjäningsverktyg för att effektivisera sin verksamhet. Stora teknikföretag som Google, Microsoft och Facebook använder bottar på sina meddelandeplattformar som Messenger och Skype för att effektivt utföra självbetjäningsuppgifter. Maskininlärning har avsevärt påverkat alla branscher världen över, från startups till Fortune 500-företag. Enligt en rapport från Fortune Business Insights från 2021 var den globala marknaden för maskininlärning 14 400 Titrat (TP15,50 miljarder) år 2021 och förväntas växa till 152,24 miljarder inköp år 2028 med en årlig tillväxttakt (CAGR) på 38,61 Titrat (TP3T). Maskininlärning används alltmer inom hälso- och sjukvårdsbranschen, bland annat genom bärbara enheter och sensorer som bärbara aktivitetsmätare, smarta hälsoklockor etc.
Grunderna i maskininlärning som alla nybörjare bör känna till – Inbyggt
Grunderna i maskininlärning som varje nybörjare borde känna till.
Upplagd: Fre, 17 Nov 2023 08:00:00 GMT [källa]
Eftersom träningsmängder är ändliga och framtiden är osäker, ger inlärningsteori vanligtvis inga garantier för algoritmers prestanda. Bias-varians-dekompositionen är ett sätt att kvantifiera generaliseringsfelet. Viktiga komponenter i ett maskininlärningssystem inkluderar data, algoritmer, modeller och feedback.
Insikter som härrör från maskininlärning hjälper till att identifiera investeringsmöjligheter som gör det möjligt för investerare att bestämma när de ska handla. Maskininlärningsmetoder gör det möjligt för datorer att arbeta autonomt utan explicit programmering. ML-applikationer matas med ny data och de kan självständigt lära sig, växa, utvecklas och anpassa sig. Maskininlärning lär maskiner att lära sig av data och förbättra sig stegvis utan att vara explicit programmerade.
Semiövervakad inlärning fungerar genom att mata en liten mängd märkt träningsdata till en algoritm. Från dessa data lär sig algoritmen datamängdens dimensioner, som den sedan kan tillämpa på nya omärkta data. Algoritmers prestanda förbättras vanligtvis när de tränas på märkta datamängder. Denna typ av maskininlärning hittar en balans mellan den överlägsna prestandan hos övervakad inlärning och effektiviteten hos oövervakad inlärning.
Kanske bryr du dig mer om noggrannheten i den där trafikprognosen eller röstassistentens svar än vad som finns under huven – och det är förståeligt. Din förståelse för maskininlärning kan också stärka de långsiktiga resultaten av din strategi för artificiell intelligens. Hyperparametrar är parametrar som ställs in före modellens träning, till exempel inlärningshastighet, batchstorlek och antal epoker. Modellens prestanda beror på hur dess hyperparametrar är inställda; Det är viktigt att hitta optimala värden för dessa parametrar genom trial and error. Med maskininlärning kan du förutsäga underhållsbehov i realtid och minska driftstopp, vilket sparar pengar på reparationer. Genom att tillämpa tekniken i transportföretag kan man även använda den för att upptäcka bedrägerier, såsom kreditkortsbedrägerier eller falska försäkringsanspråk.
Dessutom är maskininlärning förmodligen den vanligaste formen av AI som används idag för de flesta företag. Människor har en anledning att känna till åtminstone en grundläggande definition av termen, om inte av någon annan anledning så att maskininlärning, som Brock nämnde, i allt högre grad påverkar deras liv. I takt med att datoralgoritmer blir alltmer intelligenta kan vi förutse en uppåtgående bana för maskininlärning under 2022 och framåt. Bärbara enheter kommer att kunna analysera hälsodata i realtid och ge personlig diagnos och behandling specifikt anpassad till en individs behov. I kritiska fall kommer de bärbara sensorerna också att kunna föreslå en serie hälsotester baserade på hälsodata. När du till exempel söker efter en plats i en sökmotor eller på Google Maps dyker alternativet "Få vägbeskrivningar" upp automatiskt.
Tillämpningar av maskininlärning inom olika branscher
Med övervakad inlärning märks datamängderna, och etiketterna tränar algoritmerna, vilket gör det möjligt för dem att klassificera den data de stöter på korrekt och förutsäga resultat bättre. På detta sätt kan modellen undvika överanpassning eller underanpassning eftersom datamängderna redan har kategoriserats. Att maskiner tränas att lära sig av data och förbättras över tid har gjort det möjligt för organisationer att automatisera rutinuppgifter som tidigare utfördes av människor – i princip, vilket frigör oss för mer kreativt och strategiskt arbete. Det finns dock många förbehåll för dessa övertygelsesfunktioner jämfört med Bayesianska tillvägagångssätt för att införliva okunnighet och osäkerhetskvantifiering. ML har visat sig värdefullt eftersom det kan lösa problem i en hastighet och skala som inte kan dupliceras av det mänskliga sinnet ensamt. Med enorma mängder beräkningsförmåga bakom en enda uppgift eller flera specifika uppgifter kan maskiner tränas att identifiera mönster i och relationer mellan indata och automatisera rutinprocesser.
Att förklara hur en specifik ML-modell fungerar kan vara utmanande när modellen är komplex. Inom vissa vertikala branscher måste dataforskare använda enkla maskininlärningsmodeller eftersom det är viktigt för verksamheten att förklara hur varje beslut fattades. Det gäller särskilt i branscher med höga krav på efterlevnad, såsom bank och försäkring. Dataforskare finner sig ofta tvungna att hitta en balans mellan transparens och en modells noggrannhet och effektivitet.
- Maskininlärningskonceptet går ut på att få datorer att lära sig från erfarenheter – tidigare data.
- Detta eliminerar en del av den mänskliga intervention som krävs och möjliggör användning av stora mängder data.
- Intelligent marknadsföring, diagnostisering av sjukdomar, spårning av närvaro i skolor är några andra användningsområden.
- Han definierade det som "Det studieområde som ger datorer förmågan att lära sig utan att vara explicit programmerade."
Implementeringsmiljöer kan vara i molnet, vid kanten eller lokalt. Målet är att omvandla gruppens kunskap om affärsproblemet och projektmålen till en lämplig problemdefinition för maskininlärning. Olika typer av modeller har använts och forskats på för maskininlärningssystem, att välja den bästa modellen för en uppgift kallas modellval. Termen "maskininlärning" myntades av Arthur Samuel, en datavetare på IBM och en pionjär inom AI och datorspel. Ju mer programmet spelades, desto mer lärde det sig av erfarenhet, genom att använda algoritmer för att göra förutsägelser.
Detta eliminerar en del av den mänskliga intervention som krävs och möjliggör användning av stora mängder data. Man kan tänka på djupinlärning som "skalbar maskininlärning" som Lex Fridman noterar i denna MIT-föreläsning (länken finns utanför ibm.com). Maskininlärning innebär att artificiell intelligens använder algoritmer och statistiska modeller för att granska data, identifiera mönster och trender och fatta förutsägelser eller fatta beslut. Det som skiljer maskininlärning från traditionell programmering är att det möjliggör inlärning av maskiner och förbättrar deras prestanda utan att kräva explicita instruktioner.
Vårt expertteam kan hjälpa dig att använda data för att fatta välgrundade beslut eller skapa innovativa produkter och tjänster. Bristande transparens kan skapa flera problem vid tillämpningen av maskininlärning. På grund av deras komplexitet är det svårt för användare att avgöra hur dessa algoritmer fattar beslut, och därmed svårt att tolka resultaten korrekt. Anmäl dig till ett professionellt certifieringsprogram eller läs den här informativa guiden för att lära dig om olika algoritmer, inklusive övervakad, oövervakad och förstärkningsinlärning. I många tillämpningar kommer dock tillgången på data för träning och testning att vara begränsad, och för att bygga bra modeller vill vi använda så mycket som möjligt av tillgänglig data för träning. Men om valideringsmängden är liten kommer den att ge en relativt brusig uppskattning av prediktiv prestanda.
Andra tillämpningar av maskininlärning inom transporter inkluderar efterfrågeprognoser och hantering av autonom fordonsflotta. Denna metod används ofta i olika tillämpningar som spel-AI, robotik och självkörande bilar. Förstärkande lärande är en inlärningsalgoritm som gör det möjligt för en agent att interagera med sin omgivning. https://chat.openai.com/ att lära sig genom trial and error. Agenten får feedback genom belöningar eller straff och justerar sitt beteende därefter för att maximera belöningar och minimera straff. Förstärkande lärande är ett viktigt ämne som behandlas i professionella certifikatprogram och online-inlärningshandledningar för blivande maskininlärningsingenjörer.
Maskininlärning kan analysera medicinska bilder, såsom röntgenbilder och magnetkamerabilder, för att diagnostisera sjukdomar och identifiera avvikelser. Detta är ett effektivt sätt att förbättra patientresultaten samtidigt som kostnaderna minskas. När modellen har färre funktioner kan den inte lära sig särskilt bra från data.
Många av algoritmerna och teknikerna är inte begränsade till bara en av de primära ML-typerna som listas här. De är ofta anpassade till flera typer, beroende på problemet som ska lösas och datamängden. Till exempel används djupinlärningsalgoritmer som faltningsneuronnätverk och återkommande neurala nätverk i övervakade, oövervakade och förstärkningsinlärningsuppgifter, baserat på det specifika problemet och tillgängligheten av data.