Tuvastus keelemudeli abil
Pakume lahendusi, kus keelemudel uurib pilti ning oskab kirjeldada, tuvastada ja loendada objekte, sündmusi või olukordi. Tegemist on tehisintellektiga (tehismõte), mis ühendab arvutinägemise (computer vision) ja keelemudelite (LLM) võimekuse.
Selline lahendus ei anna ainult “jah/ei” vastuseid, vaid suudab ka:
- kirjeldada, mis pildil toimub,
- tuvastada konkreetseid objekte või defekte,
- loendada objekte,
- hinnata olukordi (nt kas midagi on valesti, ohtlik või tavapäratu),
- edastada tulemused edasi teistele süsteemidele.
- ja palju muud

Visuaal-keele mudelite uuesti treenimine
Kui eesmärk on, et süsteem oskaks pilti ka sisuliselt kirjeldada ja hinnata, kasutame visuaal-keele mudeleid, mis ühendavad pildi ja teksti mõistmise, näiteks:
-
CLIP-põhised mudelid – pildi ja teksti semantiline seostamine
-
LLaVA-tüüpi mudelid – pildi kirjeldamine ja küsimustele vastamine pildi kohta
-
Muud Vision-Language Model (VLM) arhitektuurid
Neid mudeleid saab kohandada, et nad kasutaksid kliendile omast sõnavara, protsessiloogikat ja ärireegleid, mitte ainult üldist interneti-keelt.
Mida keelemudel pildiga teeb?
Keelemudeliga koos masinnägemise lahendusega suudab analüüsida pilte ja videoid ning tõlgendada nende sisu inimkeeles. Süsteem tuvastab objektid, olukorrad, mustrid ja kõrvalekalded ning loob neist struktureeritud või tekstilise kirjelduse. See tähendab, et lahendus ei piirdu ainult objekti leidmisega, vaid suudab ka kirjeldada, mis toimub, miks see on oluline ning kas olukord vajab sekkumist.
Näiteks saab süsteem öelda, et tootmisliinil on vale detail, inimene on ohtlikus tsoonis või kaubal on visuaalne defekt. Selline lähenemine võimaldab automatiseerida mitte ainult nägemist, vaid ka otsustusloogikat ning ühendada visuaalne info äriprotsessidega. Olenevalt kliendi vajadusest võib võimalik olla valmis treenitud mudelite kasutamine või siis on vajalik uue mudeli treenimine / kohandamine.

Arvutusvõimsus ja kiirus – mida peab arvestama?
Masinnägemise ja keelemudelitega töötavad süsteemid vajavad palju arvutusvõimsust, eriti kui on vaja suuremaid kiirusi, st töötada reaalajas. Vajalik riistvara sõltub mitmest tegurist: pildi resolutsioon, kaamerate arv, analüüsi keerukus ja lubatud reageerimisaeg või kiirus. Kiireks tuvastuseks kasutatakse tavaliselt GPU-ga tööstusarvuteid (edge-lahendused, näiteks NVIDIA spetsiaalarvutid) või keskseid servereid, kus saab töödelda mitme kaamera pildi voogu korraga.
Pilvelahendused sobivad hästi analüütikaks ja ajalooliseks töötlemiseks, kuid kriitilistes tootmisprotsessides eelistatakse kohapealset arvutust, et vältida viivitusi ja võrgu sõltuvust. Õige arhitektuuri valik on oluline, et süsteem oleks stabiilne, skaleeritav ja kuluefektiivne.
Lahenduse valik ja arvuti valik sõltub ka sellest, kas mudeleid peab kliendi juures taastreenima või mitte.
Tüüpilised kasutusjuhtumid
Keelemudelitel põhinevaid masinnägemislahendusi kasutatakse laialdaselt tootmises, logistikas, turvasüsteemides, kvaliteedisüsteemides ja hoonete monitooringus. Levinud kasutusjuhtumid on kvaliteedikontroll, defektide tuvastus, objektide loendamine, protsesside jälgimine ja ohutuse tagamine. Näiteks saab süsteem kontrollida toodete vastavust, lugeda pakendeid, tuvastada ohtlikke olukordi või jälgida, kas tööprotseduurid on korrektselt täidetud. Lisaks on võimalik visuaalsed sündmused siduda automaatsete tegevustega, nagu tootmisliini peatamine, alarmide käivitamine või info edastamine ERP ja MES süsteemidesse. See muudab AI-lahenduse aktiivseks osaks äriprotsessist, mitte pelgalt vaatlevaks süsteemiks.
Valmis või kohandatud mudel – kumb on õige valik?
Mõnel juhul piisab valmis masinnägemise ja keelemudelite kasutamisest, eriti kui objektid ja olukorrad on üldised ning keskkond on visuaalselt lihtne. Kuid tööstuslikes ja ärikriitilistes rakendustes on sageli vajalik mudelite kohandamine või täiendtreenimine kliendi enda andmetel.
Kohandatud mudelid annavad parema täpsuse, vähem valehäireid ja suurema töökindluse keerulistes tingimustes, nagu halb valgustus, mustus, peened defektid või spetsiifilised detailid. Pakume nii valmis mudelitel põhinevaid kiireid lahendusi kui ka täistsükliga arendust, mis hõlmab andmete kogumist, märgistamist, mudelite treenimist ja süsteemi integreerimist. Eesmärk on alati praktiline töökindlus ja mõõdetav äriline kasu, mitte ainult tehniline uudsus.