A hisztogram a gradiens

Segíthet kitöltésével a fordítást.

Hisztogram irányított színátmenetek (Engl hisztogram orientált színátmenetek, HOG.) - jellemzőket az egyes pontokat, amelyek használják a számítógépes látás és képfeldolgozás felismerni tárgyakat. Ezt a technikát alapul megszámlálásából irányok a gradiens a helyi területeken a kép. Ez a módszer hasonló az irányt a szélén a hisztogram. SZITÁL jellemzők és összefüggések formában. de abban különbözik, hogy a kiszámított sűrű rács egyenletesen elosztott sejtek, és használja a helyi kontraszt normalizálás nyaldosták a pontosság növelése.

Theory [szerkesztés]

Az alapötlet az algoritmus az a feltételezés, hogy a megjelenése és a tárgy alakja a kép területet lehet által leírt eloszlása intenzitás gradiensek vagy él irányában. Ezek megvalósítása leírásokat lehet tenni felosztása a koherens képet kis területekre nevezik sejtek és kiszámítjuk a hisztogram az egyes sejtvonalak vagy irány él gradiensek képpont a cellán belül. A kombináció a hisztogram és fogantyúval. Pontosságának fokozása a helyi hisztogram kitéve normalizálás szemben. Erre a célra az intézkedés intenzitás kerül kiszámításra nagyobb fragmens a kép, amely az úgynevezett egy blokk, és az így kapott értéket használjuk normalizálása. A normalizált leírók jobb invariancia képest lefedettség.

HOG leíró számos előnnyel rendelkezik más elnevezéseket. Mivel HOG működik helyben módszert támogat invariancia fotometriai és geometriai transzformációk, kivéve a tájékozódás a tárgyat. Ezek a változások csak akkor jelenik meg az megnövekedett kép töredékek. Sőt, amint azt Dalai és Triggs, durva partíciót a tér, pontos kiszámításához területek és erős helyi fotometriai normalizálás hogy figyelmen kívül hagyják a gyalogosok, ha megtartják a test felfelé. A HOG leíró, így ez egy jó módja a megállapítás ember a képeket. [1]

Alkalmazása az algoritmus [szerkesztés]

Kiszámítása gradiens [idézet]

Az első lépés a számítástechnika több detektor egyes pontokat a normalizálás szín és gamma korrekció. Dalai és Triggs találtuk, hogy HOG leíró erre lépés kihagyható, mivel a későbbi normalizálás ugyanazt az eredményt adja. Ezért, az első lépésben gradiensek számított értékek. A leggyakoribb módszer, hogy egy egydimenziós differenciáló maszkot a vízszintes és / vagy függőleges irányban. Ez a módszer a szűrés vagy színes fényerőkomponens segítségével a következő szűrőt mag:

Dalai és Triggs használni bonyolultabb, mint a maszk Sobel 3x3 (Sobel operátor) vagy átlós maszk, de a maszk esetében alacsonyabb teljesítmény ezt a feladatot. Ők is kísérletezett Gauss életlenség alkalmazása előtt differenciáló maszkok, hanem azt is felfedezték, hogy a mulasztás ez a lépés növeli a teljesítményt anélkül, hogy észrevehető minőségromlás nélkül. [2]

Csoportosítás területek [szerkesztés]

sejtek hisztogram kiszámítása a következő lépésben. Minden pixel szerepet játszó sejt súlyozott szavazási a hisztogram csatorna irányok, értéke alapján a gradiens. A sejtek lehetnek téglalap, vagy kör alakúak hisztogram csatornák egyenletesen elosztott 0-180 vagy 0-360 fok, attól függően, hogy a kiszámított „jel” vagy „előjel nélküli gradiens”. Dalai és Triggs találtuk, hogy az aláírás nélküli gradiens együtt kilenc csatorna a hisztogram adja a legjobb eredményt a felismerés az emberek. A elosztását súlyok a szavazásban súlya a pixel lehet állítani akár abszolút gradiens értéke, vagy valamilyen funkciója azt; Valós tesztek abszolút értéke a gradiens adja a legjobb eredményt. Más lehetséges kiviteli alakokban lehet a négyzetgyök csonkított négyzet vagy abszolút értéke a gradiens. [3]

Leíró Blocks [idézet]

Ahhoz, hogy figyelembe kell venni a fényerőt és a kontrasztot színátmenetek kell helyben normalizálódott, mely sejtek kell csoportosítani nagyobb összetartó egységet. Leíró HOG, így egy vektort normalizált komponense hisztogramok származó sejtek minden régiójában a blokk. Általában, átfedésben blokkok, azaz minden cella benne van egynél több terminált leíró. Használ két alapvető blokk geometriája: R-HOG négyszögletes és kerek C-HOG. R-HOG tömböket általában négyzethálók, azzal jellemezve, hogy három paraméter: a sejtek száma a blokkban, a képpontok száma sejtenként, és a csatornák száma sejtenként hisztogram. A kísérletben, Dalal és Triggs optimális paraméterek blokkok 16x16, 8x8 sejtek és 9 csatornák a hisztogram. Sőt, azt találták, hogy lehetséges, hogy növeljék a számítási sebesség kissé alkalmazásával a Gauss szűrő a belsejében minden blokk a szavazási eljárás, ami viszont csökkenti a súlyt a pixel a blokk határokat. Blocks R-HOG nagyon hasonlóak, hogy szitál-leírók; Azonban, annak ellenére, hogy hasonló szerkezetű, R-HOG számított blokkok sűrű hálószemek rögzített skála nélkül rögzített irányba, míg a SIFT-leírók kiszámítása a hígított, nem érzékeny a skála a legfontosabb pontok a kép, és arra használjuk, hogy összehangolja a forgásirányt. Továbbá, a kódoló a forma információs objektumok blokkok R-HOG együtt használják, míg a SIFT-leírókat alkalmazunk külön-külön.

C-HOG blokkok két fajta: egy szilárd központi sejt és osztható. Ezek a blokkok írható le négy paraméter: a szektorok számát, és a gyűrűket, a sugár a központi gyűrű és a hőtágulási együtthatója a sugarak a fennmaradó gyűrűk. Dalal és Triggs találtuk, hogy mindkét faj kiderült azonos eredményeket, és a szétválás 2 a gyűrű 4 és a szektor számára egy sugara 4 pixel és az elosztási tényezőt 2 adta a legjobb eredményt a saját kísérletben. Ezen túlmenően, egy Gauss súlyozási adta nincs javulás, ha a C-HOG blokkok. Ezek az egységek hasonló összefüggésben az űrlapot. de van egy fontos különbség: C-HOG blokkokat tartalmazhat a sejtek többszörös csatornák irányok, használata közben csak összefüggésekben alakú, egyik szélét. [4]

Méretezés blokkok [idézet]

Dalal és Triggs vizsgált négy blokk normalizációs módszer. Let - szabálytalan vektor, amely az összes hisztogram a blokk, - k a norma, amikor azt és - néhány kisebb állandó (a pontos érték nem fontos). Ezután a normalizációs tényező lehet szerezni az alábbi módokon:

L2-norma: L2-HYS: L2-norma korlátozott felülről (értékeit v, 0,2 Bolshie, feltételezzük egyenlő 0,2) és renormalizált, mint az [5] L1-norma: gyökere az L1-norma:

Dalal és Triggs találtuk, hogy az L1-norma ad kevésbé megbízható eredményt, mint a másik három, amelyek működnek szinte egyformán jól, azonban mind a négy módszer erőteljesen javítja az eredményeket összehasonlítjuk a nem-normált. [4]

SVM-osztályozó [idézet]

Az utolsó lépés a felismerés tárgyak segítségével HOG osztályozása leírásainak a képzési rendszer a tanár. Dalai és Triggs egy szupport vektor gép (SVM, Support Vector Machine).

Testing [szerkesztés]

A vizsgálatok szerint a C-HOG jellemzőket, R-HOG összehasonlítható eredményeket, és a C-HOG valamelyest kisebb hányada hiányzik képeket rögzített aránya hibák az első fajta a mindkét kép.

A részesedése hiányzó képeket

Az alábbi linkre megtalálja a megfelelő grafikon DET. [2]

További fejlesztésre [szerkesztés]

Lásd. Is [szerkesztés]

Megjegyzések [szerkesztés]

Források [szerkesztés]

Javítani ezt a cikket, kívánatos? :

Kapcsolódó cikkek

Hogyan kell telepíteni a szögeket a Photoshop

előző ◈ a következő