Brkić, Karla 1984
Structural analysis of video by histogram-based description of local space-time appearance : doctoral thesis / Karla Brkić ; mentori Zoran Kalafatić i Axel Pinz - Zagreb : K. Brkić ; Fakultet elektrotehnike i računarstva, 2013 - xxi, 210 str. : graf. prikazi, formule ; 30 cm + CD
Na spor. nasl. str. naslov na hrv. jeziku: Strukturna analiza videa korištenjem opisa lokalnog prostorno-vremenskog izgleda zasnovanoga na histogramima : doktorski rad
Bibliografija: str. 183-204. - Kazalo [matematičkih] oznaka: str. 163-167. - Kazalo [pojmova]: str. 169-170
SUMMARY: The methods for representation, classification and reasoning about video data are actively researched in the computer vision community. Different research applications drive different views on what is essentially the same type of information. The goal of this thesis is to investigate the methods for video analysis that are generally applicable to any kind of video data, regardless of the phenomenon represented by the data. Special emphasis is placed on the analysis of videos in an online scenario, where not all frames of a video are available in advance. The thesis introduces the notion of a spatio-temporal structure as a basic unit of video information. A method for representing spatio-temporal structures as grids of histogram is proposed, and the derived grid-of-histograms representation is used to build two different kinds of descriptors: the spatio-temporal appearance (STA) descriptors and the COIN descriptors. The STA descriptors model either the average local appearance or the distributions of local appearance, while the COIN descriptor models change in local appearance by assigning weights to four semantically meaningful hypotheses. A detailed experimental evaluation is provided, illustrating the suitability of STA descriptors as feature vectors in the problems of traffic sign recognition, human action recognition and dynamic texture recognition, and the suitability of COIN descriptors in determining the structural properties of the 3D world. - KEYWORDS: video analysis, spatio-temporal appearance, spatio-temporal structure, video descriptors, semantic descriptors, action recognition, dynamic textures SAŽETAK: Metode za predstavljanje, raspoznavanje i zaključivanje o video podacima aktivno se istražuju u računalnom vidu. U različitim se primjenama najčešće različito gleda na u osnovi istu vrstu informacije. Cilj ove disertacije je istražiti metode za analizu videa koje su općenito primjenjive na bilo koju vrstu video podataka, neovisno o pojavi koju podaci predstavljaju. Poseban je naglasak stavljen na inkrementalnu analizu videa u slučaju kad svi okviri videa nisu dostupni unaprijed. Disertacija uvodi koncept prostorno-vremenske strukture kao osnovne jedinice informacije u videu. Predlaže se metoda za prikaz prostorno-vremenskih struktura mrežama histograma, te se uvedeni prikaz koristi za izgradnju dvije vrste deskriptora: deskriptora prostorno-vremenskog izgleda (STA), te deskriptora COIN. Deskriptori STA modeliraju ili prosječan lokalni izgled ili distribuciju lokalnog izgleda, dok deskriptor COIN modelira promjenu u lokalnom izgledu pridjeljivanjem težina četirima semantičkim hipotezama. Prikazani su rezultati detaljne eksperimentalne evaluacije koja ilustrira primjenjivost deskriptora STA u problemima raspoznavanja prometnih znakova, ljudskih akcija i dinamičkih tekstura, te primjenjivost deskriptora COIN u određivanju strukturnih svojstava 3D svijeta. - KLJUČNE RIJEČI: analiza videa, prostorno-vremenski izgled, prostorno-vremenska struktura, semantički opisnik, raspoznavanje akcija, dinamičke teksture
004.932.2:004.8
Structural analysis of video by histogram-based description of local space-time appearance : doctoral thesis / Karla Brkić ; mentori Zoran Kalafatić i Axel Pinz - Zagreb : K. Brkić ; Fakultet elektrotehnike i računarstva, 2013 - xxi, 210 str. : graf. prikazi, formule ; 30 cm + CD
Na spor. nasl. str. naslov na hrv. jeziku: Strukturna analiza videa korištenjem opisa lokalnog prostorno-vremenskog izgleda zasnovanoga na histogramima : doktorski rad
Bibliografija: str. 183-204. - Kazalo [matematičkih] oznaka: str. 163-167. - Kazalo [pojmova]: str. 169-170
SUMMARY: The methods for representation, classification and reasoning about video data are actively researched in the computer vision community. Different research applications drive different views on what is essentially the same type of information. The goal of this thesis is to investigate the methods for video analysis that are generally applicable to any kind of video data, regardless of the phenomenon represented by the data. Special emphasis is placed on the analysis of videos in an online scenario, where not all frames of a video are available in advance. The thesis introduces the notion of a spatio-temporal structure as a basic unit of video information. A method for representing spatio-temporal structures as grids of histogram is proposed, and the derived grid-of-histograms representation is used to build two different kinds of descriptors: the spatio-temporal appearance (STA) descriptors and the COIN descriptors. The STA descriptors model either the average local appearance or the distributions of local appearance, while the COIN descriptor models change in local appearance by assigning weights to four semantically meaningful hypotheses. A detailed experimental evaluation is provided, illustrating the suitability of STA descriptors as feature vectors in the problems of traffic sign recognition, human action recognition and dynamic texture recognition, and the suitability of COIN descriptors in determining the structural properties of the 3D world. - KEYWORDS: video analysis, spatio-temporal appearance, spatio-temporal structure, video descriptors, semantic descriptors, action recognition, dynamic textures SAŽETAK: Metode za predstavljanje, raspoznavanje i zaključivanje o video podacima aktivno se istražuju u računalnom vidu. U različitim se primjenama najčešće različito gleda na u osnovi istu vrstu informacije. Cilj ove disertacije je istražiti metode za analizu videa koje su općenito primjenjive na bilo koju vrstu video podataka, neovisno o pojavi koju podaci predstavljaju. Poseban je naglasak stavljen na inkrementalnu analizu videa u slučaju kad svi okviri videa nisu dostupni unaprijed. Disertacija uvodi koncept prostorno-vremenske strukture kao osnovne jedinice informacije u videu. Predlaže se metoda za prikaz prostorno-vremenskih struktura mrežama histograma, te se uvedeni prikaz koristi za izgradnju dvije vrste deskriptora: deskriptora prostorno-vremenskog izgleda (STA), te deskriptora COIN. Deskriptori STA modeliraju ili prosječan lokalni izgled ili distribuciju lokalnog izgleda, dok deskriptor COIN modelira promjenu u lokalnom izgledu pridjeljivanjem težina četirima semantičkim hipotezama. Prikazani su rezultati detaljne eksperimentalne evaluacije koja ilustrira primjenjivost deskriptora STA u problemima raspoznavanja prometnih znakova, ljudskih akcija i dinamičkih tekstura, te primjenjivost deskriptora COIN u određivanju strukturnih svojstava 3D svijeta. - KLJUČNE RIJEČI: analiza videa, prostorno-vremenski izgled, prostorno-vremenska struktura, semantički opisnik, raspoznavanje akcija, dinamičke teksture
004.932.2:004.8