Oblikovanje sažetih prikaza povezanosti elemenata u transakcijskim podacima : doktorski rad / Mihaela Vranić ; [mentor Zoran Skočir]
By: Vranić, Mihaela.
Contributor(s): Skočir, Zoran [mentor].
Material type: TextPublisher: Zagreb : M. Vranić ; Fakultet elektrotehnike i računarstva, 2011Description: 177 str.: ilustr. u bojama ; 30 cm + CD.Subject(s): transakcijski podaci transactional data | asocijacijska pravila association rules | česte kolekcije elemenata frequent itemsets | stablaste strukture tree structures | hijerarhijsko grupiranje hierarchical clustering | mjere udaljenosti distance measures | mjere zanimljivosti interest measures | dubinska analiza podataka u edukaciji educational data miningDissertation note: Datum obrane disertacije: 2011-11-04 Summary: SAŽETAK: U doktorskom radu je obrađena problematika sažetih prikaza povezanosti transakcijskih elemenata. U svrhu dobivanja sažetih prikaza povezanosti korištene su dvije sasvim različite poznate deskriptivne metode dubinske analize podataka: stvaranje asocijacijskih pravila i hijerarhijsko grupiranje. Metoda stvaranja asocijacijskih pravila je iskorištena za izoliranje zatvorenih čestih kolekcija elemenata. Spomenute kolekcije se povezuju u stablastu strukturu pomoću dvije razvijene strategije koje su i implementirane. Da bi gubitak informacije u prikazanoj strukturi bio minimalan, napravljena je poveznica s teorijom grafova te je iskorišten algoritam za razapinjanje minimalnog stabla. S druge strane problemu se prišlo razradom različitih mjera zanimljivosti vezanih uz povezivanje elemenata u transakcijama. Ove su mjere prilagođene hijerarhijskom grupiranju te je za njihovo testiranje razvijena i programska podrška koja uz korištenje različitih mjera omogućuje i obrezivanje na osnovu podrške. Dva navedena pristupa su testirana nad umjetno konstruiranim podacima koji bi trebali analitičaru omogućiti lakši odabir pogodne mjere udaljenosti te nad referentnim skupovima podataka. Tu su se pokazale vrlo dobrima za jednostavan i brzi uvid u odnose među elementima transakcija. Razvijene metode su također korištene nad podacima vezanim uz visokoškolsko obrazovanje te pokazale potencijal za sažeti prikaz odnosa među elementima ispita – među pitanjima i uz njih vezanih koncepata. - KLJUČNE RIJEČI: transakcijski podaci, asocijacijska pravila, česte kolekcije elemenata, stablaste strukture, hijerarhijsko grupiranje, mjere udaljenosti, mjere zanimljivosti, dubinska analiza podataka u edukacijiSummary: ABSTRACT: This doctoral thesis proposes new approaches in designing concise representation of correlations among elements in transactional data. For this purpose two different known data mining methods are used: association rules generation and hierarchical clustering. Method of association rules generation is used to isolate closed frequent itemsets which are further connected to form a tree structure. For this purpose two strategies are developed and implemented. To minimize information loss, graph theory was used along with its existing algorithms for minimal spanning tree creation. Additionally, different interest measures that demonstrate certain relationships between transaction elements were modulated to serve in hierarchical clustering. Software implementation of these measures along with support based pruning ability is also made. Two different approaches are tested both on artificial datasets constructed to serve analysts in selecting the most appropriate measure as well as on known and easily reachable reference datasets. They proved to be very useable as descriptive methods that provide quick and easily interpretable structures that represent relationships between transactional elements. Developed methods were also used on the real-life educational data and showed great potential in displaying relationships between test elements – questions and related concepts. - KEYWORDS: transactional data, association rules, frequent itemsets, tree structures, hierarchical clustering, distance measures, interest measures, educational data miningItem type | Current location | Call number | Copy number | Status | Notes | Date due | Barcode | Item holds |
---|---|---|---|---|---|---|---|---|
Doktorska disertacija | Središnja knjižnica KF | KF-4506 | 29062 | Available | 0000000845564 | |||
Doktorska disertacija | Središnja knjižnica | KF-4506 | 29063 | 1 | 0000000845588 | |||
Doktorska disertacija | Središnja knjižnica | KF-4506 | 29062/CD | 1 | CD-ROM | 0000000845571 | ||
Doktorska disertacija | Zavod za osnove elektrotehnike i električka mjerenja ZOEM | 3998 | Available | 0000000898294 |
Na spor. nasl. str. naslov na eng. jeziku: Designing concise representation of correlations among elements in transactional data : doctoral thesis
Datum obrane disertacije: 2011-11-04
Bibliografija: str. 157-160. - Sažetak na eng. i hrv. jeziku. - Životopis
SAŽETAK: U doktorskom radu je obrađena problematika sažetih prikaza povezanosti transakcijskih elemenata. U svrhu dobivanja sažetih prikaza povezanosti korištene su dvije sasvim različite poznate deskriptivne metode dubinske analize podataka: stvaranje asocijacijskih pravila i hijerarhijsko grupiranje. Metoda stvaranja asocijacijskih pravila je iskorištena za izoliranje zatvorenih čestih kolekcija elemenata. Spomenute kolekcije se povezuju u stablastu strukturu pomoću dvije razvijene strategije koje su i implementirane. Da bi gubitak informacije u prikazanoj strukturi bio minimalan, napravljena je poveznica s teorijom grafova te je iskorišten algoritam za razapinjanje minimalnog stabla. S druge strane problemu se prišlo razradom različitih mjera zanimljivosti vezanih uz povezivanje elemenata u transakcijama. Ove su mjere prilagođene hijerarhijskom grupiranju te je za njihovo testiranje razvijena i programska podrška koja uz korištenje različitih mjera omogućuje i obrezivanje na osnovu podrške. Dva navedena pristupa su testirana nad umjetno konstruiranim podacima koji bi trebali analitičaru omogućiti lakši odabir pogodne mjere udaljenosti te nad referentnim skupovima podataka. Tu su se pokazale vrlo dobrima za jednostavan i brzi uvid u odnose među elementima transakcija. Razvijene metode su također korištene nad podacima vezanim uz visokoškolsko obrazovanje te pokazale potencijal za sažeti prikaz odnosa među elementima ispita – među pitanjima i uz njih vezanih koncepata. - KLJUČNE RIJEČI: transakcijski podaci, asocijacijska pravila, česte kolekcije elemenata, stablaste strukture, hijerarhijsko grupiranje, mjere udaljenosti, mjere zanimljivosti, dubinska analiza podataka u edukaciji
ABSTRACT: This doctoral thesis proposes new approaches in designing concise representation of correlations among elements in transactional data. For this purpose two different known data mining methods are used: association rules generation and hierarchical clustering. Method of association rules generation is used to isolate closed frequent itemsets which are further connected to form a tree structure. For this purpose two strategies are developed and implemented. To minimize information loss, graph theory was used along with its existing algorithms for minimal spanning tree creation. Additionally, different interest measures that demonstrate certain relationships between transaction elements were modulated to serve in hierarchical clustering. Software implementation of these measures along with support based pruning ability is also made. Two different approaches are tested both on artificial datasets constructed to serve analysts in selecting the most appropriate measure as well as on known and easily reachable reference datasets. They proved to be very useable as descriptive methods that provide quick and easily interpretable structures that represent relationships between transactional elements. Developed methods were also used on the real-life educational data and showed great potential in displaying relationships between test elements – questions and related concepts. - KEYWORDS: transactional data, association rules, frequent itemsets, tree structures, hierarchical clustering, distance measures, interest measures, educational data mining
There are no comments for this item.