Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja: magistarski rad / Goran Lončar ; [mentor Nikola Bogunović]
By: Goran Lončar.
Contributor(s): Bogunović, Nikola [ths].
Material type: TextPublisher: Zagreb: G. Lončar ; Fakultet elektrotehnike i računarstva, 2011Description: 87 str.: ilustr.; 30 cm + CD.Item type | Current location | Call number | Copy number | Status | Date due | Barcode | Item holds |
---|---|---|---|---|---|---|---|
Doktorska disertacija | Središnja knjižnica KF | KF-4548 | 29107 | Available | 0000000845274 | ||
Doktorska disertacija | Središnja knjižnica | KF-4548 | 29107/CD | 1 | 0000000845281 |
Sažetak. Sve veći broj medija prisutan je na Internetu, a time se povećava i količina podataka dostupnih korisnicima. Poslovnim korisnicima najzanimljiviji su
mediji koji objavljuju informacije vezane uz njihovo poslovno okruženje te informacije koje bi im mogle pomoću u poslovanju. U ogromnoj količini vijesti
i podataka koja se svaki dan objavljuje sve je teže i sporije pronaći informacije korisne poslovnim korisnicima. Sustav koji bi identificirao
poslovne subjekte i osobe u vijestima omogućio bi izradu proizvoda koji bi poslovnim korisnicima olakšali pronalaženje točne informacije. U ovom magistarskom radu predstavljen je sustav koji na temelju leksičke analize tekstnog dokumenta i posebno osmišljenog sustava bodovanja omogućava označavanje i identifikaciju subjekata i osoba. U radu su analizirani problemi prepoznavanja naziva i identifikacije te su ponuđena rješenja temeljem unapređenja postojećih istraživanja na tom području. Opisani sustav je primijenjen na skup vijesti Internet izdanja poslovnih dnevnika i tjednika te je postignuta F-mjera identifikacije 86%. U radu su prikazane i konkretne primjene ovakvog sustava u poslovnom okruženju.
Abstract. The amount of text documents and textual media news that is created every day on the Internet is growing rapidly, making it very difficult to find useful information effectively. Business people are mostly interested in news articles that contain information which can be useful for their business and decision making. This paper presents a system that identifies business persons and companies in text documents and matches them with persons and companies previously stored in a database. This kind of system can be used to track news articles about business subjects and people and speed up search through news tagging. The system is based on lexical analysis of textual documents and scoring algorithm. The implementation of the system was tested on a set of business news articles and scored F-measure of 86%. The paper also presents two implementations that are currently successfully used in commercial products.
Bibliografija.
There are no comments for this item.