Farkaš, Igor. (2013). Pretraživanje, dohvaćanje i arhiviranje informacija s interneta. Diploma Thesis. Filozofski fakultet u Zagrebu, Department of Information Science. [mentor Tuđman, Miroslav and Pečarić, Đilda].
PDF
(Croatian)
- Registered users only
Download (1MB) | Request a copy |
Abstract
Rad se bavi problematikom pretraživanja, dohvaćanja i pohrane podataka s interneta. Za rješavanje tog problema koristi se kombinacija nekoliko programa i alata: Python, Scrapy, PHP (KoolPGPGrid), HTML, Xpath, Firebug, phpMy Admin, cPanel koji rade paralelno. Potrebno je istaknuti da su svi korišteni programi i alati besplatni. Scrapy sučeljem indeksiraju se web stranice te se vrši ekstrakcija strukturiranih podataka koji se nakon toga zapisuju u bazu podataka kojoj se može pristupiti preko interneta. Zapisani podaci se mogu dodatno filtrirati i obrađivati.
Item Type: | Diploma Thesis |
---|---|
Uncontrolled Keywords: | Scrapy, mysql, PHP, Python, dohvaćanje informacija, pohrana informacija, web scraping, semantic web |
Subjects: | Information sciences Information sciences > Social-humanistic informatics |
Departments: | Department of Information Science |
Supervisor: | Tuđman, Miroslav and Pečarić, Đilda |
Date Deposited: | 06 Feb 2019 11:20 |
Last Modified: | 06 Feb 2019 11:20 |
URI: | http://darhiv.ffzg.unizg.hr/id/eprint/10840 |
Actions (login required)
View Item |