Poštovani,
u sklopu zadatka na kolegiju "Otvoreno računarstvo" na Fakultetu elektrotehnike i računarstva u Zagrebu, trebali smo analizirati otvorene skupove podataka te ponuditi prijedloge njihovog poboljšanja. Ovdje je nekolicina uočenih nepravilnosti prilikom proučavanja skupa: Podaci o stanovima u najmu u vlasništvu Grada Lipika
Stupac "vlasnik" stanova u skupu podataka o najmu stanova u vlasništvu grada Lipika je redundantan jer se iz konteksta samog skupa podataka može iščitati o kojem je vlasniku riječ.
Stupac "adresa" nije u unificiranom formatu, neke vrijednosti sadrže kućni broj (koji je izražen i arapskim brojevima i rimskim brojevima), neke samo ulicu, neke skraćeni naziv ulice.
Stupac "najmoprimac" koristi zanimljivu oznaku za nedostajuće vrijednosti - string literal "PRAZAN" što parseri vjerojatno nebi uhvatili bez ljudske intervencije. Također, postavlja se pitanje zašto su uopće ti podaci uključeni u skupu ako nisu bili "u najmu" što stoji u samom nazivu skupa. Također vrijednosti su vrlo loše. Pravne osobe navedene su samo inicijalima, a tvrtke punim nazivima te nije očigledna nikakva distinkcija oko toga radi li se o fizičkoj osobi ili tvrtki pošto su u istom stupcu. Trajanje najma u "od" i "do" stupcima nije u unificiranom tipu podataka: neki nedostajući podaci su prazni, a neki označeni s tekstom "neodređeno" umjesto datumskom oznakom (datum kao tip podataka)
Podaci izgledaju ovako:
Bolje bi bilo kada bi se podatke ovako strukturiralo:
Srdačan pozdrav
Dodavanje novog prijedloga za objavu skupa podataka