Kriminālnoziegumu statistika
Popularizējot atvērto datu lietošanu un novērtējot to kvalitāti, iesākšu tēmu ar savdabīgiem datiem — kriminālnoziegumu statistiku.
Lai gan kriminālā statistika ir norādīta kā viena no datu kopām atvērto datu portālā, dēļ IMIC mājaslapas izmaiņām nepieciešamie dati tur nav pieejami, bet ir atrodami citā lapā. No pirmā acumirkļa šķiet, ka vēsturisko datu apjoms ir pietiekams, jo publicēti dati sākot ar 2005.gadu, taču pieejamo datu formāts ir atšķirīgs — senākie dati pieejami tikai .pdf formātā (līdz 2010.gadam), atsevišķi faili ir .xls formātā, bet pēdējie (no 2016.gada) ir .xlsx formātā. Jāpiebilst, ka atsevišķu senāko periodu datu struktūra būtiski atšķiras ar jaunāko gadu datiem (ja ir vēlme analizēt datus administratīvi teritoriālo iedalījumu detalizācijā). Tāpēc šajā rakstā analizēti dati no 2013.gada.
Datu apkopošanas laikā ir jāsaskaras arī ar situāciju, ka starp dažādiem periodiem atšķiras datu izvietojums un vērtības. Piemēram, ja nodaļas iepriekš aprakstītas ar arābu cipariem, tad pēdējo gadu failos ar romiešu. Tas sāk traucēt brīdī, kad dati ir apvienoti vienā datu kopā un ir jāveic šo datu analīze (tādēļ ir jāpāriet uz vienotu nodaļu dalījumu).
Pēc datu apvienošanas, papildu problēmas rodas noziedzīgā nodarījuma veida noteikšanā. Failā ir minēts tikai pants, tāpēc jāizmanto citi resursi (piem., likumi.lv), lai noskaidrotu veida nosaukumu. Tā kā normatīvie akti tiek grozīti, tad papildu pazīmju pievienošana (piem., iespējamie soda veidi; noziedzīgā nodarījuma klasifikācija u.c.) kļūst apgrūtinoša.
Būtiskākā problēma ir datu kvalitāte noziedzīgo nodarījumu skaitā vai šo datu interpretācijā. Tā kā datos atspoguļots noziedzīgu nodarījumu skaits gan konkrētā pantā, gan šī panta daļā vai punktā (piemēru skat. zemāk), tad, lai neuzskaitītu noziedzīgu nodarījumu dubultā, būtu jāņem skaits konkrētajā pantā vai arī summēt katras panta daļas/punkta rezultātu kopā.
Piemēram, 1.attēlā redzams, ka 109.panta rezultāts (275) veidojas no šī panta daļu kopsummas, tāpēc panta daļu rezultātus nevajadzētu iekļaut statistikā vai arī 109.panta rezultātu neiekļauj, bet iekļauj šī panta daļu datus.
Taču, ne visos gadījumos, summējot daļu vai punktu skaitu, iegūst tādu pašu rezultātu kāds ir konkrētam pantam. Piemēram, 117.panta punktu kopējais noziedzīgo nodarījumu skaits ir 24 (2.attēls), bet šī panta skaits ir 18. Tā kā nav papildu informācijas par šo datu kopu, tad nav skaidrs vai atšķirības ir dēļ datu kvalitātes vai datu interpretācijas dēļ.
Pieejamo datu kvalitāte ir apkopota zemāk:
Kriminālās statistikas datu novērtējums
Pozitīvās lietas
- Dati ir pieejami bez maksas un bez nepieciešamības autorizēties.
- Ir pieejami vēsturiskie dati no 2005.gada.
- Liela daļa no datiem ir pieejami mašīnlasāmā veidā (.xls un .xlsx formātā).
- Plaša statistika — līdz pat noziedzīgā nodarījuma veidam.
Lietas, kas ir jāuzlabo
- Labot saiti atvēto datu portālā, lai klikšķinot uz tās, lietotājs tiktu pārvietots uz pareizo lapas sadaļu — kur atrodas dati.
- Nepieciešams vienāds mašīnlasāms formāts visiem periodiem. Ideālā gadījumā visu gadu dati ir vienā failā.
- Novērst gadījumus, kad noziedzīgā nodarījuma skaits pantam nesakrīt ar summu, kas rodas saskaitot šī panta daļas vērtības.
- Nepieciešams metadatu apraksts, kas paskaidro katras datu vienības nozīmi datu failā.
- Datu struktūra ir pielāgota ērtākai nolasīšanai — dati izmētāti nevis vairākās Excel darba lapās, bet atrodas vienā lapā.
Lietas, kas datu kopai pievienotu lielāku vērtību
- Papildu reģionālo pilsētu un novadu nosaukumiem norādīt arī ATVK kodu.
Tas nepieciešams, lai šiem datiem pievienotu papildu informāciju no citām datu kopām. - Datu failu papildināt ar papildu pazīmēm: noziedzīgā nodarījuma veidam norādīt klasifikāciju (pēc KL 7.panta); noziedzīgā nodarījuma veida nosaukums. Norādīt arī katra noziedzīgā nodarījuma veida iespējamos sodus un pēc kādas krimināllikuma redakcijas ir uzsākta krimināllieta. Vai noziegums izdarīts tīši vai aiz neuzmanības, darbības vai bezdarbības dēļ.
- Papildināt datus ar statusu — vai noziegums ir izmeklēšanas stadijā, nodots tiesai, izbeigts u.tml.
- Papildināt datus ar tiem noziedzīgiem nodarījumiem, par kuriem izmeklēšanu izbeidz, pamatojoties uz Kriminālprocesa likuma 377.panta 1. vai 2.punktu.
Dati un datu vizualizācija
Ja vēlies iepazīties ar apkopotajiem datiem, tad tie ir pieejami Kaggle vietnē. Bet šo datu vizualizāciju tu redzēsi šeit.
Izmantotie avoti
- Kriminālā statistika par 2020.gadu: https://www.ic.iem.gov.lv/lv/kriminala-statistika