Význam adresy subjektu v eGovernmentu. Část III

Následující text se zabývá adresou, která patří mezi zásadní elementy ověřující identitu konkrétního subjektu (občana či firmy). V úvodní části je nastíněn význam adresy a dále se text zabývá jednotlivými komponenty, z nichž se adresa skládá. Pro zdárné fungování eGovernmentu je důležité, aby jeden každý subjekt byl evidován na určité adrese, která bude uvedena přesně a správně a bude identická ve všech systémech veřejné správy. Proto je žádoucí vytvářet a uchovávat adresy v jednom základním zdroji, odkud budou využívány ve všech informačních systémech veřejné správy. Z tohoto důvodu vzniká základní registr územní identifikace, adres a nemovitostí RUIAN, který je zde podrobně popsán. Rovněž jsou zmapovány současné základní elektronické zdroje pro ověřování správnosti a úplnosti adresy. V práci je dále porovnáván stav evidence adres ve vybraných informačních systémech veřejné správy a jejich vzájemná konzistence.

Poznámka redakce: Jedná se o třetí část výtahu z magisterské diplomové práce: FRIEDLOVÁ, Irma. Význam adresy subjektu v eGovernmentu a analýza údajů ve vybraných registrech. Brno: Masarykova univerzita, Filozofická fakulta, Ústav české literatury a knihovnictví, 2011. 115 s. Vedoucí magisterské práce Ing. Michaela Ungrová.

 

8.  Analýza adres ve vybraných rejstřících veřejné správy

Spuštění základních registrů do ostrého provozu k 1. červenci 2012 musí předcházet úprava technických podrobností zápisu údajů, vyčistění a sjednocení těch dat, která budou nadále využívaná jako referenční data, tj. údaje, jež jsou o daném subjektu v rámci veřejné správy jedinečné. 

V případě adresy subjektu bude zdrojem referenčních dat registr územní identifikace, adres a nemovitostí (RUIAN). Adresy nových subjektů v nejrůznějších ISVS budou nově vznikat pouze formou referenčního odkazu do RUIAN. U již zavedených subjektů se však jednotlivé ISVS musí v oblasti adres s registrem RUIAN sjednotit tak, aby byla možná vzájemná výměna dat a u těchto adres bylo umožněno překlopení adresy do tvaru referenčního odkazu do RUIAN.

Cílem mé analýzy je zjištění konzistence struktury adresy ve vybraných informačních systémech (jejich současný stav) a zmapování problematických oblastí v souvislosti se standardizací adresy v RUIAN.

Zdroje výzkumu:

- centrální databáze Územně identifikačního registru adres Ministerstva práce a sociálních věcí (UIR-ADR) vč. územních číselníků, které tento registr přebírá z datových zdrojů centrální úrovně,

- Struktura územně správních celků České republiky po jednotlivých rocích počínaje 1. lednem 2001[1] (aktualizace k 1. 1. 2010),

- Registr ekonomických subjektů (aktualizace k 1. 11. 2010),

- Databáze dodacích míst podniku Česká pošta, s. p. (aktualizace k  1. 11. 2010),

- Evidence obyvatel - soubory ke stažení (okresy, obce, části obcí, ulice)[2].

Pro svůj výzkum jsem definovala tyto hypotézy:

1. Kvalita adres v registru není ovlivněna místem, kde jsou data pořízena do systému.

2. Kvalita adres v registru je ovlivněna použitím jednotných celostátních číselníků a standardů informačních systémů územní identifikace.

Hypotézy jsou prověřovány kvantitativním výzkumem.

První hypotéza vychází z toho, že údaje v dotčených registrech nejsou editovány centrálně, ale editaci dat zajišťují oblastní správci na různých úrovních, např. v UIR-ADR se účet editora vztahuje k obci nebo pověřené obci; správa registru ekonomických subjektů se v ČSÚ provádí důsledně v působnosti podle krajů (vždy dva kraje edituje jedno pracoviště); Česká pošta aktualizuje svoji Databázi dodacích míst dle své organizační struktury na osmi regionálních pracovištích.

Místem vstupu dat do systému jednotlivých registrů jsou tedy regionální pracoviště jednotlivých úřadů, kde správci předepsaným způsobem přenáší údaje o adrese z papírových formulářů do počítačové aplikace. Každý registr pracuje s vlastním jednotným formulářem pro adresu, který je platný v rámci celé České republiky a zároveň obsahuje přesné pokyny k jeho vyplnění.

Vzhledem k výše uvedenému, lze tedy očekávat, že kvalita zpracovaných dat se bude mírně lišit nejen oblastně, ale bude nestejná také v jednotlivých registrech v rámci kraje. Celkově by se však úroveň zpracování adres za jednotlivé kraje neměla výrazně lišit.

První hypotéza obsahuje dvě proměnné, a to kraj a počet chyb v adresních údajích sledovaných registrů v příslušném kraji.

Druhá hypotéza vychází z předpokladu, že kvalitu dat při zavádění údajů do systému příznivě ovlivňuje omezení součinnosti tzv. „lidského činitele" na minimum. Chybné údaje v některých rejstřících, jako jsou překlepy nebo pravopisné chyby, jsou dokladem toho, že se na jejich vzniku podílel lidský faktor.

Proto se jako logické východisko nabízí používat při aktualizaci adres celostátně vedené číselníky obcí, částí obcí, ulic a veřejných prostranství a rovněž PSČ. Při editování stávajících údajů nebo zavádění nových záznamů do registru vybírá správce prvky pouze z povolených a standardizovaných číselníků. Předejde se tak uvádění různých variant názvů ulic a dalším nejednotným zápisům. Navíc aplikace k vybranému názvu automaticky přiřadí příslušný jednoznačný kód z centrálního číselníku vedeného v ČSÚ. Pouze takový zápis je použitelný pro bezproblémovou výměnu dat s ostatními informačními systémy.

Druhá hypotéza obsahuje dvě proměnné, a to příslušný registr adres a počet chyb v datových prvcích adresních údajů tohoto registru oproti standardu.

 

8.1   Výzkumný vzorek


Ve své práci jsem se zaměřila na registry, které bývají nejčastěji uváděny jako zdroj k ověření správnosti adresy. Jedná se o dva registry státní správy, které jsou veřejně přístupné on-line:

§ Subsystém "Adresa" registru "Evidence obyvatel" (EO-ADR), dostupný na adrese: http://aplikace.mvcr.cz/adresa/index.html 

§ Územně identifikační registr adres UIR-ADR, dostupný na adrese: http://forms.mpsv.cz/uir/adr/OverAdresuFrame.html

Dalším zdrojem pro potvrzení správnosti adresy a vyhledání PSČ, na který se zaměřím, je registr České pošty, rovněž přístupný pomocí webové aplikace:

§ Databáze dodacích míst, dostupná na adrese: http://psc.ceskaposta.cz/CleanForm.action 

Čtvrtý registr, který použiji pro svůj výzkum, se odlišuje od předchozích registrů tím, že obsahuje konkrétní subjekty, jejichž adresy budu analyzovat. Také tento registr je veřejně přístupný přes webovou aplikaci:

§ Registr ekonomických subjektů (RES), dostupný na adrese: http://www.czso.cz/csu/redakce.nsf/i/registr_ekonomickych_subjektu

Pro stanovení výzkumného vzorku jsou použita data z centrální databáze Územně identifikačního registru adres (UIR-ADR), podle jejíž struktury adres jsou sídelní celky (obce) rozděleny do níže uvedených kategorií.

Prvky do výzkumného vzorku jsou vybírány stratifikovaným náhodným výběrem při dodržení následujících zásad:

1. Sídelní celky jsou rozděleny do osmi kategorií, a to podle počtu prvků územní identifikace, které se v jednotlivých sídelních celcích vyskytují (např. více částí obce, uliční systém v obci, používání orientačních čísel) a mají vliv na složení adresy.

2. Pro stanovení výzkumného vzorku platí:

Ø jsou zastoupeny sídelní celky z každého kraje v ČR,

Ø v každém kraji jsou zastoupeny adresy ze všech stanovených kategorií (variant), které v daném kraji existují,

Ø zastoupení jednotlivých kategorií ve vybraném vzorku odpovídá procentickému podílu těchto kategorií v rámci kraje.

V obcích vybraných dle příslušných kategorií z UIR-ADR, byly v Registru ekonomických subjektů zvoleny adresy subjektů, které tento registr eviduje při zápisu subjektu do RES. Pokud se v RES vyskytovalo více subjektů se stejnou adresou, byl vybrán pouze jeden, tzn., že do výzkumu se započítala jedna adresa. Z výběru byly rovněž vyřazeny adresy zaniklých ekonomických subjektů. Adresy byly dále vybírány tak, aby celkový počet adres činil 1.000 adres za každý kraj v ČR.

Výzkumný vzorek tedy obsahuje úhrnným počtem 14.000 adres, což představuje přibližně 0,5 % z celkového počtu adres v České republice dle údajů z  Českého statistického úřadu.

Za standard, dle kterého byla posuzována úplnost a správnost vyplnění všech prvků adresy, jsem zvolila registr UIR-ADR.

 

8.2   Analýza dat Registru ekonomických subjektů


Vybrané adresy z RES byly kontrolovány na shodu a úplnost vyplnění adresních prvků s registrem UIR-ADR.

Adresy vedené v informačním systému RES neobsahují žádný jednoznačný identifikátor adresy, který by korespondoval s atributy jiných registrů územní identifikace, proto byla kontrola údajů prováděna formou ručního přiřazování adres z RES k registru UIR-ADR.

Předmětem kontroly v RES byla úplnost všech prvků adresy v předepsané struktuře a přesnost. Zjištěný výsledek byl hodnocen následujícím způsobem:

Ø nalezeno - pokud se adresa ve všech prvcích shodovala s údaji v UIR-ADR,

Ø nalezeno s chybou - pokud byla adresa nalezena, ale vyskytovaly se chyby v úplnosti vyplněných údajů nebo byly uvedené údaje rozdílné oproti standardizovaným číselníkům ČSÚ (např. v poli obec bylo namísto Opava uvedeno Opava 1 nebo chybělo číslo orientační),

Ø nenalezeno - pokud se adresu nepodařilo dle uvedených údajů spolehlivě identifikovat.

Výsledky přiřazení adres subjektů z RES na adresy v UIR-ADR v jednotlivých krajích jsou uvedeny v souhrnné tabulce č. 1.

V adresách, které byly v RES nalezeny „s chybou" se oproti UIR-ADR vyskytovaly nejčastěji následující rozdíly:

§ chybí část obce - 1.007 adres

§ adresa zavedena s nestandardním nebo jiným názvem ulice - 897 adres

§ adresa obsahuje jen č.p. nebo č.or. bez rozlišení, o které číslo se jedná - 775 adres

§ jiné PSČ - 525 adres

§ v RES zavedeno s ulicí, v UIR-ADR bez ulice -273 adres

§ v RES zavedeno bez ulice, v UIR-ADR s ulicí -67 adres

§ rozdílný typ domovního čísla (č.p. nebo č. ev.) - 44 adres

8.3   Analýza dat registru „Evidence obyvatel"

 

Mezi adresami v registrech UIR-ADR a EO-ADR existuje cca od roku 2006 propojení obou systémů pomocí atributu počítačové číslo domu (PČD), který je po kontrole vyplněn u adres v UIR-ADR. Atribut PČD představuje jednoznačné přiřazení adresy z UIR-ADR k adrese v EO-ADR, to znamená, že adresy se shodují ve všech svých prvcích.

Adresy z kontrolního vzorku, které se podařilo připárovat na registr UIR-ADR, bylo proto možné zkontrolovat pomocí atributu PČD na shodu (adresy, které mají vyplněno PČD se shodují s EO-ADR). Adresy z RES, které se nepodařilo přiřadit a dohledat v UIR-ADR a neměly vyplněny potřebné standardizované údaje, byly překontrolovány manuálně, a to dohledáním v on-line prohlížeči „Adresy v České republice"[3].

Výsledky přiřazení a kontroly PČD u adres jsou uvedeny v souhrnné tabulce č. 1.

V adresách, které byly v EO-ADR nalezeny „s chybou" se oproti UIR-ADR vyskytovaly následující rozdíly:

§ jiné PSČ - 5.002 adres (vzhledem k tomu, že EU-ADR nezobrazuje PSČ k jednotlivým adresám, ale obcím resp. jejich částem, byly za chybné považovány všechny adresy v územním celku, který měl uvedeno chybné PSČ, např. Praha má rozpětí PSČ 06121-99300 a jsou proto chybně označeny všechny záznamy s výjimkou těch, které nebyly nalezeny)

§ adresa v EO-ADR zavedena s nestandardním nebo jiným názvem ulice - 63 adres

§ v EO-ADR zavedeno bez ulice, v UIR-ADR s ulicí - 102 adres

§ rozdílný typ domovního čísla (č.p. nebo č. ev.) - 12 adres.

8.4   Analýza dat Databáze dodacích míst


Vybrané adresy z registrů UIR-ADR a RES byly kontrolovány na shodu a úplnost vyplnění adresních prvků s Databází dodacích míst České pošty (DDM). Propojení obou informačních systémů je realizováno na straně DDM. Česká pošta cca dvakrát ročně přiděluje adresám v DDM kód adresy z UIR-ADR. V současné době je cca 90 % adres v DDM opatřeno kódem adresy z UIR-ADR.

DDM je databází adres, které Česká pošta doručuje, a proto neobsahuje všechny adresy z UIR-ADR  (jedná se o 2 260 000 adres v DDM oproti 2 500 000 adres v UIR-ADR). Mezi adresy, které pošta nedoručuje, patří nejčastěji objekty s přiděleným evidenčním číslem, např. chaty. V případě, že jsou tyto objekty trvale obydlené a Česká pošta tam doručuje klasickým nebo náhradním způsobem (prostřednictvím doručovacích schrán), jsou chaty rovněž zaevidovány v DDM.

Výsledky přiřazení předávacího kódu adresního místa z UIR-ADR u adres v DDM jsou uvedeny v souhrnné tabulce č. 1.

Tabulka č. 1 shrnuje dílčí výsledky přiřazení adres a představuje počet chyb v jednotlivých registrech a celkový počet chyb v krajích. Z porovnání konzistentních adres dle jednotlivých registrů je patrné, že největší míru shody na UIR-ADR vykazuje DDM, přestože (z důvodu svého zaměření pro účely doručování poštovních zásilek) neobsahuje všechny adresy, které jsou evidovány v UIR-ADR.

Tabulka 1 - Přehled chyb v jednotlivých registrech a celkový počet chyb v krajích

 

Graf č. 1, členěný po krajích, ukazuje porovnání chybovosti adres mezi jednotlivými registry. Z tohoto grafu je zřejmé, že největší rozdíl mezi standardizovanými adresami v UIR-ADR a srovnávanými registry byl zjištěn v EO-ADR.

Graf 1 - Srovnání chyb v jednotlivých registrech

 

Dále byla ve stanoveném vzorku provedena kontrola shody použitých číselníků okresů, obcí, částí obcí a ulic. Následující tabulka představuje počet shodných identifikačních údajů jednotlivých územních prvků (tj. kód a název) s celostátně vedenými číselníky obcí, částí obcí a ulic, které jsou rovněž obsahem UIR-ADR.

Tabulka 2 - Počet shodných prvků se standardem v jednotlivých registrech

 

Z uvedených výsledků vyplývá, že všechny shodné číselníky s UIR-ADR má pouze DDM, ostatní registry obsahují jen některé číselníky; číselník ulic shodně nepoužívá RES a EO-ADR.

 

8.5   Diskuse


Celkový úhrn chyb v adresách za všechny analyzované registry (viz tabulka č. 1) se pohybuje dle jednotlivých krajů v rozmezí hodnot 353 - 1.614 (vyšší hodnota přesahuje počet adres ve vzorku z toho důvodu, že jedna adresa může být chybná ve více registrech). Nejnižší počet chyb byl zjištěn v Moravskoslezském kraji (353), naopak nejvyšší chybovost byla zjištěna v Praze (1.614) - tento kraj se od ostatních liší tím, že je tvořen jen jednou obcí, jejíž všechny adresy jsou ve variantě 1 a 2, což jsou adresy s největším počtem prvků. Tyto dispozice sice zvyšují možnost chybovosti v adresách, nelze ale s určitostí říci, že „členitost adresy" absolutně zapříčiňuje vysokou chybovost, neboť právě Moravskoslezský kraj je, co do počtu adres, ve variantě 1 a 2, hned na druhém místě za Prahou.

Pokud by tedy zjištěné chyby byly pouze systémové, počet chyb v jednotlivých krajích by se pohyboval v přibližně stejných hodnotách (s výjimkou kraje Praha, který je jako kraj atypický). 

Hodnocení jednotlivých hypotéz:

Hypotéza č. 1: Kvalita adres v registru není ovlivněna místem, kde jsou data pořízena do systému.

Tato hypotéza se nepotvrdila. Naopak kvalita adres v registru je ovlivněna místem, kde jsou data pořízena do systému, což dokládá značný rozptyl hodnot zjištěných chyb v mezikrajovém srovnání

Své tvrzení opírám také o zjištění, že některé typy chyb se vyskytují jen v konkrétních krajích (např. v Praze v RES je v některých adresách uváděno písmeno „O" namísto nuly). Dle mého názoru lze dovodit, že kvalitu dat ve sledovaných registrech ovlivňuje do značné míry svědomitost správců, kteří data do systému pořizují.

Hypotéza č. 2: Kvalita adres v registru je ovlivněna použitím jednotných celostátních číselníků a standardů informačních systémů územní identifikace.

Tato hypotéza se potvrdila, což dokládá výsledek zjištěných chyb v jednotlivých registrech.

Z porovnání dosažených hodnot vykázaných v tabulce č. 1 plyne, že počet chyb se mezi jednotlivými registry výrazně liší, přičemž nejmenší počet chyb se vyskytoval v DDM, která používá číselníky UIR-ADR a rovněž strukturuje adresy dle doporučení Standardu.

Pro úplnost je třeba přepočítat zjištěné výsledky z výzkumného vzorku na počty záznamů (adres/subjektů) ve sledovaných registrech. V tabulce č. 3 je uveden podíl chyb dle jednotlivých krajů a celkový podíl chyb za registr ve vzorku 14.000 adres. Procenta celkového podílu chyb v registrech z výzkumného vzorku jsou v tabulce č. 4 propočítána na celkový počet záznamů v konkrétním registru. Výsledkem je přepokládaný úhrnný počet chybných záznamů v jednotlivých sledovaných registrech.

Tabulka 3 - Podíl chyb ve výzkumném vzorku dle jednotlivých registrů a krajů

 

 
   

Tabulka 4 - Předpokládaný celkový počet chyb v registrech

Výsledný přehled naznačuje, že největší počet chyb lze očekávat v EO-ADR, jehož editoři budou muset, před sjednocením tohoto registru s RUIAN, opravit cca 1.011.181 záznamů. Tento počet může však být výrazně nižší, neboť, dle mého názoru, některé typy chyb bude možné opravit systémovými kontrolami a zásahy z centra.

Značné problémy při sjednocení adres s RUIAN mohou vzniknout na straně RES, protože v tomto registru nejsou data zcela strukturována a nepoužívají se důsledně číselníky pro všechny prvky adresy. Domnívám se proto, že při čištění dat v RES bude vyšší podíl ručního přiřazování adres než v ostatních registrech.

 

9.  Závěr

 

Tato práce se zabývá jedním z „referenčních údajů" v eGovernmentu, a to adresou, která je ke každému subjektu vedena v ISVS.  Pozornost je věnována zejména všem prvkům, které adresu tvoří a jsou prezentovány jednotlivé kroky, které vedly k vytvoření standardního tvaru adresy v ISVS.

Z výše uvedených výsledků je zřejmé, že lidský faktor hraje v kvalitě dat významnou roli. Přestože používání jednotných celostátních číselníků a standardů informačních systémů územní identifikace napomáhá ke zvýšení kvality dat, doporučuji vhodně regulovat činnost editorů RUIAN. Systémem kontrol a vzájemnou verifikací vkládaných údajů v součinnosti s dalšími editory lze eliminovat chyby v datech na minimum.

Domnívám se, že zjištěné výsledky jednoznačně prokázaly, že evidence adres subjektů v jediném zdroji je nanejvýše žádoucí a z hlediska zajištění výměny dat mezi ISVS a případně dalšími systémy je to jediná možná cesta. Nasazení RUIAN do ostrého provozu v co nejkratší době se jeví přínosné, zkvalitňující provoz mezi úřady a zefektivňující komunikaci mezi subjektem a státem.

Použité zdroje


1. Adresy v České republice [online]. 2011 [cit. 2011-01-30]. Ministerstvo vnitra České republiky. Dostupné na www: http://aplikace.mvcr.cz/adresa/xml.html

2. ARES - Standardizace adresy [on-line]. 2010 [cit. 2010-12-10]. Administrativní registr ekonomických subjektů. Dostupné na www: http://wwwinfo.mfcr.cz/ares/stdadr.html.cz

3. Archiv stránek bývalého Ministerstva informatiky -červen 2008 [on-line]. 2008 [Cit. 2010-11-28]. Dostupné na www:  http://aplikace.mvcr.cz/archiv2008/micr/scripts/detail.php_id_1964.html

4. Česká pošta [on-line]. 2010 [cit. 2010-10-24]. Poštovní podmínky ČP - Základní poštovní služby. Dostupné na www: http://www.ceskaposta.cz/assets/nastroje/zps.pdf.

5. Český statistický úřad [on-line]. Aktualizováno dne: 4.3. 2011 [Cit. 2011-03-10].  Dostupné na www:  http://czso.cz/csu/rso.nsf/i/typ_adresniho_mista

6. ČSN 01 6910. Úprava písemností zpracovaných textovými editory. Praha: Český normalizační institut, 2007. s. 45.

7. Městys Velký Újezd. Rozhodnutí Zastupitelstva městyse Velký Újezd ze dne 22. 9. 2010: 84/2010 Zavedení názvů ulic ve Velkém Újezdě [on-line]. 2010 [cit. 2010-11-10]. Elektronická úřední deska. Dostupné na www:  http://www.velkyujezd.cz/uredni_deska

8. Pravidla o způsobu použití a umístění čísel k označení budov, o postupu a oznamování přidělení čísel a dokladech potřebných k přidělení čísel [on-line]. 2010 [Cit. 2010-11-09]. Magistrát města Mostu. Dostupné na www: http://www.mesto-most.cz/vismo/dokumenty2.asp?id_org=9959&id=2792&p1=1078

9. SKÁLA, Petr. Čísla, podle kterých se orientujeme. Zeměměřič [on-line]. 1998, č. 9+10. Dostupné z www: http://www.zememeric.cz/9+10-98/popiscis.html. ISSN 1802-2731.

10. SMEJKAL, Vladimír. Informační systémy veřejné správy ČR: pro inženýrské studium na VŠE Praha. Vyd. 1. Praha: Oeconomica, 2003. s. 121. ISBN 80-245-0533-9.


Právní předpisy

11. Vyhláška č. 97/1961 Sb., o názvech obcí, označování ulic a číslování domů.

12. Vyhláška č. 326/2000 Sb., o způsobu označování ulic a ostatních veřejných prostranství názvy, o způsobu použití a umístění čísel k označení budov, o náležitostech ohlášení o přečíslování budov a o postupu a oznamování přidělení čísel a dokladech potřebných k přidělení čísel.

13. Zákon č. 133/2000 Sb., o evidenci obyvatel a rodných číslech a o změně některých zákonů (zákon o evidenci obyvatel), v platném znění.

14. Zákon č. 128/2000 Sb., o obcích (obecní zřízení), v platném znění.

15. Zákon č. 131/2000 Sb., o hlavním městě Praze, v platném znění.

16. Zákon č. 111/2009 Sb., o základních registrech v platném znění.



[1] Český statistický úřad: Územní číselníky [online]. 2011, [cit. 2011-01-30]. Dostupné z WWW: <http://www.czso.cz/csu/klasifik.nsf/i/uzemni_ciselniky >.  

[2] Ministerstvo vnitra České republiky: Adresy v České republice [online]. 2011, [cit. 2011-01-30]. Dostupné z WWW: <http://aplikace.mvcr.cz/adresa/xml.html>.  

[3] http://aplikace.mvcr.cz/adresa/index.html

Fotogalerie

Líbil se vám článek?
Stáhnout článek v PDF

0 komentářů

Přidat komentář

(If you're a human, don't change the following field)
Your first name.
(If you're a human, don't change the following field)
Your first name.

Přečtěte si také

Přihlášení Registrace
RSS Facebook Twitter YouTube
Zobrazit standardní verzi webu

Taky děláme

Feedback