Mýtus: Poslední číslo na občanském průkazu

V České republice je rozšířen mýtus, či konspirační teorie, že poslední číslo na občanském průkaze ukazuje kolik dané osobě je podobných lidí. Druhá teorie říká, že má být šifrou informující o počtu lidí stejného jména. Tento mýtus je poměrně starý, známé jsou zprávy o něm již z roku 2005, dosud mu však věří mnoho lidí. Ve skutečnosti se jedná skutečně jen o mýtus, který nemá s realitou nic společného. Co tedy znamenají ona „divná“ čísla, která máme na „občance“?

Jedná se o strojově čitelné informace usnadňující automatizované zpracování pomocí OCR. OCR neboli optické rozpoznávání znaků je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem.

Pokud chceme zjistit, co daná čísla znamenají, musíme nejprve rozlišit starší občanské průkazy (se zelenou barvou) a nové průkazy vydávané od roku 2012. Číslo na starších průkazech mělo tři řádky, na novém dokladu jich je méně, má však kromě strojově čitelných informací i 2D kód.

Občanský průkaz vzor 2005 (zelený průkaz)

Obsahoval dva řádky

I. řádka:

Dva znaky – typ a podtyp dokladu
Tři znaky – vydavatelský stát (podle ISO 3166, Česká republika – CZE)
Příjmení držitele ukončené sekvencí ‚<<‚
Jméno držitele ukončené sekvencí ‚<<‚ nebo koncem řádku.
Zbytek vyplněn znakem „<„. Samostatný výskyt znaku ‚<‚ ve jménu a nebo příjmení má význam mezery (používá se třeba u lidí s více křestními jmény). Doplňky (Jr., II apod.) se kódují do příjmení a oddělují ‚<‚.

II. řádka:

Devět znaků – číslo dokladu
Jeden znak – kontrolní číslice k číslu dokladu
Tři znaky – občanství (podle ISO 3166, Česká republika – CZE)
Datum narození (ve formátu YYMMDD)
Jeden znak – kontrolní číslice k datu narození.
Pohlaví (M – muž; F – žena)
Platnost do (ve formátu YYMMDD)
Jeden znak – kontrolní číslice k datu platnosti.
Volitelné pole proměnně délky. Podle přítomnosti/nepřítomnosti kontrolního znaku volitelného pole a souhrnného kontrolního znaku končí na konci řádku nebo jeden či dva znaky před koncem řádku.
Kontrolní znak volitelného pole – na některých typech dokladů chybí zcela, na jiných není vypočítán a obsahuje znak ‚<‚
Volitelný souhrnný kontrolní znak přítomný pouze na některých dokladech. Pokud je přítomen, pak je vypočten ze znaků na pozicích 1-10 (číslo dokladu vč. KZ), 14-20 ( datum narození vč. KZ), 22-28 (platnost do vč. KZ) a 29 – ? (volitelného pole vč. KZ)
U některých typů dokladů může délka čísla dokladu přerůst 9 znaků – v tom případě je v poli „číslo dokladu“ prvních 9 znaků, místo kontrolního znaku je ‚<‚, zbývající část čísla je ve volitelném poli. V takovém případě volitelné pole neobsahuje obsah obvyklý pro daný typ dokladu a zemi vydání

Občanský průkaz vzor 2012 (nový průkaz bez laminace)

Struktura strojově čitelné zóny tvořená třemi řádky je následující:

1. První řádek:
a. kód dokladu (ID pro občanské průkazy, IR pro povolení k pobytu),
b. kód vydávajícího státu (např. CZE pro ČR),
c. číslo dokladu (doplněné znaky „<“ pokud je kratší než 9 znaků, případně
zkrácené na 9 znaků, pokud je delší),
d. kontrolní číslice,
e. doplnění znaky “<” do konce řádku (řádek má celkem 30 znaků).

2. Druhý řádek:
a. datum narození (ve formátu RRMMDD),
b. kontrolní číslice,
c. pohlaví (F pro ženy, M pro muže, „<“ pokud neznámo),
d. datum vypršení platnosti (ve formátu RRMMDD),
e. kód státu státního občanství držitele (např. CZE pro ČR),
f. doplnění znaky “<”,
g. kontrolní číslice druhého řádku.

3. Třetí řádek:
a. příjmení (pokud je tvořeno několika slovy oddělují se znakem „<“),
b. znaky „<<“ jako oddělovač příjmení a jména,
c. křestní jméno či jména (oddělená znakem „<“, pokud je jmen více),
d. doplnění znaky “<” do konce řádku (řádek má celkem 30 znaků).
Kontrolní číslice závisí na několika znacích a ty kombinuje v jednu číslici tak, aby
bylo možné detekovat chybné rozpoznání některého znaku. V takovém případě je třeba
snímání strojově čitelné zóny a automatizovanou detekci písmen provést znovu. Kontrolní
číslice obdobného typu se používají např. v poslední číslici rodného čísla nebo v ISBN kódu
knih. Tato číslice nenese novou informaci a pouze vychází z ostatních údajů.
Je zřejmé, že všechny uvedené údaje jsou také zapsány v jednotlivých položkách
dokladu, strojově čitelná zóna tedy neobsahuje dodatečné údaje o dokladu nebo jeho držiteli.

2D kódu měl v šifrované podobě zapisovat agendový identifikátor fyzické osoby (AIFO) pro agendu občanských průkazů a číslo občanského průkazu. Nakonec ale bylo schváleno zapsání zakódovaného čísla občanského průkazu. Kódování je provedeno kódem PDF417, jehož algoritmus je veřejně znám a je publikován ve standardu ISO 15438. Ověřit, co je skutečně uvedeno v 2D kódu, se tak dá například pomocí chytrých telefonů s kamerou.

Zdroj a zdroj

Diskuze o tomto mýtu byly vedeny například zde, zde, zde a zde.

Napsal: Jan Cemper