Třetí série začátečnické kategorie dvacátého devátého ročníku KSP
Celý leták, který posíláme také papírově, v PDF.
Řešení úloh
- 29-Z3-1: Želva na dvorku
- 29-Z3-2: Písemka z angličtiny
- 29-Z3-3: Šestková čísla
- 29-Z3-4: Zdobení stromečku
- 29-Z3-5: Prvočíselné rozklady
- 29-Z3-6: Trable s dominem
29-Z3-1 Želva na dvorku (Zadání)
Úloha byla opět jen drobným rozšířením Krocení zlé želvy z druhé série. Želva se chovala úplně stejně, přibyly pouze překážky. Přesto ale řešení neodbudeme a ukážeme si ještě jeden, trochu jiný, způsob simulace pohybu želvy.
V minulém řešení jsme si pamatovali aktuální souřadnice želvy jako dvě čísla a směr želvy jako číslo třetí. Pak jsme měli připravená pole, která říkala, v jakém směru máme o kolik změnit jednu ze souřadnic.
Tento přístup se hodí, pokud například chceme procházet všech 8 políček,
na které můžeme skočit šachovým koněm z aktuálního políčka. Součástí programu
bude statické pole obsahující políčka, na které může kůň skočit ze souřadnic
[0, 0]
. Pokud zrovna nestojí na tomto políčku, stačí souřadnice patřičně
posunout.
Nám ale stačí pamatovat si aktuální směr želvy, a proto můžeme program na pohled trochu zjednodušit. Nebudeme si směr pamatovat jako nějaké magické číslo, ale jako směrový vektor. Slovní spojení je to děsivé, ale vysvětlení je prosté. Směrový vektor je rozdíl příštího a aktuálního políčka – pokud tedy želva udělá krok. Želva je na začátku otočená na sever, tomu odpovídá vektor (0, 1).
Na povel krok zareagujeme snadno, prostě směrový vektor přičteme k aktuální souřadnici. Otáčení je složitější na pochopení, ale o to snazší na napsání.
Pokud je směrový vektor (dx, dy) a želva se otáčí za levou rukou, vezmeme jako nový směrový vektor (-dy, dx). Vyzkoušejte, funguje to. Můžete si zkusit napsat směrové vektory pro všechny čtyři směry a uvidíte, že vždy obsahují jednu nulu a jednu (mínus) jedničku. Prohlédněte si, jak otáčením jednička „cestuje“.
Teď ale to hlavní: překážky. Potřebujeme zařídit, aby želva nechodila skrz ně. Představme si na chvíli, že umíme snadno poznat, jestli na daném políčku je překážka. Potom si můžeme před každým krokem spočítat pozici cílového políčka a podívat se, jestli je obsazené překážkou. Pokud ano, započítáme naražení do překážky a želva se nepohne. Pokud ne, změníme souřadnice želvy na ty vypočtené.
Jak ale poznat, jestli je na zvoleném políčku překážka? Pokud si všechny překážky vložíme za sebe jen tak do pole, budeme jej muset před každým krokem celé projít. To by mělo časovou složitost lineární s počtem překážek, O(P) pro každý krok želvy. Tedy až O(P ·N) pro celý běh programu.
Pokud si ale souřadnice překážek po načtení lexikograficky seřadíme, můžeme v nich hledat binárním vyhledáváním. Tím se poměrně snadno dostaneme na časovou složitost O(N log P + P), což je rozhodně o něco lepší. Pokud přemýšlíte proč +P, pak protože musíme překážky také načíst, což trvá O(P) (a P může být větší než N log P, takže se to do prvního členu neschová).
Naprogramovat či popsat binární vyhledávání je dobré cvičení, které bychom po vás chtěli v teoretické domácí úloze. Pokud ale píšete program, můžete využít knihoven vašeho programovacího jazyka. Existuje totiž často používaná datová struktura, která umí prvky rychle přidávat a testovat jejich existenci. Běžně se jí říká množina, set.
Zejména v Pythonu je její použití extrémně jednoduché. Opravdu stačí místo
hranatých závorek (případně funkce list
) použít funkci set
, která
vrátí množinu prvků z parametru. Testování na existenci funguje úplně stejně
jako s polem pomocí operátoru in
.
29-Z3-2 Písemka z angličtiny (Zadání)
Uvědomit si přímočaré řešení není vůbec těžké. Stačí si uložit všechna slova do pole, pro každé jednotlivé slovo pole projít a počítat si jeho prefixy. Pak vypíšeme slovo s nejvyšším počtem nalezených prefixů. Celý výpočet proběhne v O(N2), kde N je součet délek všech slov.
Zkusíme najít něco lepšího. Pokud jste si vzpomněli na řešení úlohy 29-Z1-5, správně vás napadlo použít trii. Pro připomenutí: trie je zakořeněný strom, kde vrcholy reprezentují písmena a každé slovo ve slovníku představuje cestu z kořene do listu. Každý vrchol tedy můžeme chápat jako prefix: musíme si ale označit vrcholy, kde nějaké slovo končí.
Vyrobíme si trii ze všech slov na vstupu. Ke každému vrcholu chceme určit S, počet slov ze slovníku, která jsou jeho prefixem. Proto projdeme trii do hloubky: do zásobníku si kromě vrcholu uložíme i jeho S. Na začátku bude zásobník obsahovat kořen trie a S = 0. Cílem je najít slovo s nejvyšším S.
Jeden krok průchodu se bude skládat z vyjmutí vrcholu a jeho S ze zásobníku. Pokud ve vrcholu končí slovo, zvýšíme S o 1. Pak do zásobníku vložíme všechny potomky vrcholu s vypočteným S.
Po celou dobu si ukládáme vrchol s nejvyšším S a jakmile skončíme průchod, vypíšeme slovo, které vrcholu odpovídá. Abychom to mohli udělat, musíme se z vrcholu vrátit až do kořene a po cestě si ukládat písmena.
To, že ve vrcholu s nejvyšším S končí slovo ze slovníku, nemusíme vůbec kontrolovat. Stačí si uvědomit, že to vždy bude list stromu, tedy vrchol bez potomků (a v něm vždy nějaké slovo končí).
Paměťová složitost je jistě O(N), vrcholů nebude více, než je součet délek slov. Časová složitost však závisí na tom, jakým způsobem budeme ve vrcholech ukládat odkazy na potomky.
Používáme anglickou abecedu s malými znaky, proto je potomků nejvýše 26. Můžeme ve vrcholech vytvořit pole odkazů s touto délkou: k vrcholu sice dokážeme přistoupit v konstantním čase, ale spotřeba paměti nehezky naroste (pro slovník „normálních“ slov bude obvykle obsazena jen malá část pole).
Lepší možností je si ukládat ukazatele do vyváženého binárního stromu, případně využít hešování. U první možnosti bude vytvoření trie i průchod v O(N· log 26) = O(N), u druhé také v O(N).
Autorský zdrojový kód využívá hešování. V Pythonu se heš tvoří přímočaře, obvykle se ale této struktuře říká slovník (dictionary). Hodí se však vědět, jak funguje uvnitř, což popisujeme v naší hešové kuchařce.
29-Z3-3 Šestková čísla (Zadání)
Řešení úlohy si rozdělíme na dvě části. Nejdříve šestkový zápis převedeme na číselnou hodnotu a poté pro výsledné číslo vypíšeme jeho hlavní zápis.
Pokud by šestkové číslice byly pouze v sestupném pořadí, stačilo by projít vstup a sečíst jejich hodnoty. Může se ale stát, že skupinu stejných šestkových číslic následuje číslice vyšší hodnoty a my musíme předchozí odečíst.
Budeme si proto držet dvě pomocné proměnné h a p. První h bude označovat hodnotu poslední číslice, kterou jsme viděli, druhá p pak kolik těchto číslic jsme viděli nepřerušovaně za sebou.
Vstup projdeme číslici po číslici a budeme průběžně aktualizovat pomocné proměnné i tu, která drží celkový výsledek.
Pokud je aktuálně zpracovávaná číslice hodnoty h, stačí p zvýšit o jedna.
Pokud je nižší hodnoty, k celkovému výsledku přičteme hodnoty číslic reprezentovaných v pomocných proměnných. Poté nastavíme p na jedničku a h na hodnotu aktuální.
Pokud je hodnota aktuální číslice vyšší, přičteme k výsledku hodnotu aktuální číslice a odečteme hodnotu těch, které jsou reprezentovány pomocnými proměnnými. Víme, že v tomto případě následující číslice určitě bude menší než aktuální, proto stačí nastavit pomocné proměnné p na nula a h na hodnotu aktuální číslice. Díky tomu se při příštím průchodu pomocné proměnné nastaví na nové hodnoty.
V druhé části máme číslo (pojmenujme jej c), které chceme vypsat v hlavním šestkovém zápisu. Představme si, že nemůžeme odečítat. Pak stačí procházet číslice od největší po nejmenší. V každém průchodu pak, dokud je c větší než aktuální číslice, odčítáme od c tuto číslici a zároveň ji vypisujeme na výstup.
My ale můžeme i odečítat, což potřebujeme, abychom se vyhnuli zakázaným čtyřem stejným číslicím za sebou. Označme si hodnotu aktuální číslice jako a. Pokud je c≥ a zachováme se stejně jako v předchozím odstavci.
4 |
6 |
2 |
6 |
4 |
6 |
4 |
6 |
5 |
6 |
5 |
6 |
1 |
6 |
29-Z3-4 Zdobení stromečku (Zadání)
Rozmyslíme si, že si můžeme vánoční stromeček představit jako graf, kde jednotlivé větve stromečku jsou vrcholy. Potom každý přidaný řetěz bude tvořit v tomto grafu hranu. Chceme zjistit, přidáním které hrany vznikne v grafu kružnice.
Pojďme si nejprve vyřešit jednodušší úlohu: dostali jsme nějaký graf a chceme zjistit, jestli v něm kružnice je. Na to nám stačí použít prohledávání do šířky či hloubky. Ke každému navštívenému vrcholu si uložíme informaci, odkud jsme přišli. Pak se podíváme na všechny jeho sousedy. Pokud některý z nich už byl navštívený a není to ten, ze kterého jsme právě přišli, znamená to, že jsme objevili cyklus. Tohle ověření zvládneme v lineárním čase, O(N+M), kde N je počet vrcholů a M je počet hran.
Nyní se nabízí jednoduché řešení celé úlohy: postupně přidáváme do grafu hrany a po každém přidání ověříme, jestli už v grafu není cyklus. Ale pak ověření provádíme celkem M-krát, časová složitost je tedy O(M·(N+M)). To je celkem pomalé.
Zkusme to lépe. Všimneme si jedné věci: v průběhu přidávání hran nějakou dobu graf pořád neobsahuje cyklus, pak se tam objeví a od té doby už graf stále obsahuje cyklus.
My hledáme předěl mezi těmito dvěma stavy. K tomu můžeme použít binární vyhledávání. Zkusíme do grafu přidat prvních M/2 hran a podíváme se, jestli obsahuje cyklus. Pokud ano, musel vniknout přidáním některé z prvních M/2 hran, jinak musí vzniknout přidáním některé z druhých M/2.
Předpokládejme, že nastal první případ. Rozpůlíme tedy interval od 1 do M/2 – vytvoříme nový graf, do kterého přidáme jen prvních M/4 hran. Opět ověříme, jestli obsahuje kružnici, a podle toho víme, že provinilá hrana leží buď v intervalu od 1 do M/4, nebo od M/4 do M/2. Takhle pokračujeme v půlení, dokud nám nezbude jediná hrana – ta hledaná.
Abychom nemuseli graf stavět pořád znovu a znovu, stačí si u každé hrany pamatovat „čas“, ve kterém vznikla. Binární vyhledávání pak odpovídá půlení časových intervalů. Samotné prohledávání grafu na existenci cyklu upravíme tak, aby ignorovalo hrany, které teprve vzniknou.
Jeden pokus nám trvá lineární čas a binární vyhledávání provede O(log M) kroků, dohromady O((N+M) log M).
Ukážeme si ještě jedno, avšak pokročilejší, řešení. K tomu se nám bude hodit pojem komponenta souvislosti (viz opět grafovou kuchařku).
Na začátku jsou všechny vrcholy izolované a každý z vrcholů tvoří svou vlastní komponentu souvislosti. Pojďme se podívat, co přidávání hran do grafu s těmito komponentami provede.
První možnost je, že jsme přidali hranu mezi dvěma vrcholy, které patří do různých komponent. Potom jsme mezi nimi vytvořili novou cestu, a tedy jsme tyto dvě komponenty spojili v jednu.
Jestliže však byly oba vrcholy součástí stejné komponenty, existovala již dříve mezi nimi nějaká cesta. Potom přidáním této hrany vznikne mezi oběma vrcholy druhá cesta, která spolu s první utvoří cyklus.
Díky tomuto pozorování můžeme místo hledání cyklů v grafu kontrolovat, zda před přidáním každé hrany byly oba vrcholy ve stejné komponentě souvislosti. Jak takový stav ale zjistíme?
Mohli bychom jednoduše kontrolovat, zda jsou oba vrcholy součástí stejné komponenty pomocí prohledání do hloubky nebo do šířky. Avšak takové prohledání může potenciálně projít celý graf. Časová složitost takové kontroly je tedy O(N+M), která se pro každou hranu sečte na časovou složitost algoritmu O(M(N+M)). To jsme si moc nepomohli.
Pojďme to zkusit lépe použitím něčeho, což už vymysleli informatici před námi. V algoritmu používáme dvě základní operace, a to přidání hrany a zjišťování komponenty souvislosti dvou vrcholů. Těmto operacím se v informatické hantýrce říká union a find. Existuje datová struktura zvaná DFU, která je umí provádět velmi efektivně. Je popsaná v naší kuchařce o minimálních kostrách. Využitím této struktury se poté úloha změní na postupné volání find a union pro každou hranu. Časová složitost takového algoritmu poté bude O(M log N).
29-Z3-5 Prvočíselné rozklady (Zadání)
V úloze jsme po vás chtěli najít postup, kterým rozložíte přirozené číslo na součin prvočísel. Odborněji řečeno se takovému procesu říká faktorizace a patří k velmi složitým problémům matematiky. Dodnes nikdo nezná algoritmus, který by dokázal faktorizovat velká (řádově tisíciciferná) čísla dost rychle na to, abychom se dočkali výsledku. Této vlastnosti se využívá v mnoha šifrovacích algoritmech, mimo jiné i ve známém RSA.
Popíšeme si autorské řešení. Na začátku běhu programu dostaneme číslo M a máme slíbeno, že jakékoliv číslo x, které dostaneme k faktorizaci, bude menší. Jeho rozklad se tudíž bude skládat z prvočísel menších než M. Pokud bychom je všechna dokázali najít, můžeme rozklad snadno určit: postupně projdeme prvočísla a každým z nich dělíme x tak dlouho, dokud je prvočíslem dělitelné.
Také si uvědomíme, že nám ve skutečnosti stačí prvočísla menší nebo rovna √M. Větší prvočíslo se v rozkladu nachází nejvýše jednou a získáme ho jako to, co nám zbude z x, když už nejde dělit žádným z prvočísel menších než √M (rozmyslete si).
Jeden rozklad bude trvat čas O(k+ℓ), kde k je počet prvočísel menších než √M a ℓ je délka výsledného rozkladu. Rozklad nebude obsahovat více než O(log M) prvočísel – každý činitel je alespoň dvojka. Odhadnout k shora pomocí M je těžké, spokojíme se tedy s O(√M).
Ale jak prvočísla najít? Použijeme Eratosthenovo síto, které možná znáte z hodin matematiky. S tužkou a papírem funguje následovně: nejdřív si vypíšeme do řady všechna čísla od 2 do √M. Postupně budeme chtít zakroužkovat všechna prvočísla a škrtnout všechna složená.
Jeden krok algoritmu vypadá takto: vezmeme první neoznačené číslo (ani zakroužkované ani škrtnuté) a zakroužkujeme ho. Potom škrtneme všechny jeho násobky (pokud jsme zakroužkovali k, škrtneme 2k, 3k, …).
Takže v prvním kroku zakroužkujeme dvojku a škrtneme všechna sudá čísla. V druhém zakroužkujeme trojku a škrtneme všechny násobky tří. A tak dále. Vyzkoušejte a rozmyslete si, že to funguje.
Pokud ho chceme naprogramovat, místo papíru použijeme pole sito velikosti √M. V něm na i-té pozici bude jednička, pokud číslo i je škrtnuté, jinak nula. Navíc si budeme pamatovat poslední nalezené prvočíslo p. Pak je postup jednoduchý:
- Vyplníme pole sito samými nulami (na začátku není nic škrtnuté).
- p ←2
- Opakujeme dokud p ≤ √M:
- Přidáme p do seznamu prvočísel.
- Škrtneme všechny násobky p: nastavíme sito[2p], sito[3p], sito[4p], …na 1.
- Posuneme se na nejbližší neškrtnuté číslo napravo: zvyšujeme p, dokud nebude sito[p]=0.
Časová složitost síta velikosti √M je O(√M · log log √M): důkaz není úplně jednoduchý, takže ho zde nebudeme uvádět. Můžete si ho přečíst v řešení úlohy 24-3-5.
Tímto způsobem vyřešíme úlohu s O(√M) pomocné paměti, O(√M · log log √M) času na předvýpočet a O(√M) času na jeden dotaz. Pokud si ale dovolíme použít více paměti a času na předvýpočet, dostaneme další velmi dobrý algoritmus.
Když už složené číslo x škrtáme, známe prvočíslo p, které ho dělí. Pokud si ho zapamatujeme jako px, bude spočítání rozkladu triviálně jednoduché: Dostaneme-li x, do rozkladu přidáme px. Opakujeme s x / px, dokud nám nezbude prvočíslo. Takto rozklad spočítáme v O(log x), tedy O(log M).
Bohužel tím musíme rozšířit síto na všech M čísel. To nás bude stát O(M) pomocné paměti a výpočtem síta strávíme O(M · log log M) času. I tak se to ale vyplatí, pokud bude počet dotazů N dostatečně velký.
29-Z3-6 Trable s dominem (Zadání)
Ačkoli to tak na první pohled nevypadá, tato úloha je grafová. Pokud toho o grafech ještě nevíte dost, určitě si přečtěte naši kuchařku o grafech.
Jaký graf si tedy pod zadáním představíme? Obyčejný neorientovaný. Vrcholy nám budou tvořit symboly, které se vyskytují na dominu. Každá kostička obsahuje právě dva symboly, tedy nám v grafu budou tvořit hrany. Nebo lépe, hrany budou druhy kostiček, které máme k dispozici.
Nyní si vyberte vrchol v grafu, a zkuste přes hrany přecházet do jiných vrcholů. Taková posloupnost vrcholů a hran tvoří sled v grafu. Čemu to odpovídá v dominové analogii? Možná jste uhodli že postaveným hadům z cukroví.
Každý had vypadá jako sled v našem grafu a naopak, každý sled jde postavit jako hada z domina. Naši kamarádi se v příběhu dostali do situace, ve které nemohli dva hady spojit žádným „mezihadem“. To znamená, že mezi koncovými symboly neexistoval v našem grafu žádný sled.
To se v grafu může stát pouze tehdy, pokud je graf nesouvislý. To znamená, že symboly jde roztřídit na (alespoň) dvě hromádky tak, aby každá kostička používala symboly pouze z jedné a žádná kostička dvě hromádky nepropojuje.
Mimo jiné to znamená, že dva hadi z příběhu neměli žádný symbol společný – jinak by šlo hady propojit přes něj.
Řešením úlohy je tedy vytvořit graf a ověřit, zdali je souvislý. To jde provést velice snadno prohledáním, například do hloubky. Během prohledávání budeme vrcholy obarvovat, a pokud nám na konci zbyl nějaký neobarvený, graf je nutně nesouvislý, a naši kamarádi si musí dát příště větší pozor.
Postavení grafu a jeho prohledání stihneme v O(N + M), kde N je počet vrcholů a M počet hran. Protože ale graf nemá izolované vrcholy (každý symbol se musel vyskytnout na nějaké kostičce), musí být M ≥ N a tedy je časová složitost pouze O(M). Při rozumné reprezentaci v paměti nám bude stačit i O(M) paměti.