PJ1 Lesson 11

Pracujte v projektu pl1-lab11.zip.

Pracujte s textem ve třídě „Book“.

1. Spočítejte četnost samohlásek bez ohledu na velikost písmen. Použijte metody „length“, „charAt“ a „toLowerCase“.

2. Spočítejte četnosti spojení „the old man“ a „the sea“ bez ohledu na velikost písmen. Použijte metody „toLowerCase“ a „indexOf(String str, int fromIndex)“.

3. Spočítejte četnosti spojení „the old man“ a „the sea“ bez ohledu na velikost písmen. Použijte Pattern, Mattern. Porovnejte výsledky s předchozí úlohou.

4. Spočítejte celkový počet slov. Použijte metodu split a vhodný regulární výraz pro definici interpunkce mezi slovy.

Pracujte s textem ve třídě „Html“.

5. Najděte všechny hypertextové odkazy v html. Použijte třídy Matcher a Pattern.

Pro následující použijte třídy URL, URLConnection a I/O streamy.

6. Vytvořte pomocnou metody cz.kozusznik.pl1.utils.IORoutines.readPage, která stáhne obsah celé stránky jako String. Použijte ji pro získání https://katedrainformatiky.cz/ a zpracujte ji podobně jako jako v úloze 5.

Domácí úkol

Nalezněte všechny palindromy v textu (Book.toString()), které jsou delší než jeden znak – použijte princip pro vyhledávání slov v textu (úloha 4) a každé slovo testujte, zda je palindrom.

Ze stránky https://wonderfulengineering.com/50-nature-wallpapers-hd-for-free-download/ – uložte si ji lokálně pomocí prohlížeče a použijte metodu cz.kozusznik.pl1.utils.IORoutines.readFile nebo použijte přímo metodu cz.kozusznik.pl1.utils.IORoutines.readPage – vyextrahujte všechny odkazy na obrázky, které mají sloužit jako tapeta – v atributu „alt“ je obsažen text „nature wallpapers“. Uložte pouze názvy souborů do seznamu a tento seznam setřiďte podle rozměrů obrázků (výška*šířka) a pak podle názvu.

Stáhněte prvních 5 obrázku pomocí URL, URLConnection a uložte na disk s názvem Picture_<order-number>.<suffix>.