Pracujte v projektu pl1-lab11.zip.
Pracujte s textem ve třídě „Book“.
1. Spočítejte četnost samohlásek bez ohledu na velikost písmen. Použijte metody „length“, „charAt“ a „toLowerCase“.
2. Spočítejte četnosti spojení „the old man“ a „the sea“ bez ohledu na velikost písmen. Použijte metody „toLowerCase“ a „indexOf(String str, int fromIndex)“.
3. Spočítejte četnosti spojení „the old man“ a „the sea“ bez ohledu na velikost písmen. Použijte Pattern, Mattern. Porovnejte výsledky s předchozí úlohou.
4. Spočítejte celkový počet slov. Použijte metodu split a vhodný regulární výraz pro definici interpunkce mezi slovy.
Pracujte s textem ve třídě „Html“.
5. Najděte všechny hypertextové odkazy v html. Použijte třídy Matcher a Pattern.
Pro následující použijte třídy URL, URLConnection a I/O streamy.
6. Vytvořte pomocnou metody cz.kozusznik.pl1.utils.IORoutines.readPage, která stáhne obsah celé stránky jako String. Použijte ji pro získání https://katedrainformatiky.cz/ a zpracujte ji podobně jako jako v úloze 5.
Domácí úkol
Nalezněte všechny palindromy v textu (Book.toString()), které jsou delší než jeden znak – použijte princip pro vyhledávání slov v textu (úloha 4) a každé slovo testujte, zda je palindrom.
Ze stránky https://wonderfulengineering.com/50-nature-wallpapers-hd-for-free-download/ – uložte si ji lokálně pomocí prohlížeče a použijte metodu cz.kozusznik.pl1.utils.IORoutines.readFile nebo použijte přímo metodu cz.kozusznik.pl1.utils.IORoutines.readPage – vyextrahujte všechny odkazy na obrázky, které mají sloužit jako tapeta – v atributu „alt“ je obsažen text „nature wallpapers“. Uložte pouze názvy souborů do seznamu a tento seznam setřiďte podle rozměrů obrázků (výška*šířka) a pak podle názvu.
Stáhněte prvních 5 obrázku pomocí URL, URLConnection a uložte na disk s názvem Picture_<order-number>.<suffix>.