AI GALERIE – UMĚLÁ INTELIGENCE A STROJOVÉ UČENÍ V DESIGNU


Autorský projekt pedagoga Jakuba Hrdiny a doktoranda Štěpána Dlabaji z ateliéru Průmyslový design, ve kterém autoři využívají nejprogresivnější technologie sloužící ke generování vizuálního obsahu s využitím umělé inteligence a strojového učení.

Generativní nástroje využívající principu "TEXT TO IMAGE" generování, tedy generování obrazu z textových příkazů. Pomocí daných příkazů (promptů) lze popsat vizuální ideu, na jejímž základě daný algoritmus vytváří vizuální obsah.

Do vstupu lze použít další parametry ovlivňující výsledek, jako například "SEED" (číselná hodnota - změnou hodnoty se mění výsledný generovaný obsah). Variací slov, změnou pořadí či použitím interpunkčních znamének lze generovat vždy nové obrazy. Na jednotlivá slova (ale i celé věty), lze uplatňovat parametr „váha“, kterým lze určit prefererenci povelů, či dokonce negativní hodnotou vyloučit daná slova. Zajímavostí jsou takzvaná „modifiers“ slova, která mají silný vliv na vizuální kvalitu výsledného generovaného obsahu. Aplikace Midjourney dále poskytuje možnost ovlivňování výsledku pomocí dalších parametrů,

například --stylize (míra stylizace), --quality (kvalita rendry), --ar (aspect ratio) či --iw (váha obrázku). U Stable diffusion jsou to parametry jako například počet iterací, cfg scale (celková váha povelu). Výhodou aplikace Midjourney je možnost iterovat a rozvíjet generovaný obsah pomocí funkce variation, čímž lze vytvořit velké množství variant a prozkoumat řadu vizuálních konceptů v krátkém čase. Výhodou Stable diffusion (Stability) a Dall-e 2 (OpenAI) je generování fotorealistických výstupů a možnost použití vstupního obrázku jako vizuálního vodítka. Dall-e 2 se pyšní funkcí inpainting, pomocí které lze vymazat určitou část obrazu a poté ji nahradit obrazem, který je definován textovým povelem. Funkce outpainting umožňuje naopak rozšířit hranice obrazu a generovat obraz mimo kompozice.

Autoři získali přístup k těmto state-of-art technologiím v rámci beta testování aplikací (Midjourney, Dall-e 2, Stable Diffusion), ale také experimentovali s dalšími difúzními modely (VQGAN-CLIP, StyleGAN, Disco Diffusion, NightCafé Creator, Majesty Diff ruDalle, DALL-E mini..)

Generativní technologie přinášejí rozsáhlé možnosti využití v jednotlivých fázích návrhového procesu designu.


Galerie autorských výstupů představuje výběr prací zaměřujících se na oblast průzkumu planety Mars a je rozdělena do několika celků od generovaných portrétů přes interiéry až po produkty. Jednotlivé generované výstupy jsou popsány tak, aby bylo možné identifikovat použitý model umělé inteligence.

U vybraných výstupů je dále uveden i textový povel (prompt), verze modelu, vybrané parametry, seed.).


Character design



Architektura a krajina



Průmyslový design a produkt



Image to image generování



Video experimenty



Univerzita Tomáše Bati ve Zlíně

Fakulta multimediálních komunikací

Třída Tomáše Bati 4342

760 01 Zlín

Tel: +420 733 690 836

surman@utb.cz