Nový AI systém dokáže vytvářet vizuální interpretace

25. 8. 2022Novinky

Meta vyvíjí nový systém umělé inteligence s názvem Make-A-Scene. Ten je schopný tvořit vizuální interpretace textů a náčrtů. Jedná se tak o další krok k pokročilejšímu strojovému učení a tvorbě rozšířené a virtuální reality.

Jednou z nejzajímavějších aplikací s umělou inteligencí poslední doby je Dall-E. Tento nástroj umožňuje zadat libovolný textový vstup – například „kůň používající sociální sítě“ – a na základě porozumění těmto údajům vytvoří obrázky.

Mnoho takových vizuálních experimentů jste nejspíš už viděli, protože jich po internetu koluje velké množství. Některé z nich jsou navíc i velmi užitečné a použitelné v nových kontextech.

Zdroj: Social Media Today

A již brzy budete mít další možnost, jak experimentovat s interpretací AI tohoto typu. Meta totiž vyvíjí systém Make-A-Scene, který rovněž využívá textové výzvy a vstupní kresby k vytváření zcela nových vizuálních interpretací.

Make-A-Scene umožňuje vytvářet obrázky pomocí textových podnětů a volných náčrtů. Předchozí systémy umělé inteligence pro generování obrázků obvykle používaly jako vstup textové popisy, ale výsledky bylo obtížné předvídat. Například textový vstup „obraz zebry jedoucí na kole“ nemusel přesně odrážet to, co jste si představovali – kolo mohlo být obrácené bokem nebo zebra mohla být příliš velká nebo naopak malá.

Systém Make-A-Scene se to snaží řešit tím, že nabízí více ovládacích prvků, které pomáhají řídit výstup. Jedná se tedy o podobnou aplikaci jako Dall-E, ale podle Mety je o něco dokonalejší a má možnost používat více podnětů k vedení systému.

Zdroj: Meta

Make-A-Scene umožní například rozvrhnout scénu s tím, že jako vstupní data stačí hrubý náčrt. Může také generovat vlastní rozvržení na základě pouze textových pokynů.

Takové experimenty ukazují, jak daleko počítačové systémy pokročily v interpretaci různých vstupů a kolik toho dnes sítě umělé inteligence dokáží pochopit o tom, co komunikujeme a co máme na mysli ve vizuálním smyslu.

To nakonec pomůže procesům strojového učení naučit se více o tom, jak lidé vidí svět, a lépe jim porozumět. A to v konečném důsledku pomůže zdokonalovat řadu funkčních aplikací, jako jsou automatizovaná auta, vylepšené zážitky v rozšířené a virtuální realitě a další.

Systém Make-A-Scene mají momentálně k dispozici vybraní umělci, aby zjistili, co díky němu dokáží vytvořit.

Podrobnosti najdete na blogu Mety.

Jsem copywriterka a zakladatelka textového studia COPYBARA. Jako šéfredaktorka Newsfeed.cz zodpovídám za to, že se k vám dostanou ty nejzajímavější aktuality, praktické návody vás posunou o kus dál a případovky inspirují k ještě lepším výsledkům.

Komentáře