Pohľad na nové Al Generative Art

Al Generatívne umenie je druh umenia, vo väčšine prípadov vizuálneho, ktorý je založený na spolupráci medzi človekom a autonómnym systémom. „Autonómny systém“ je definovaný ako Umelá inteligencia softvér, algoritmus alebo model schopný vykonávať zložité operácie bez potreby zásahu programátora.

Z bizarných juxtapozícií obrazov vytvorených Dall-E Mini k NFT Na trhu sa obrázky generované algoritmami AI čoraz viac dostávajú do mainstreamovej predstavivosti. V skutočnosti dva dôležité projekty na túto tému, ktoré si zaslúžia analýzu, sú: Stredná cesta a DALL-E2.

Novinka sa samozrejme dostala aj na Twitter. Komentuje to okrem iného Charles Hoskinson, ktorý napísal:

Al Generative Art: prvé experimenty a funkcie

Po pochopení toho, čo je generatívne umenie, je dôležité zdôrazniť jeden z jeho základných princípov: náhodnosť. Čo je základnou vlastnosťou generatívneho umenia.

V skutočnosti, v závislosti od typu softvéru, je autonómny systém schopný spracovať výsledky, ktoré sú vždy iné a jedinečné pri každom vykonaní príkazu na generovanie, alebo môže vrátiť premenlivý počet výsledkov ako odozvu na vstup používateľa.

Prvé experimenty v generatívnom umení sa datujú do 1960. rokov XNUMX. storočia s experimentmi o Harold Cohen a jeho AARON program. Cohen prvýkrát použil samostatný softvér na generovanie abstraktných umeleckých diel inšpirovaných pop-artovými sieťotlačami. Cohenove diela sú teraz vystavené v Tate Gallery v Londýne.

Ďalším atribútom generatívneho umenia, ktorý je však stále menej výsadou, je opakovanie vzorov alebo abstraktných prvkov poskytnutých programátorom a implementovaných v softvérovom kóde.

Okrem toho vývoj čoraz zložitejších neurónových sietí fungujúcich na asociácii textu a obrazu umožnil vývoj generatívnych modelov schopných vytvárať čoraz realistickejšie a presnejšie obrázky. Najznámejším príkladom tejto kategórie generatívneho umenia je Doska.

Dall-E je multimodálna neurónová sieť založená na GPT-3 model hlbokého učenia z OpenAI, rovnaká spoločnosť, ktorá sa nedávno rozvinula ChatGPT, chatbot spustený v novembri 2022 a optimalizovaný pomocou "pod dohľadom" a posilňovacie techniky učenia.

Keď sa vrátime k Dall-E, vidíme, že tento systém je schopný generovať obrázky z textového popisu, tzv. "pohotové," založené na množine údajov párov text-obrázok.

Prvá verzia Dall-E, ktorá bola verejnosti predstavená v januári 2021 a zostala výsadou malého počtu profesionálov v tejto oblasti, predstavovala skutočnú revolúciu z hľadiska tohto typu generatívneho modelu, ktorá prekonala inovácie GPT- 3.

Dôležitá je aj skutočnosť, že presnosť výsledkov spracovaných Dall-E sa ukázala ako dokonalý priestor pre ďalšie riešenie OpenAI: CLIP (Predtréning na kontrastný jazyk-obrázok).

Neurónová sieť na klasifikáciu a hodnotenie obrázkov trénovaná na základe asociácií textu a obrázkov, ako sú napríklad titulky nájdené na internete. Vďaka zásahu CLIP, ktorý znižuje počet výsledkov navrhnutých používateľovi na výzvu na 32, sa zistilo, že Dall-E vo väčšine prípadov vracia uspokojivé obrázky.

Midjourney: dizajn, ľudská infraštruktúra a umelá inteligencia

Ako sa predpokladalo, Stredná cesta je dôležitý projekt, ktorý je súčasťou vznikajúceho konceptu Al Generative Art. Konkrétne Midjourney je nezávislé výskumné laboratórium, ktoré skúma nové spôsoby myslenia a rozširuje predstavivosť ľudského druhu.

Použitie je jednoduché: najprv si musíte vytvoriť účet zvar, platforma, ktorá hostí rôzne komunity, pričom Midjourney je jednou z nich. V rámci aplikácie sa nachádzajú rôzne chatroomy, v ktorých sa možno aktívne zapájať do diskusií alebo nie.

Je dôležité zdôrazniť, že ak chcete prvýkrát vyskúšať umelú inteligenciu, musíte prejsť na "nováčikovia" kanály, kde 25 bezplatných renderov sú k dispozícii.

Jeden render zodpovedá vygenerovaniu štyroch rôznych variantov generovaných z rovnakého textového vstupu.

Teda 25 vykreslení odkazuje na 25 úloh spracovania vykonávaných robotom Midjourney. V dôsledku toho si generovanie obrázka vyžaduje interakciu s robotom Midjourney prostredníctvom textovej správy nazývanej „výzva“, v ktorej budú kľúčové slová popisujúce obrázok, ktorý má používateľ na mysli.

Môžete pridať toľko podrobností, koľko chcete, dôležité je rozdeliť kľúčové slová čiarkou. Po dokončení vykresľovania počítač vráti štyri rôzne obrázky na základe popisov, z ktorých si môžete vybrať.

Okrem toho, keď program dokončí vykresľovanie, môžete na základe obrázkov oznámiť svoje preferencie a ak si to želáte, nechať si znova vygenerovať ďalšie štyri verzie.

DALL-E 2: nový systém AI pre umelecké diela

Okrem Midjourney je DALL-E 2 tiež novým systémom AI, ktorý dokáže vytvárať realistické obrázky a umelecké diela z popisu v prirodzenom jazyku. A nielen to, DALL-E 2 dokáže kombinovať koncepty, atribúty a štýly.

Sila nového systému AI spočíva aj v tom, že dokáže rozšíriť obrázky nad rámec toho, čo je na pôvodnom plátne, a vytvoriť tak nové expanzívne kompozície. Okrem toho dokáže robiť realistické zmeny existujúcich obrázkov z titulku v prirodzenom jazyku a môže pridávať a odstraňovať prvky s prihliadnutím na tiene, odrazy a textúry.

Medzi schopnosti DALL-E 2 patrí aj zhotovenie snímky a vytvorenie niekoľkých jej variácií inšpirovaných originálom. DALL-E 2 sa naučil vzťah medzi obrázkami a textom použitým na ich opis.

Využíva proces tzv "difúzia", ktorý začína vzorom náhodných bodiek a postupne tento vzor mení smerom k obrázku, keď rozpozná špecifické aspekty tohto obrázku.

Takže po tom, čo OpenAI predstavila DALL-E v januári 2021, teraz najnovší systém, DALL-E 2, generuje realistickejšie a presnejšie obrázky so štvornásobným rozlíšením.

DALL-E 2 začal ako výskumný projekt a teraz je dostupný ako a beta verzia. Bezpečnostné zmiernenia, ktoré systém vyvinul a neustále vylepšuje, zahŕňajú: obmedzenie schopnosti systému vytvárať násilné, nenávistné obrázky alebo obrázky pre dospelých a fázované nasadenie založené na učení.

Zdroj: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/