Zakladateľ Midjourney David Holz o vplyve AI na umenie, predstavivosť a kreatívnu ekonomiku

Stredná cesta je jedným z popredných hnacích síl vznikajúcej technológie využívania umelej inteligencie (AI) na vytváranie vizuálnych snímok z textových výziev. Startup so sídlom v San Franciscu nedávno priniesol novinky ako motor za umeleckým dielom, ktoré získalo ocenenie v súťaži veľtrhu v štáte Colorado, a je nepravdepodobné, že to bude posledný komplikovaný problém, ktorému bude umenie AI čeliť v nasledujúcich rokoch.

Midjourney sa odlišuje od ostatných v priestore zdôraznením maliarskej estetiky v obrazoch, ktoré vytvára. Platforma sa nesnaží vytvárať fotorealistické obrázky, ktoré možno zameniť za fotografie, a generálny riaditeľ David Holz hovorí, že je osobne veľmi znepokojený neuveriteľnou kvalitou deepfakes a inej práce, ktorá príliš presne simuluje realitu. Namiesto toho Holz hovorí, že Midjourney je navrhnutý tak, aby odomkol kreativitu obyčajných ľudí tým, že im poskytne nástroje na vytváranie krásnych obrázkov len tým, že ich opíše.

Ale napriek humanistickému, spotrebiteľsky orientovanému zameraniu spoločnosti, existujú nevyhnutné otázky o dôsledkoch pre komerčné umenie a profesionálnych umelcov. Robil som rozhovor s Holzom pre a širšia časť o potenciálnych prerušeniach, ktoré umenie AI pravdepodobne spôsobí pri vytváraní snímok pre zábavu, videohry a publikovanie. Tu je dlhší úryvok z nášho rozhovoru, kde Holz poskytuje väčšiu hĺbku a kontext, keď sa venuje týmto problémom a vysvetľuje svoju víziu spoločnosti, priemyslu a technológie. Rozhovor bol upravený kvôli dĺžke a zrozumiteľnosti.

Rob Salkowitz, prispievateľ Forbes: Aká je vaša úloha a titul?

David Holz, Midjourney. Som zakladateľ a generálny riaditeľ. Zvyčajne dávam prednosť tomu, keď ma nazývajú zakladateľom, pretože generálny riaditeľ znie veľmi obchodne a my nie sme veľmi obchodní. Sme laboratórium aplikovaného výskumu, ktoré vyrába produkty.

Aké je poslanie Midjourney?

Radi hovoríme, že sa snažíme rozšíriť predstavivosť ľudského druhu. Cieľom je urobiť ľudí nápaditejšími, nie robiť stroje s predstavivosťou, čo je podľa mňa dôležitý rozdiel.

Môžete uviesť stručnú doterajšiu históriu spoločnosti?

Na imaginárnej časti našej spoločnosti sme začali pracovať asi pred rokom a pol. Došlo k určitým prelomom v oblasti modelov difúzie, ľudia rozumeli klipu, openAI a podobne. Takmer každý, kto sa na tom podieľa, je San Francisco a všetci sme si uvedomili, že to bude vážne, že sa to líši od mnohých iných vecí.

V čom vidí Midjourney prínos tejto technológie prevodu textu na obrázok pre podnikanie a spoločnosť?

Určite sa viac zaujímam o spoločnosť ako o biznis. Sme spotrebiteľský produkt, ale možno 30 % až 50 % našich používateľov sú v súčasnosti profesionáli. Väčšina nie je. Umelci na platforme nám hovoria, že im to umožňuje byť na začiatku kreatívnejšími a objavnejšími a prísť s množstvom nápadov v krátkom čase.

Práve teraz naši profesionálni používatelia využívajú platformu na vytváranie koncepcií. Najťažšia časť [komerčného umeleckého projektu] je často na začiatku, keď zainteresovaná strana nevie, čo chce, a musí vidieť nejaké nápady, na ktoré môže reagovať. Midjourney môže pomôcť ľuďom zblížiť sa s myšlienkou, ktorú chcú, oveľa rýchlejšie, pretože iterácia týchto konceptov je veľmi pracná.

Ďalšou výhodou pre umelcov je to, že ľuďom dáva dôveru v oblastiach, v ktorých si nie sú istí. Väčšina, ak nie všetci, má pocit, že je tu časť umenia, ktorú nedokážu robiť dobre. Môžu to byť farby, kompozícia, pozadie. Náš produkt používa známy dizajnér postáv a ľudia sa ho pýtajú, prečo by ste používali AI, keď už ste taký dobrý. A on povedal: „No, som dobrý len v tej časti postavy. To mi pomáha so zvyškom, svetom, pozadím, farebnými schémami.“

Koľko ľudí približne používa produkt?

Používajú ho milióny. Náš nezhoda je viac ako dva milióny. Je to zatiaľ najväčší aktívny Discord server.

Umožňuje licencia Midjourney komerčné použitie snímok generovaných platformou?

Áno. Ak však pracujete pre spoločnosť s ročným príjmom väčším ako milión dolárov, žiadame vás, aby ste si kúpili firemnú licenciu.

Ako bol zostavený súbor údajov?

Je to len veľký škrabanec z internetu. Používame otvorené súbory údajov, ktoré sú publikované a trénujeme ich. A povedal by som, že to robí 100% ľudí. Neboli sme vyberaví. Veda sa skutočne rýchlo vyvíja, pokiaľ ide o to, koľko údajov skutočne potrebujete, v porovnaní s kvalitou modelu. Bude to trvať niekoľko rokov, kým sa veci naozaj vyjasnia, a v tom čase už možno budete mať modelky, ktoré budete cvičiť takmer s ničím. Nikto naozaj nevie, čo môžu robiť.

Požiadali ste o súhlas žijúcich umelcov alebo diela, ktoré sú stále chránené autorským právom?

Nie. V skutočnosti neexistuje spôsob, ako získať sto miliónov obrázkov a vedieť, odkiaľ pochádzajú. Bolo by skvelé, keby obrázky mali vložené metadáta o vlastníkovi autorských práv alebo niečo také. Ale to nie je vec; nie je tam register. Neexistuje žiadny spôsob, ako nájsť obrázok na internete a potom ho automaticky vystopovať k vlastníkovi a potom mať akýkoľvek spôsob, ako ho overiť.

Môžu umelci odmietnuť zahrnutie do vášho modelu tréningu údajov?

Pozeráme sa na to. Úlohou teraz je zistiť, aké sú pravidlá a ako zistiť, či je človek skutočne umelcom konkrétneho diela, alebo ak naň len uvedie svoje meno. Nestretli sme sa s nikým, kto by chcel svoje meno vyradiť zo súboru údajov.

Môžu sa umelci odhlásiť z uvádzania vo výzvach?

Teraz nie. Pozeráme sa na to. Opäť by sme museli nájsť spôsob, ako overiť tieto požiadavky, čo sa môže skomplikovať.

Čo hovoríte na komerčných umelcov, ktorých to znepokojuje, že im to zničí živobytie? Prečo by si umelecký riaditeľ v určitom bode najímal ilustrátora, aby vytvoril dielo, ako je koncepčné umenie, produkčný dizajn, pozadia – také veci – keď môžu jednoducho zadať výzvy a získať užitočný výstup oveľa rýchlejšie a za oveľa nižšie náklady?

Je to ešte veľa práce. Nie je to len ako „urob mi pozadie“. Môže to byť desaťkrát menej práce, ale je to oveľa viac práce, ako urobí manažér.

Myslím, že to môže ísť dvoma spôsobmi. Jedným zo spôsobov je pokúsiť sa poskytnúť rovnakú úroveň obsahu, ktorý ľudia konzumujú, za nižšiu cenu, však? A druhým spôsobom, ako na to ísť, je vytvoriť oveľa lepší obsah za ceny, ktoré sme už ochotní minúť. Zistil som, že väčšina ľudí, ak už míňajú peniaze a máte na výber medzi výrazne lepším obsahom alebo lacnejším obsahom, si v skutočnosti vyberá oveľa lepší obsah. Trh už stanovil cenu, ktorú sú ľudia ochotní zaplatiť.

Myslím si, že niektorí sa budú snažiť umelcov vystrihnúť. Pokúsia sa vyrobiť niečo podobné za nižšiu cenu a myslím si, že na trhu neuspejú. Myslím si, že trh pôjde smerom k vyššej kvalite, väčšej kreativite a oveľa sofistikovanejšiemu, rozmanitejšiemu a hlbšiemu obsahu. A ľudia, ktorí sú skutočne schopní používať, ako sú umelci a používajú na to nástroje, sú tí, ktorí vyhrajú.

Tieto technológie v skutočnosti vytvárajú oveľa hlbšie ocenenie a gramotnosť vo vizuálnom médiu. V skutočnosti môžete mať dopyt, predbehnúť schopnosť produkovať na tejto úrovni a potom možno skutočne budete zvyšovať platy umelcov. Môže to byť zvláštne, ale stane sa to. Tempo nárastu dopytu po kvalite a rozmanitosti povedie k realizácii úžasných a neočakávaných projektov.

Generácia študentov vyštudovala umelecké školy, mnohí z nich značne zadlžení, rátajúc s relatívne dobre platenými prácami v zábavnej produkcii, produkcii videohier, komerčnom umení a podobne. Ako ovplyvní vznik platforiem AI text-to-image ich budúcnosť?

Myslím si, že niektorí ľudia sa pokúsia znížiť náklady a niektorí sa budú snažiť rozšíriť svoje ambície. Myslím si, že ľudia, ktorí rozširujú svoje ambície, budú stále platiť rovnaké platy a ľudia, ktorí sa snažia znížiť náklady, podľa mňa zlyhajú.

Ai sa zvyčajne používa vo veľkom meradle na veci, ako sú call centrá alebo odbavenie tašiek na letiskách a na tie druhy úloh, o ktoré sa ľudia v skutočnosti nestarajú. A hodnotová ponuka spočíva v tom, že oslobodzuje ľudí, aby mohli vykonávať odmeňujúce a zaujímavejšie druhy práce. Umelecké práce sú však obohacujúce a zaujímavé. Ľudia pracujú celý svoj život a rozvíjajú svoje zručnosti, aby získali tento druh zamestnania. Prečo by ste nasmerovali túto technológiu na túto úroveň ekonomiky ako na druh obchodného zamerania a priority pre veci, ktoré robíte?

Ja osobne nie. Moje veci nie sú vyrobené pre profesionálnych umelcov. Ak to radi používajú, je to skvelé. Moje veci sú vyrobené pre ľudí, ktorí sú napríklad v Hong Kongu jedna žena a ona prišla za mnou a hovorí: „Jedna vec v Hongkongu, z ktorej tvoji rodičia nikdy nechcú, aby si bol, je umelec, a ja“ teraz som bankár. Žijem dobrý bankový život. Ale s Midjourney teraz začínam skutočne ochutnať túto skúsenosť byť osobou, ktorou som v skutočnosti chcel byť.“ Alebo chlapík na zastávke, ktorý si len tak pre zábavu vyrába svoje vlastné baseballové karty s divokými obrázkami. Je stvorený pre týchto ľudí, pretože ako väčšina ľudí, nikdy sa k týmto veciam nedostanú.

Je dôležité zdôrazniť, že tu nejde o umenie. Toto je o predstavivosti. Predstavivosť sa niekedy používa v umení, ale často to tak nie je. Väčšina obrázkov vytvorených na Midjourney sa nepoužíva profesionálne. Dokonca sa ani nezdieľajú. Len sa používajú na tieto iné účely, na tieto ľudské potreby.

Výstupom vášho produktu sú však snímky, ktoré majú okrem všetkých týchto vlastností aj komerčnú hodnotu v profesionálnom kontexte. A to túto ekonomiku veľmi narúša.

Myslím si, že je to ako keby sme vyrábali loď a niekto môže s loďou pretekať, ale to neznamená, že loď je o pretekaní. Ak použijete loď na preteky, tak možno áno, určite. V tom momente je. Ale na ľudskej stránke naozaj záleží a myslím si, že nie sme... Chceme, aby obrázky vyzerali pekne. Nemyslíme si, že sa snažíme vytvárať umenie ako súčasť našej veci. Chceme, aby bol svet nápaditejší. Radšej vyrábame krásne veci ako škaredé.

Myslíte si, že nejaký vládny orgán má právomoc alebo právomoc regulovať túto technológiu? A ak áno, myslíte si, že by mali?

Neviem. Zaujímavá je regulácia. Musíte vyvážiť slobodu robiť niečo so slobodou byť chránený. Samotná technológia nie je problém. Je to ako s vodou. Voda môže byť nebezpečná, môžete sa v nej utopiť. Ale je to tiež nevyhnutné. Nechceme vodu zakazovať len preto, aby sme sa vyhli nebezpečným častiam.

Chceme si byť istí, že naša voda je čistá.

Ano to je pravda.

Zdroj: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreatívna ekonomika/