Generatívna AI ChatGPT verzus tie nekonečné opice, žiadna súťaž hovorí o etike AI a zákonoch AI

Tie bujaré opice.

Existuje celkom známy myšlienkový experiment, o ktorom ste už možno počuli a zahŕňal opice. Celkom pútavý vynález často používajú tí, ktorí chcú urobiť obzvlášť vycibrený bod.

Takto prebieha zápletka.

Predstavte si, že opica píše na písacom stroji. Ak opica pokračuje v písaní nekonečne dlho a za predpokladu, že opica píše kľúče čisto náhodne, je pravdepodobné, že všetky Shakespearove diela budú nevyhnutne napísané.

Podstatou zdanlivo je, že len náhodnou náhodou je možné niekedy dostať zrozumiteľnú odpoveď. Všetci máme tendenciu súhlasiť s tým, že Shakespearove diela sú obrovskou ukážkou zrozumiteľného písania a uvažovania. Takže čokoľvek alebo akýkoľvek spôsob vytvárania Shakespearových cenených slov by sa zdal byť úžasne pôsobivý, aj keď by sme zároveň boli veľmi sklamaní, že to nebolo inteligenciou ako takou, ale iba náhodným šťastím.

Niektorí sa v súčasnosti pokúšajú porovnať túto metaforu nabitú opicami s najnovšou v umelej inteligencii (AI).

Pravdepodobne viete, že najhorúcejšia forma AI v súčasnosti je Generatívna AI, ktorého príkladom je široko a veľmi populárna aplikácia AI známa ako ChatGPT od OpenAI. O chvíľu vysvetlím viac o generatívnej AI a ChatGPT. V tejto chvíli vedzte, že ide o aplikáciu AI na prevod textu na text alebo text na esej, ktorá vám môže vytvoriť esej na základe zadanej výzvy podľa vášho výberu.

Tvrdené spojenie týkajúce sa legendárnej opice na písanie je, že údajne pôsobivé, výstupné eseje vytvorené generatívnou AI, ktoré sa zdajú byť úplne plynulé, nie sú o nič ohromujúcejšie ako úspechy primátov na písanie. Ak prijmete predpoklad, že opica, ktorá náhodne píše, môže generovať diela Shakespeara, a ak ste ochotní pripustiť, že ChatGPT a iná generatívna AI sú zdanlivo rovnaké, musíte teda dospieť k záveru, že generatívna AI nie je vôbec pozoruhodná. Je to len náhoda, ktorá nás klame.

No, toto sa môže zdať ako presvedčivý prípad, ale musíme to rozbaliť. Pozorné rozbalenie ukáže, že porovnanie medzi nimi je zavádzajúce a jednoznačne nesprávne.

Prestaň porovnávať. Pre tých, ktorí trvajú na pokračovaní v porovnávaní, urobte to, prosím, aspoň obozretným a nadštandardným spôsobom.

Tí, ktorí to porovnávajú, robia medvediu službu generatívnej AI. A najdôležitejšou obavou je, že je to zavádzajúce pre širokú verejnosť a spoločnosť ako celok. Predpokladám, že by sme tiež mohli dodať, že robia medvediu službu aj ťažko pracujúcim opiciam, alebo možno podkopávajú hodnotu vety o nekonečných opiciach. Buď spravodlivý. Buď milý. Buďte pravdiví.

Predtým, ako sa do toho dostaneme hlbšie, existuje zasvätený vtip, ktorý využíva predstavu opice na písanie. Mohlo by sa ti to páčiť.

Cynický kúsok humoru sa často spája s osobnou korešpondenciou počas počiatočného rozkvetu internetu. Toto je obdobie, keď sa internet z pochmúrnej serióznej online sféry dostával do nepochopiteľného územia hlučného, ​​búrlivého a neposlušného, ​​keďže počet ľudí používajúcich internet preukázateľne stúpal.

Vtipná anekdota hovorí, že ak by opice píšuce na písacích strojoch v konečnom dôsledku vyprodukovali alebo povedzme reprodukovali celé dielo Shakespeara, teraz máme dôkaz, že vďaka nástupu internetu to musí rozhodne nie byť pravdivý.

smeješ sa?

Niektorí si to vykladajú ako búrlivo vtipnú poznámku.

Vtip je odcudzením toho, ako internet so všetkými svojimi penivými a chrliacimi príspevkami stúpa na úroveň produkcie Shakespeara. Je to ostrá poznámka zdôrazňujúca, že internet pravdepodobne nezvýšil diskurz, ale naopak ho znevážil. Mnohí predpokladali, že internet bude prínosom pre inteligentnú interakciu, ktorá umožní podnetné diskusie na celom svete. Zdá sa, že sme toho neboli nevyhnutne svedkami v takom veľkom rozsahu, v aký sme dúfali.

Samozrejme, boli by sme ľahostajní, keby sme brali vtip ako skutočnú predzvesť toho, čo internet spôsobil. S internetom sa spája množstvo skvelých objavov a pozoruhodných hodnôt. Vtip je prikrášlenie alebo preháňanie. Ide však o to, že si musíme dávať pozor na zákerný a zbytočný obsah a zároveň sa snažiť nájsť a pozdvihnúť spoločensky inšpirujúce diela prostredníctvom internetu. Za moje pokrytie o tom, ako môže AI pomôcť a napriek tomu v a dvojakého použitia móda podkopáva spoločenský diskurz prostredníctvom nepriaznivých príspevkov na internete, pozri moju diskusiu na odkaz tu.

V dnešnom stĺpci sa budem zaoberať významnými rozdielmi medzi generatívnou AI a klasickým príbehom o píšucich opiciach. Vysvetlím, kde porovnanie zaostáva. Nepochybne sa dozviete viac o teoréme opíc, ako aj konkrétnejšie pochopenie toho, ako funguje generatívna AI. Príležitostne budem odkazovať na ChatGPT, pretože je to 600-librová gorila generatívnej AI (určená slovná hračka), aj keď majte na pamäti, že existuje veľa iných generatívnych aplikácií AI a vo všeobecnosti sú založené na rovnakých všeobecných princípoch.

Medzitým sa možno pýtate, čo je vlastne generatívna AI.

Poďme sa najprv venovať základom generatívnej AI a potom sa môžeme bližšie pozrieť na porovnania teorémov písania opíc.

Do toho všetkého prichádza množstvo úvah o etike AI a zákonoch o AI.

Uvedomte si, že neustále prebieha úsilie o začlenenie etických princípov AI do vývoja a zavádzania aplikácií AI. Rastúci kontingent zainteresovaných a bývalých etiológov AI sa snaží zabezpečiť, aby snahy o navrhnutie a prijatie AI zohľadňovali AI pre dobro a odvrátenie AI pre zlé. Podobne sa navrhujú nové zákony o umelej inteligencii, o ktorých sa hovorí ako o potenciálnych riešeniach, ktoré zabránia snahám umelej inteligencie ohroziť ľudské práva a podobne. Moje pokračujúce a rozsiahle pokrytie etiky AI a práva AI nájdete v časti odkaz tu a odkaz tu, Len aby sme vymenovali niekoľko.

Vývoj a propagácia etických zásad AI sa usiluje o to, aby sa, dúfajme, zabránilo spoločnosti, aby upadla do nespočetných pascí, ktoré vyvolávajú AI. Moje pokrytie etických princípov AI OSN, ako ich navrhlo a podporilo takmer 200 krajín prostredníctvom úsilia UNESCO, pozri odkaz tu. V podobnom duchu sa skúmajú nové zákony AI, ktoré sa snažia udržať AI na rovnakej úrovni. Jeden z najnovších záberov pozostáva zo súboru navrhovaných Listina práv AI ktorý americký Biely dom nedávno vydal na identifikáciu ľudských práv vo veku AI, viď odkaz tu. Vyžaduje si to dedinu, aby udržala AI a vývojárov AI na správnej ceste a odradila účelové alebo náhodné podvedomé snahy, ktoré by mohli podkopať spoločnosť.

Do tejto diskusie vložím úvahy súvisiace s etikou AI a zákonom o AI.

Základy generatívnej AI

Najznámejšia inštancia generatívnej AI je reprezentovaná aplikáciou AI s názvom ChatGPT. ChatGPT sa dostal do povedomia verejnosti už v novembri, keď ho vydala výskumná spoločnosť AI OpenAI. Odvtedy, čo ChatGPT získal veľké titulky a prekvapivo prekročil svojich pätnásť minút slávy.

Hádam ste už počuli o ChatGPT alebo možno dokonca poznáte niekoho, kto ho používal.

ChatGPT sa považuje za generatívnu aplikáciu AI, pretože berie ako vstup nejaký text od používateľa a potom generuje alebo vytvorí výstup, ktorý pozostáva z eseje. AI je generátor textu na text, hoci AI opisujem ako generátor textu na esej, pretože to ľahšie objasňuje, na čo sa bežne používa. Generatívnu umelú inteligenciu môžete použiť na zostavovanie dlhých kompozícií alebo ju môžete prinútiť ponúkať skôr krátke chúlostivé komentáre. Všetko je na vašej ponuke.

Všetko, čo musíte urobiť, je zadať výzvu a aplikácia AI vám vygeneruje esej, ktorá sa pokúsi reagovať na vašu výzvu. Komponovaný text bude pôsobiť, akoby esej bola napísaná ľudskou rukou a mysľou. Ak by ste zadali výzvu, ktorá hovorila „Povedz mi o Abrahamovi Lincolnovi“, generatívna AI vám poskytne esej o Lincolnovi. Existujú aj iné režimy generatívnej AI, ako je text-to-art a text-to-video. Zameriam sa tu na variáciu textu na text.

Vaša prvá myšlienka môže byť, že táto generatívna schopnosť sa nezdá byť až taká veľká, pokiaľ ide o tvorbu esejí. Môžete ľahko vyhľadávať online na internete a ľahko nájsť tony a tony esejí o prezidentovi Lincolnovi. Nakopnutím v prípade generatívnej AI je to, že vygenerovaná esej je relatívne jedinečná a poskytuje skôr originálnu kompozíciu než napodobeninu. Ak by ste sa pokúsili nájsť niekde online esej vytvorenú AI, je nepravdepodobné, že by ste ju objavili.

Generatívna AI je vopred vyškolená a využíva komplexnú matematickú a výpočtovú formuláciu, ktorá bola vytvorená skúmaním vzorov v písaných slovách a príbehoch na webe. V dôsledku skúmania tisícov a miliónov napísaných pasáží môže AI vychrliť nové eseje a príbehy, ktoré sú zmiešané s tým, čo sa našlo. Pridaním rôznych pravdepodobnostných funkcií je výsledný text do značnej miery jedinečný v porovnaní s tým, čo bolo použité v trénovacej sade.

Existuje veľa obáv z generatívnej AI.

Jednou zásadnou nevýhodou je, že eseje vytvorené generatívnou aplikáciou AI môžu obsahovať rôzne nepravdy, vrátane zjavne nepravdivých faktov, faktov, ktoré sú klamlivo zobrazené, a zdanlivých faktov, ktoré sú úplne vymyslené. Tieto vymyslené aspekty sa často označujú ako forma AI halucinácie, fráza, ktorú nemám v obľube, ale zdá sa, že aj tak si získava na popularite (podrobné vysvetlenie, prečo je to mizerná a nevhodná terminológia, nájdete v mojom príspevku na odkaz tu).

Ďalšou obavou je, že ľudia si môžu ľahko pripísať zásluhy za generatívnu esej vytvorenú umelou inteligenciou, napriek tomu, že esej sami nenapísali. Možno ste už počuli, že učitelia a školy sú dosť znepokojení vznikom generatívnych aplikácií AI. Študenti môžu potenciálne použiť generatívnu AI na písanie svojich pridelených esejí. Ak študent tvrdí, že esej bola napísaná ich vlastnou rukou, je malá šanca, že učiteľ bude schopný rozoznať, či nebola sfalšovaná generatívnou AI. Pre moju analýzu tohto mätúceho aspektu študenta a učiteľa si pozrite moje pokrytie na odkaz tu a odkaz tu.

Na sociálnych sieťach sa objavilo niekoľko šialených prehnaných tvrdení Generatívna AI tvrdenie, že táto najnovšia verzia AI je v skutočnosti vnímavá AI (nie, mýlia sa!). Tí, ktorí sa zaoberajú etikou AI a zákonom o umelej inteligencii, sa obzvlášť obávajú tohto rastúceho trendu rozšírených nárokov. Môžete zdvorilo povedať, že niektorí ľudia preháňajú, čo vlastne dnešná AI dokáže. Predpokladajú, že AI má schopnosti, ktoré sme ešte nedokázali dosiahnuť. To je nešťastie. Čo je ešte horšie, môžu dovoliť sebe a ostatným, aby sa dostali do zúfalých situácií, pretože predpokladajú, že AI bude vnímavá alebo podobná ľuďom, keď bude schopná konať.

Neantropomorfizujte AI.

Ak tak urobíte, dostanete sa do lepkavej a neústupnej pasce spoliehania sa na očakávanie, že AI bude robiť veci, ktoré nie je schopná vykonať. Ako už bolo povedané, najnovšia generatívna AI je relatívne pôsobivá na to, čo dokáže. Uvedomte si však, že existujú významné obmedzenia, ktoré by ste mali mať neustále na pamäti pri používaní akejkoľvek generatívnej aplikácie AI.

Zatiaľ posledné varovanie.

Čokoľvek vidíte alebo čítate v generatívnej AI reakcii, že Zdá sa Ak chcete, aby boli vyjadrené ako čisto faktické (dátumy, miesta, ľudia atď.), nezabudnite zostať skeptickí a buďte ochotní ešte raz skontrolovať, čo vidíte.

Áno, dátumy sa dajú vymyslieť, miesta sa dajú vymyslieť a prvky, od ktorých zvyčajne očakávame, že budú bez výčitiek, sú všetko podlieha podozreniam. Neverte tomu, čo čítate, a buďte skeptický pri skúmaní akýchkoľvek generatívnych esejí alebo výstupov AI. Ak vám generatívna aplikácia AI povie, že Abraham Lincoln lietal po krajine vo svojom súkromnom lietadle, nepochybne by ste vedeli, že ide o maláriu. Žiaľ, niektorí ľudia si možno neuvedomujú, že lietadlá v jeho dobe neboli, alebo možno vedia, ale nevšimli si, že esej uvádza toto drzé a neuveriteľne nepravdivé tvrdenie.

Silná dávka zdravého skepticizmu a vytrvalá nedôverčivosť budú vašou najlepšou devízou pri používaní generatívnej AI.

Sme pripravení prejsť do ďalšej fázy tohto objasňovania.

Čo sa deje s tými, čo píšu opice

Teraz, keď máte zdanie, čo je generatívna AI, môžeme preskúmať porovnanie s opicami, ktoré píšu. V istom zmysle budem krok za krokom postupne rozoberať vetu o písaní opice. Robím tak, aby som osvetlil podložky. Odhalené prvky potom môžeme použiť na porovnanie s generatívnou AI.

Veta alebo hypotéza o písaní opíc obsahuje základnú sadu prvkov:

  • a) Kto alebo čo. Identifikovaný tvor alebo herec vykonávajúci písanie
  • b) Počet a životnosť. Koľko ich je a stav ich dlhovekosti
  • c) Vydané symboly. Výroba písmen a známych symbolov pomocou základného zariadenia
  • d) Čas. Dĺžka času vykonávania úlohy
  • e) Inteligencia. Akú dôvtipnosť prinášajú do plnenia úlohy
  • f) Cielený výstup. Cielený výstup toho, čo chceme, aby produkovali

Poďme najprv preskúmať píšuce opice.

Možno si spomínate, že som na začiatku tejto diskusie spomenul, že si máme predstaviť, že opica píše na písacom stroji. Hovoril som o základných pojmoch, ktoré zahŕňajú iba jednu opicu. Tento aspekt môžeme upraviť.

Tu sú spôsoby, ako sa situácia často zobrazuje:

  • Jedna osamelá opica každodennej smrteľnej existencie
  • Tisíc takýchto opíc
  • Milión takýchto opíc
  • Nekonečné množstvo takýchto opíc
  • Osamelá opica, ktorá je nesmrteľná
  • Nejaký počet nesmrteľných opíc
  • Atď

Všimnite si, že namiesto jednej opice by sme mohli prepracovať myšlienkový experiment a mať množstvo opíc, ktoré pravdepodobne pracujú súčasne. Ďalším nastaviteľným aspektom je, či sú opice smrteľné alebo nesmrteľné. Okamžite sa do toho pustím ďalej.

Ako kľúčovú zložku musíme zahrnúť aj faktor času.

Časový faktor je zvyčajne jedným z týchto dvoch faktorov:

  • Konečné časové obdobie
  • Nekonečný čas

Ďalším trochu nevysloveným základným prvkom je, že v tomto prípade sa používajú opice, pretože ich považujeme za relatívne nemysliteľné. Nevedia čítať ani písať. Nie sú schopní prejavovať inteligenciu rovnakým spôsobom, akým spájame inteligenciu s ľudskými schopnosťami.

Je to trochu urážlivé, keď sa nad tým trochu zamyslíte. Myslím, že sa všetci rozumne zhodneme na tom, že opice sú úžasne inteligentné, prinajmenšom na to, čo dokážu v rámci svojich možností myslenia. Dovolím si tvrdiť, že opiciam pripisujeme väčšiu schopnosť myslenia ako mnohým iným zvieratám. Existuje veľa usilovných výskumných experimentov, ktoré boli vykonané, aby ukázali, aké mentálne môžu byť opice.

V každom prípade, pre účely metafory, je predpoklad, že opice nie sú schopné myslieť do takej miery, že by si sami od seba mohli predstaviť diela Shakespeara. Zatiaľ čo klasický film Planéta opíc snažil sa nás vopred upozorniť, že to môže byť chybný predpoklad, v každom prípade s tým v dnešnom svete ideme.

Ak opice nahradíme mravcami, metafora sa trochu rozplynie. Nepovažujeme mravce za schopnosť písať na písacích strojoch. Mohli by sme sa pokúsiť nahradiť používaním psov alebo mačiek, pretože dokázali takmer písať na písacom stroji, ale nakoniec je najlepšie použitie opíc, pretože dokážu písať spôsobom, ktorý pripomína ľudské písanie. Majú vhodné končatiny a telesnú štruktúru na vykonávanie danej úlohy. Mentálne sú tiež vnímaní ako schopní písať, hoci predpokladáme, že nevedia, čo píšu.

Okrem toho sa uskutočnilo mnoho výskumných experimentov zahŕňajúcich opice a ich rozpoznávanie symbolov. V týchto rôznych štúdiách boli zahrnuté nastavenia, v ktorých opice písali na písacích strojoch alebo podobných zariadeniach. Ak sa to urobí vhodne, môže to byť zmysluplné pri hľadaní užitočných poznatkov o inteligencii a vzniku inteligentného správania.

Výskum týkajúci sa písania na písacích strojoch sa, žiaľ, niekedy nerobí obzvlášť vážne. Niekedy nebol použitý prístup ničím iným ako chabým žmurkaním na slávnu alebo neslávne známu vetu o písaní opíc, a nie na základný výskum v dobrej viere. Takéto vyčíňanie sa mi nezdá zábavné ani správne. Predstava bola taká, že opice dostali fyzicky písacie stroje a boli povzbudzované, aby písali na základe ich rozmaru alebo niekedy na pochúťky, ako je jedlo. Pokiaľ to nie je urobené bona fide robustným experimentálnym spôsobom, nie je to nič iné ako fasáda.

Mierny zvrat, ktorý je príjemnejší, pozostáva z nastavenia počítačových simulácií, ktorých cieľom je vykonať to, čo by za týchto okolností mohli robiť opice. Na simuláciu týchto aspektov sa používa počítač. Nejde o žiadne skutočné opice. Niektorí zašli dokonca tak ďaleko, že urobili trochu tzv občianska veda rozdelením simulácie pre každého, kto je ochotný dovoliť, aby sa na tieto snahy použil ich laptop alebo počítač. Nepodliehajte falošným podvodom, ktoré zákerne tvrdia, že to robia pre vedu, hoci realita je taká, že sa pokúšajú infikovať váš počítač počítačovým vírusom. Buď na pozore.

Späť k veci.

Jedným aspektom, ktorý je pre túto okolnosť tiež dôležitý, je, že v tejto hypotetickej opici sa používajú písacie stroje.

Prečo písacie stroje?

Pretože tak môžeme získať výrobu písmen, z ktorých sa potom môžu sformovať slová, z ktorých sa potom môžu sformovať príbehy. Rovnaká alebo podobná predstava o vytváraní množstva písmen nevyhnutne nevyžaduje, aby sme ich napísali. Vskutku, existujú varianty tejto metafory, ktoré siahajú do čias Aristotela, a ergo vtedy ešte neboli písacie stroje.

Mohli by sme zmeniť metaforu a odkázať na moderné klávesnice a počítače. Mohli by sme povedať, že opice búchajú do notebooku alebo možno aj do smartfónu. Krása odkazu na písacie stroje je v tom, že spájame písacie stroje ako nepočítačové, a preto nepomáhajú pri samotnom procese písania. To je rozhodujúce pre daný vynález.

Nakoniec sa nám zvyčajne predstavuje aspekt, že Shakespearove diela sa majú vyrábať. Shakespeara by sme mohli ľahko nahradiť akéhokoľvek iného známeho autora. Je možné, že chceme vedieť, či opice dokážu vyrobiť celé diela Charlesa Dickensa, Jane Austenovej, Ernesta Hemingwaya a tak ďalej. Na tom zvlášť nezáleží. Podstatou je, že písanie musí byť niečo, čo všetci poznáme a čo uznávame za vynikajúce písanie.

Môžeme ľahko nahradiť akékoľvek písmo, ktoré chceme nastaviť ako cieľ.

Pohodlie odkazu na Shakespeara spočíva v tom, že jeho diela sú považované za vrchol alebo vrchol ľudského písania. Namiesto toho by sme mohli nájsť esej napísanú žiakom prvého stupňa a použiť ju ako cieľ. Verte či nie, stále platia tie isté pravidlá. To, že opice dokázali reprodukovať písmo dieťaťa, by ľudí zrejme nenadchlo. Aby boli veci stále pútavé, písanie musí byť toho najvyššieho kalibru.

Variantom cieleného výstupu by bolo odkazovanie na konkrétne dielo Shakespeara a nie na celé jeho dielo. Ako čoskoro uvidíte, v základnej podstate veci to nerobí žiadny rozdiel. Tipoval by som, že veľa ľudí má tendenciu spomínať Dedinka ako súčasť vety o písaní opice, možno preto, že je to náhodou jeho najdlhšia hra, ktorá dosahuje veľkosť 29,551 130,000 slov (zložených z približne XNUMX XNUMX písmen).

Postačí akákoľvek jeho hra.

Celý vynález závisí od rôznych zákonov pravdepodobnosti. Možno ste sa dozvedeli o nuansách pravdepodobností v tých vyčerpávajúcich triedach štatistiky a matematiky, ktoré ste absolvovali v škole.

Použime slovo „Hamlet“, aby sme videli, čo je potrebné na náhodné vytvorenie týchto šiestich písmen v tejto špecifickej sekvencii Hamleta.

Najjednoduchší spôsob, ako to aritmeticky vypočítať, pozostáva z predpokladu, že máme jednoduché zaokrúhlené číslo počtu dostupných klávesov na písacom stroji. Predpokladajme, že máme písací stroj, ktorý má 50 odlišných a rovnako použiteľných kláves. Každý kláves predstavuje konkrétny symbol, ako napríklad symboly bežnej anglickej abecedy. Predpokladajme, že klávesy sú usporiadané v náhodnom poradí a že sme situáciu nezmanipulovali tým, že sme jednotlivé klávesy Hamleta umiestnili do určitého usporiadania, aby sme vyvolali písanie týchto špecifických kláves viac ako ktorékoľvek iné klávesy.

Každé tlačidlo sa stlačí úplne nezávisle od toho, ktoré tlačidlo bolo stlačené pred ním. Preto z 50 kláves sa šanca na stlačenie ľubovoľného klávesu považuje za šancu 1 z 50. To isté platí pre všetky klávesy a počas celého úsilia pri písaní. Výpočet pre jeden stlačený kláves je šanca 1 z 50, alebo to je 1/50.

Šanca na napísanie písmena „H“ je potom 1/50 a šanca na napísanie písmena „a“ je 1/50 a šanca na napísanie písmena „m“ je 1/50 atď.

Toto je:

  • Pravdepodobnosť napísania „H“ je 1/50.
  • Pravdepodobnosť napísania „a“ je 1/50.
  • Pravdepodobnosť zadania „m“ je 1/50.
  • Pravdepodobnosť zadania „l“ je 1/50.
  • Pravdepodobnosť zadania „e“ je 1/50.
  • Pravdepodobnosť zadania „t“ je 1/50.

Štandardné pravidlo alebo zákon pravdepodobnosti uvádza, že ak sú dve alebo viac udalostí od seba úplne štatisticky nezávislé, môžeme vypočítať pravdepodobnosť, že sa obe vyskytnú, jednoduchým vynásobením ich pravdepodobností navzájom. Môžeme tak urobiť v súvislosti s týmito šiestimi písmenami.

Máme tento výpočet: „H“ (1/50) x „a“ (1/50) x „m“ (1/50) x „l“ (1/50) x „e“ (1/50) x "t" (1/50)

To je: (1/50) x (1/50) x (1/50) x (1/50) x (1/50) x (1/50)

Mierne číslo je 1/15,625,000,000 XNUMX XNUMX XNUMX.

Šanca na napísanie šesťpísmenového slova „Hamlet“ je približne jedna ku 15 miliardám, pričom všetky ostatné sú rovnaké.

To sú skľučujúce šance. A to je len na napísanie konkrétneho šesťpísmenového slova. Skúste použiť rovnaký výpočet na 29,551 XNUMX slov celej hry Hamlet. Ak sa to rozhodnete vypočítať, uvedomte si tiež, že je potrebné počítať s medzerami medzi slovami.

Čím dlhší je cielený výstup, tým väčšia je pravdepodobnosť, že budeme schopní generovať tieto presné súbory písmen a slov. Šance sú menšie a menšie. Šanca je taká malá, že by sme takmer zahodili uterák a povedali, že sa zdá, že sa to „nikdy“ nestane (buďte opatrní pri používaní slova „nikdy“, pretože ide o impozantný spor).

Vezmite si napríklad smrteľnú opicu.

Podľa rôznych renomovaných online údajov je zvyčajná dĺžka života opíc vo voľnej prírode približne 40 rokov. Ak chcete diskutovať o životnosti, môžeme použiť číslo 100 a pokračovať s dosť nepravdepodobnou hornou hranicou. Opica, ktorá nepretržite písala na písacom stroji povedzme sto rokov, bez započítania času na odpočinok, času na jedenie a podobne, a za predpokladu, že toto je všetko, čo opica robila od okamihu narodenia až po posledný výdych, stále vyhrala. '''t pomôcť vyrovnať šance písanie Dedinka všetko povedané (ak by opica písala kľúč každú sekundu nepretržite počas 100 rokov, stlačila by asi 3,155,673,600 XNUMX XNUMX XNUMX klávesov).

Môžeme oprávnene povedať, že je mimoriadne nepravdepodobné, že by smrteľná opica mohla náhodne napísať hru Dedinka.

Môžete zvýšiť počet smrteľných opíc, ale to len málo pohne s prevahou proti písaniu Hamleta. Niektorí tvrdia, že existuje tisíc opíc. Iný prístup hovorí, že existuje milión opíc. Za predpokladu, že sa všetci dožili 100 rokov a každý napísal jeden náhodný kľúč na svojom vlastnom písacom stroji nepretržitým tempom jeden kľúč za sekundu, stále to nerobí štatisticky pozoruhodnú priehlbinu pri písaní hry. Dedinka.

Premýšľajte o tom všetkom.

Mierne jazykom na perách, kde presne by ste na túto úlohu umiestnili milión opíc? Predstavte si tiež, že písacie stroje musia vydržať sto rokov nepretržitého používania (nájdete milión funkčných písacích strojov, ktoré nikto nechce a nie je ochotný venovať tomuto niekdajšiemu projektu?). Zdá sa, že by ste museli mať okamžite pripravených veľa náhradných písacích strojov. A tak ďalej. Logistika je ohromujúca.

To všetko potom vyzerá pochmúrne, že smrteľné opice sa pravdepodobne nerozmnožia Dedinka.

Ale predpokladajme, že ich urobíme nesmrteľnými. Áno, dávame im nejaký čarovný nápoj, ktorý im umožní žiť večne. Nepotrebujeme ani viac ako jednu nesmrteľnú opicu. Stačí jeden. Mohlo by to urobiť metaforu vzrušujúcejšou, keby sme tvrdili, že máme tisíc alebo milión nesmrteľných opíc.

Ak máme jednu opicu, ktorá môže žiť večne, mohli by sme naznačiť, že ide o nekonečnú opicu. Môže nekonečne dlho búšiť do klávesov písacieho stroja. Tá opica bude pokračovať a pokračovať. V súlade s tým, aj keď šance na zadanie hry Dedinka boli extrémne malé, aspekt, ktorý bude opica nekonečne skúšať, naznačuje, že v určitom okamihu bude hra Dedinka bude takmer určite zadané.

Pravidlom je, že postupnosť udalostí, ktorá má nenulovú šancu, že sa stane, aj keď s mimoriadne nízkou pravdepodobnosťou, s ktorou by sme rozumne súhlasili, takmer nastane, ak budeme mať nekonečný čas na hranie. všetko ostatné je rovnaké. Tí, ktorí pracujú v oblasti matematiky a štatistiky, majú tendenciu popisovať rovnakú úvahu pomocou reťazcov alebo dokonca binárnych čísel 0 a 1. Ak máte konečnú množinu symbolov a existuje ich nekonečný reťazec, pričom každý symbol má Ak ste vybrali jednotne náhodne, je tam konečný reťazec, ktorého výskyt môžete takmer s istotou očakávať.

Všetko to má jeden veľký háčik.

Žijeme vo svete obmedzenosti. Zdá sa, že nikto z nás nemá k dispozícii nekonečné množstvo času. Pre tých z vás, ktorí hovoria, že áno, česť. Klobúk pred tebou dole.

Ak uvalíte konečný svet na píšuce opice, zistíte, že narazíte na dosť tvrdú stenu. Analýzy teorému o opici do značnej miery ukážu, že pravdepodobnosť dosiahnutia hry Dedinka je dostatočne blízko k nule v konečnom čase, že na základe akéhokoľvek odôvodneného operačného základu to jednoducho nie je pravdepodobné. Zvyčajné zobrazenie je také, že ak ste použili toľko opíc, koľko je atómov v známom vesmíre, a tie pokračovali v písaní po mnoho miliónov časov v časovom rozpätí vesmíru, stále sa pozeráte na nepredstaviteľne malé, nevyspytateľné šance, že uvidíte hrať Dedinka.

Veta o písaní o opici je celkom šialená a často sa zaraďuje medzi sedem najlepších myšlienkových experimentov našej doby. Vítame vás, aby ste vykonali ďalšie preskúmanie vety, pretože online je dostupných veľa analýz. Je to živý a zábavný spôsob, ako získať prehľad o pravdepodobnosti a štatistike. Namiesto toho, aby ste sa zaoberali len suchými číslami, si predstavíte tie zábavné opice a všetky tie staromódne klikavé písacie stroje.

Teraz sme pripravení priniesť generatívnu AI do hlavolamu opíc a písacích strojov.

Generatívna AI sa rozčuľuje od písacích opíc

Predpokladom, ktorý sa chystáme podrobne preskúmať, je sporné tvrdenie, že generatívna AI, ako je ChatGPT, sa nelíši od písacích opíc. Hovorí sa, že ak ChatGPT alebo akákoľvek generatívna AI dokáže produkovať Dedinka alebo podobných známych diel, je to úplne náhodný výsledok, ktorý pravdepodobne vznikol rovnakým spôsobom, akým by opice mohli napísať túto dlho cenenú a hlboko uctievanú Shakespearovu hru.

Prepáčte, to je nesprávne uvažovanie o tejto závažnej téme.

Pozrime sa prečo.

Najprv si zopakujme a rozviňme, z čoho pozostáva generatívna AI.

Pripomeňme, že som už skôr naznačil, že generatívna AI je softvér, ktorý zahŕňa použitie algoritmov na trénovanie údajov v texte, ktorý existuje na internete a prostredníctvom iných podobných zdrojov. Široká škála porovnávania vzorov matematicky a výpočtovo identifikovala vzory medzi miliónmi a miliónmi príbehov a esejí, ktoré sme my ľudia zložili.

Slová nemajú samy osebe osobitný význam. Predstavte si ich ako predmety. V rámci počítača sú reprezentované ako čísla, ktoré označujeme ako tokeny. Používajú sa ako vhodný prostriedok na vzájomné spojenie iných slov alebo tokenov, a to v hĺbkovej a zložito štatistickej štruktúre podobnej webu.

Niektorí v oblasti AI sa obávajú, že to nie je nič iné ako to, čo sa označuje ako a stochastický papagáj.

Vidíte, namiesto toho, aby ste sa snažili spojiť nejaké zdanie „významu“ so slovami, namiesto toho ide len o rozsiahle indexovanie slov, ktoré sa zdajú byť použité okolo alebo vedľa iných slov. Na rozdiel od toho predpokladáme, že ľudia dokážu „rozumieť“ podstate a významu slov.

Zvážte svoj každodenný prístup k prítomnosti slovnej korešpondencie. Podobne ako pri použití bežnej funkcie automatického dokončovania v softvéri na spracovanie textu počítač matematicky vypočíta, že za konkrétnym slovom zvyčajne nasleduje nejaké ďalšie konkrétne slovo, za ktorým nasleduje ďalšie konkrétne slovo atď. Preto môžete často začať písať vetu a balík na spracovanie textu vám ukáže, aké budú ďalšie slová vety.

Je to hádanie, pretože štatisticky to môžu byť obvyklé slová vety, ale možno máte na mysli niečo iné, takže predpoveď sa líši od toho, čo ste chceli napísať. Pravdepodobne existuje dostatok ďalších príkladov viet, ktoré používajú tieto slová, ktoré algoritmus dokáže odhadnúť, že pravdepodobne budete chcieť dokončiť vetu predpovedanými slovami. Toto nie je obrúbené. S týmto výpočtovým odhadom tiež nie je spojený žiadny „význam“.

Niektorí výskumníci AI tvrdia, že na dosiahnutie skutočnej AI sa často používa ako umelá všeobecná inteligencia (AGI), budeme musieť nejakým spôsobom zakódovať do počítačov doteraz objavenú alebo vynájdenú formu „porozumenia“ (pozri môj stĺpec pre početné príspevky o AGI a snahe o AGI). Obávajú sa, že mánia okolo generatívnej AI nie je nič viac ako slepá ulička. Budeme sa snažiť posúvať ďalej a ďalej generatívnu umelú inteligenciu zvyšovaním veľkosti výpočtových sietí a využívaním stále väčšieho výkonu počítačového spracovania. Tvrdia, že to všetko bude zbytočné, keď príde na AGI.

Ďalšou pochybnosťou je, že toto úsilie o domnelú slepú uličku nás možno odvádza od správneho alebo správneho konania. Vynaložíme nesmiernu energiu a úsilie smerom k nesprávnemu konečnému stavu. Iste, generatívna AI môže byť ohromujúca pri mimických trikoch, ale mohlo by sa stať, že to má s AGI len málo alebo nič spoločné. Mohli by sme sa oklamať, aby sme premrhali vzácnu pozornosť. Mohli by sme oddialiť alebo možno dokonca zlyhať, aby sme sa niekedy dostali k AGI kvôli tomuto lákavému rozptýleniu.

Každopádne, pre účely písacích opíc sa vráťme k celkovému zlomu.

Musíme zvážiť tieto dôležité faktory:

  • 1) Cítiaci verzus necítiaci
  • 2) Myslieť verzus „nemyslieť“
  • 3) Obmedzené procesy myslenia verzus počítačové algoritmy a porovnávanie vzorov
  • 4) Neškolený alebo neschopný trénovať verzus trénované výpočtové dáta

Poďme sa zaoberať každým z týchto faktorov.

Vnímavý verzus necitlivý

Verím, že môžeme pripustiť, že opice sú vnímajúce bytosti. Bez ohľadu na to, akí inteligentní alebo nedostatoční by ste chceli tvrdiť, že sú; sú nepopierateľne vnímaví. To je fakt. Nikto nemôže rozumne tvrdiť inak.

Dnešná umelá inteligencia nie je vnímavá. Bodka, bodka.

Okrem toho tvrdím, že nie sme nikde blízko k vnímaniu AI. Ostatní môžu samozrejme nesúhlasiť. Ale každý s rozumom by súhlasil, že dnešná AI nie je vnímavá. Pre moju analýzu hlboko mylného označenia vnímania umelej inteligencie týmto inžinierom Google minulý rok si pozrite moju diskusiu na odkaz tu.

Takže jeden zásadný rozdiel medzi tými horlivo píšucimi opicami a dnešnou generatívnou AI je ten, že opice sú vnímajúce bytosti, zatiaľ čo AI nie. Okrem toho je často šmykľavé začať porovnávať dnešnú AI s čímkoľvek rozumným. Existuje tendencia antropomorfizovať AI. Dôrazne žiadam, aby sme sa pokúsili zabrániť tomu, aby nás táto ľahká mentálna pasca postihla, vyhýbali sme sa akémukoľvek porovnávaniu medzi AI a vnímajúcimi bytosťami, pokiaľ nie sme nad palubou a jasne a jasne neidentifikujeme a nevymedzíme tento rozdiel.

Málokto, ak vôbec nejaký, robí túto hranicu pri porovnaní písacích opíc a generatívnej AI. Predpokladajú, že buď si už uvedomíte, že existuje tento rozdiel, alebo ich nezaujíma, že existuje rozdiel, alebo nad tým nepremýšľali atď.

Myslieť verzus nie „myslieť“

Povedal by som, že opice vedia myslieť. Sú to mysliace bytosti. Môžeme ľahko diskutovať o tom, koľko myslenia dokážu. Takmer určite však musíte súhlasiť s tým, že opice môžu myslieť.

Dnešná AI všetkého druhu, vrátane generatívnej AI, nedosahuje to, čo považujem za ľudskú kapacitu premýšľanie.

Zopakujem môj práve spomínaný refrén súvisiaci s citom. Je to zavádzajúce a tvrdím, že nesprávne hovorím, že dnešná AI dokáže myslieť. Bohužiaľ, ľudia to robia stále, vrátane výskumníkov AI a vývojárov AI. Verím, že je to opäť nešťastné a neuvážené antropomorfizovanie. Dávate umelej inteligencii zdanie kapacity alebo schopností, ktoré tam nie sú a ktoré budú o tejto záležitosti dezinformovať spoločnosť ako celok. Prestaň to robiť.

Generatívna AI je zložitá webová štruktúra matematických a výpočtových vlastností. Je to obdivuhodné. To, čo sa tým dosiahne, je smiešne. Neverím, že žiadna rozumná interpretácia „myslenia“, ako si ho predstavujeme, v celej svojej kráse zodpovedá tejto AI.

Obmedzené procesy myslenia verzus počítačové algoritmy a párovanie vzorov

Opice sú obmedzené vo svojich procesoch myslenia.

Možno vás bude zaujímať, že vo vedeckej literatúre existuje veľa porovnaní opičích mozgov oproti ľudským mozgom. Zamyslite sa napríklad nad touto výskumnou štúdiou: „Ľudský mozog je asi trikrát väčší ako mozog nášho najbližšieho žijúceho príbuzného, ​​šimpanza. Navyše, časť mozgu nazývaná mozgová kôra – ktorá hrá kľúčovú úlohu v pamäti, pozornosti, uvedomení a myslení – obsahuje dvakrát toľko buniek u ľudí ako v rovnakej oblasti u šimpanzov. Aj siete mozgových buniek v mozgovej kôre sa u týchto dvoch druhov správajú odlišne“ (v článku publikovanom v r. Elif, september 2016, s názvom „Rozdiely a podobnosti medzi ľudskými a šimpanzmi nervovými progenitormi počas vývoja mozgovej kôry“).

Všetci si uvedomujeme, že opice nie sú na rovnakej úrovni ako ľudské myslenie. Tieto úžasné stvorenia môžu byť roztomilé a dokážu prekvapivo veľa premýšľať, o tom niet pochýb. Len sa nedostanú na úroveň ľudského myslenia. Budem ľutovať, že to poviem, keď opice ovládnu ľudstvo.

Už som sa pred chvíľou vyjadril, že dnešná AI nemyslí. Zdôraznil som, že to, čo robí AI, by sa nemalo označovať ako „myslenie“, pretože to je zavádzajúce a mätúce.

Tu je miesto, kde generatívna AI zatieni opice, pokiaľ ide o používanie počítačového spracovania založeného na algoritmoch navrhnutých ľuďmi a založeného na písomnostiach vytvorených ľuďmi. Je malá alebo žiadna šanca, že by mysliaci opica mohla absorbovať a prispôsobiť sa obrovskému používaniu písaných symbolov, s ktorými ľudia prišli. Opice nemajú taký druh myslenia.

Vzhľadom na moje ďalšie vyjadrené výhrady váham navrhnúť takéto porovnanie. Jasne však uvádzam, aké sú predpoklady a ako správne a vhodne vykonať túto analýzu.

Neškolené alebo neschopné trénovať verzus výpočtovo trénované údaje

Podobne ako som práve povedal, nebudete schopní vycvičiť mysliacu opicu na rozsiahle používanie písaných symbolov ľudstva. Môžete to urobiť na extrémne obmedzenom základe a štúdie ukázali, že opice môžu zdanlivo premýšľať o písaných symboloch. To je oveľa menej ako schopnosť zapamätať si a spätne opakovať rozsiahle vzorce slov, viet a celých príbehov.

Generatívna AI je počítačová štatistická mimika, ktorú možno trénovať výpočtovo. Ak budeme neustále pridávať ďalšie údaje, ako sú ďalšie texty, ktoré zhromažďujeme alebo nájdeme, predpokladáme a dúfame, že nájdené vzory budú hlbšie a hlbšie. Navyše, použitie stále rýchlejších počítačových čipov a spracovania tiež zvýši túto schopnosť porovnávania vzorov a odozvy.

Pri pohľade na spodnú čiaru

Ak by hru vytvorila generatívna AI Dedinka, čo by to znamenalo?

Po prvé, musíme zvážiť, či príbeh alebo hra boli alebo neboli vložené do generatívnej AI v čase tréningu údajov. Ak áno, potom na generatívnej AI nie je nič obzvlášť pozoruhodné alebo pozoruhodné, keď neskôr vypustí tie isté slová, ktoré predtým naskenovala.

Výskumník AI môže byť trochu zdesený, pretože priraďovanie vzorov pravdepodobne prehnalo, keďže si slová v podstate zapamätal. Zvyčajne to v oblasti strojového učenia označujeme ako nadmerné vybavenie k údajom, ktoré boli použité počas tréningu. Zvyčajne nechcete, aby sa vzorovali presné slová, ale aby sa vytvoril všeobecný vzor.

Vo svojich stĺpcoch som diskutoval o obavách, že občas môžeme vidieť narušenie súkromia a odhalenie dôverných údajov v prípadoch, keď generatívna umelá inteligencia vykonala presnú zhodu, a nie zovšeobecnenú zhodu kŕmených údajov, pozri moje pokrytie na odkaz tu.

Po druhé, predpokladajme, že hra Dedinka nebol pridaný do generatívnej AI. Ďalšou úvahou by potom bolo, či niektoré zo Shakespearových diel nebolo naskenované počas tréningu údajov.

Ak áno, je možné, že hra Dedinka by mohli byť vytvorené na základe vzorov spojených s inými Shakespearovými dielami, najmä ak existujú iné odkazy alebo zmienky o Dedinka inde v trénovacej sade údajov. Všetky z nich by mohli byť potenciálne využité priraďovaním vzorov na vytvorenie štýlu Dedinka. Pravdaže, vedieť generovať Dedinka slovo za slovom by bol rozšírený dosah, značne otvorený a prekvapivý výsledok.

Po tretie, ak by generatívna AI produkovala celú Dedinka a nikdy predtým nebol kŕmený ničím o Shakespearovi, no, to by bolo úžasné. Nemusí to byť však úplne rovnaké ako čisto náhodná povaha klovania do kláves na písacom stroji. Musíme si uvedomiť, že slová Shakespeara sú slová, a teda sú súčasťou súhrnu formulácií, ktoré sa nachádzajú v obrovskom množstve textových príbehov a príbehov vložených do generatívnej AI. Zlepšujete šance tým, že začnete so základným kameňom slov a asociáciami medzi slovami. Napriek tomu je šanca, že sa niečo také stane, dosť malá.

záver

Pokiaľ ide o vytváranie slov a esejí, generatívna umelá inteligencia sa stáva gangstermi, pretože je založená na slovách a esejoch vytvorených ľuďmi (samozrejme, musíme sa priamo vysporiadať s chybami, klamstvami a halucináciami AI). Umelá inteligencia „nerozumie“ vydávaným slovám. Žiadna tam nie je.

Nemusíte čakať nekonečnú dobu, aby ste videli plynulé eseje a plne čitateľné výstupy. Dejú sa denne a stlačením jediného tlačidla. Nie sú premiešané, aspoň nie väčšinou, kvôli tomu, že sú vytvorené na základe toho, čo ľudia napísali. Priraďovanie vzorov by sa malo ďalej dolaďovať a nakoniec by malo byť dosť dobré na to, aby zoštíhlilo väčšinu čudných slov, pozri moje vysvetlenie, ako by to mohlo fungovať, zobrazené na odkaz tu. Toto ladenie sa bude neustále zdokonaľovať a všetci budeme čoraz viac uchvátení tým, čo vytvára generatívna AI.

Slová nie sú vybrané náhodne. Slová nie sú napísané len náhodne. Existujú určité pravdepodobnostné aspekty, ako napríklad pri vytváraní výstupnej eseje, ktoré slová vybrať. Ale toto je stále založené na ľudských spisoch, a teda pravdepodobne nie čisto náhodne. Zakladá sa na náhodnom výbere medzi hŕstkou alebo určitým počtom možností znenia, ktoré by inak mohli byť všetky štatisticky uskutočniteľné ako ďalšie zvolené slovo alebo množina slov.

Kde do toho zapadajú opice?

Tieto píšuce opice sú určite atraktívne ako základ na porovnanie s generatívnou AI. Produkcia opíc Dedinka oproti generatívnej produkcii AI Dedinka. To je vzrušujúca súťaž. Možno si poviete, že v skutočnosti vôbec nejde o súťaž. Umelá inteligencia, ktorú vymyslelo ľudstvo a je založená na spisoch ľudstva, má v tomto smere nespravodlivú výhodu.

Keď už hovoríme o písaní opíc, v epizóde Simpsonovci, sa pán Burns rozhodne najať opice, aby pokračovali a písali na písacích strojoch ako súčasť kancelárskeho písania. Je to ten druh chrapúnskeho šéfa, ktorý by s radosťou inklinoval k využívaniu opíc pri svojej potrebnej kancelárskej práci namiesto využívania ľudí, ak by to mohol urobiť.

Fanúšikovia šou si možno pamätajú, čo sa stalo.

Pán Burns chytí jednu z napísaných strán a so zanieteným očakávaním číta, čo opica napísala. Nahlas prečíta stránku a povie: „Boli to najlepšie časy, boli to rozmazať of times“ (tj existuje jedno slovo, ktoré je zmätené, „blurst“ alebo niečo podobné). Je úplne rozzúrený a úplne sklamaný z tých „hlúpych opíc“, čo dokážu vyprodukovať.

Vieme, že ak opica napíše tú časť knihy Charlesa Dickena „A Tale Of Two Cities“, mali by sme byť vo vytržení a skákať od radosti. Nie tak pre pána Burnsa.

Ako posledný komentár k tejto diskusii by sme možno mali použiť celú vetu, ktorú napísal Charles Dickens: „Boli to najlepšie časy, boli to najhoršie časy, bol to vek múdrosti, bol to vek hlúposti, bola epocha viery, bola to epocha nedôverčivosti, bola to sezóna svetla, bola to sezóna temnoty, bola to jar nádeje, bola to zima zúfalstva.“

Nie sme si celkom istí, kam smerujeme s AI. Niektorí hovoria, že to bude najlepšia vec od krájaného chleba. Iní varujú, že AI, ktorú vyrábame, bude existenčným rizikom pre prežitie ľudstva. Je to skutočne buď najlepšie, alebo najhoršie obdobie.

Nebuďte prekvapení, keď uvidíte, že generatívna AI vydáva práve tieto slová. Nechajte sa prekvapiť, ak náhodou v zoologickej záhrade uvidíte opice, ktoré náhodou píšu na písacích strojoch a dokážu napísať tie isté bystré slová.

Prosím, dajte mi vedieť, ak uvidíte, že sa to stalo.

Som ochotný čakať dlho, kým sa to stane, ale pravdepodobne nie do nekonečna.

Zdroj: https://www.forbes.com/sites/lanceeliot/2023/03/05/generative-ai-chatgpt-versus-those-infinite-typing-monkeys-no-contest-says-ai-ethics-and- ai-law/