Hogyan utánozzák az AI-rendszerek az emberi kreativitást

Tartalomjegyzék:

Hogyan utánozzák az AI-rendszerek az emberi kreativitást
Hogyan utánozzák az AI-rendszerek az emberi kreativitást
Anonim

Kulcs elvitelek

  • A DALL·E egy új neurális hálózat, amely képes képeket rajzolni szöveg alapján.
  • A hálózat egyike a növekvő számú mesterséges intelligencia-projektnek, amely képes utánozni az emberi lények kreatív teljesítményét.
  • A szakértők szerint a mesterséges intelligencia által készített képek nem eredeti alkotások.
Image
Image

Menj át, Picasso. Egy új neurális hálózat képes képeket rajzolni szöveg alapján.

A DALL·E, Salvador Dalí művész nevének portékája és a Pixar WALL·E-je, bármilyen szöveget átvehet, és képet alkothat belőle. A rendszer egy neurális hálózatot használ, amelyet több milliárd képre és szöveges példára tanítottak. Egyike azon egyre több mesterséges intelligencia projektnek, amely képes utánozni, de nem reprodukálni az emberi lények kreatív teljesítményét.

"Mivel a természetes nyelv folyamatosan fejlődik, és nagymértékben függ a kontextuális árnyalatoktól, nagyon jelentős eredmény megtanítani egy gépet, hogy elég jól megértse a nyelvet ahhoz, hogy képet rajzoljon." Tamara Schwartz, a York College of Pennsylvania kiberbiztonsági professzora, mondta egy e-mailes interjúban. "Képzeljen el egy rendőrségi vázlatrajzolót, aki ritka tehetség, aki képes képet készíteni egy tanú leírása alapján."

Big Data használata képek előállításához

A DALL-E-t az OpenAI mesterséges intelligenciakutató cég hozta létre, és hatalmas mennyiségű adat felhalmozásával működik az internetről. Az adatokat ezután természetes nyelvi modell dolgozza fel, és képzett szövegből képeket készít. A DALL-E hasonlóan működik a nemrégiben megjelent GPT-3-hoz, az OpenAI által létrehozott nyelvi modellhez, amely eredeti szövegrészek generálására kérhető. A GPT-3-at félbillió szónyi internetes szöveg felhasználásával képezték ki, és meglepően élethű szöveget tud készíteni.

Nagyon jelentős eredmény megtanítani egy gépet arra, hogy elég jól megértse a nyelvet ahhoz, hogy képet rajzoljon.

Michael Yurushkin, a BroutonLab, egy adattudományi vállalat alapítója és műszaki igazgatója egy e-mailes interjúban azt mondta, hogy a DALL-E "egyike az emberiség kevés sikeres szúrásának kreativitásunk és képzelőerőnk utánzásában". Hozzátette: "Könnyebb felismerni, hogy a mesterséges intelligencia hogyan jósol meg valamit, ha átmegy a releváns adatokon, de nehezebb megérteni, hogyan képes rajzokat generálni olyan dolgokból, amelyekről korábban nem hallott."

Schwartz gondosan megjegyzi, hogy a mesterséges intelligencia nem hoz létre információkat, hanem inkább nyelvi adatokat vesz és képekké alakít át.

"A kezdeti kreativitás abból az emberből fakad, aki a feladatot megalkotta" - mondta Schwartz. „Van némi „kreativitás” az AI-ban, mert különféle adatkombinációkkal kísérletezik, majd számos lehetséges kimenet közül választ. Az ember azonban megvizsgálja a kimeneteket, és megtanítja az MI-t, hogyan válasszon a sok kombináció közül."

Robot nyomozómunka?

Egy gép sokkal gyorsabban tud kísérletezni ezzel az adat- és tárgykombinációval, mint egy emberi művész. Schwartz megjegyezte, hogy a DALL-E egy napon partnere lehet egy nyomozónak, aki egy vázlaton keresztül, szemtanúk vallomása alapján rekonstruálni akar egy bűncselekmény helyszínét.

"Amikor a tanúk beadják vallomásaikat, a számítógép képes átvenni a beszélt, természetes nyelvi információkat, és elkészítheti a jelenet rajzát, vagy sok rajzot a jelenetről" - mondta. "Ezeket a vizualizációkat azután integrálni lehetne, hogy pontosabb képet alkossanak az elveszett bizonyítékokról. Ezt a vizualizációt gazdagíthatnák a bűncselekmény előtti helyszín korábbi képeinek integrálásával."

Számos más mesterséges intelligencia által vezérelt program képes művészetet készíteni. Például az Ai-Da robotkaros rendszert és arcfelismerő technológiát használ mesterséges intelligenciával párosítva művészet létrehozásához. A rendszer képes elemezni a gép elé helyezett képet, amely egy algoritmusba táplálkozik, amely a robot karmozgását hozza létre.

A humán művészeknek azonban nem kell aggódniuk amiatt, hogy a robotvezérek leváltják őket – érvelt Ahmed Elgammal, a Rutgers Egyetem Művészeti és Mesterséges Intelligencia Laboratóriumának igazgatója tavaly a The New York Timesban.

"Miközben a művészet meghatározása folyamatosan fejlődik, lényegében az emberek közötti kommunikáció egyik formája" - írta. "Emberi művész nélkül a gép mögött a mesterséges intelligencia alig tud többet tenni, mint játszani a formával, legyen szó akár pixelek manipulálásáról a képernyőn, akár hangjegyekkel egy zenei könyvben. Ezek a tevékenységek lebilincselőek és érzékelhetően érdekesek lehetnek, de nincs értelmük, ha nincs kölcsönhatás a kettő között. művész és közönség."

Miután egy pillantást vetek a DALL-E munkáira, megértem Elgammal álláspontját, hogy a mesterséges intelligencia által készített képek nem művészet. Másrészt jobbak, mint bármely művészet, amit létrehozhatnék. Szóval tényleg, mi a különbség?

Ajánlott: