12. Jaanuar 2024

Digitaalkunstnik ja TMK õpetaja Valdek Laur koostas lugu jutustava video vaid AI tööriistu kasutades

Digitaalkunstnik ja Tallinna Majanduskooli tehisintellekti võimaluste ja ohtude õpetaja Valdek Laur tegi HP Lovecrafti loole “The Festival” ekraniseeringu, kasutades peaaegu kogu ulatuses ainult AI tööriistu.

Millest sellise video loomise idee tekkis?

Animatsioon on mulle juba väga pikalt huvi pakkunud, ning olen pikalt pidanud plaani moel või teisel liikuvate piltide maailma sukelduda. Lovecraft omakorda on üks mu lemmikkirjanikke – hea meelelahutuslik ja kerge hullumeelsus, ühtaegu kirjeldav ning umbkaudne. Mul on kodus mitmeid tema lugude põhjal tehtud koomikseid ja pildiraamatuid, muidugi ka mõlemad hiljuti eesti keelde tõlgitud raamatud. Juba eelmiste jõulude paiku tekkis mõte teha lühianimatsioon tema loo “Festival” põhjal. Tegu on armsa ja värvikalt kirjeldatud perekondliku jõululooga. Kahjuks ajapuudusel jäi see tol korral katki, seetõttu otsustasin nüüd uuesti ette võtta. Läks plaanitust märksa kauem aega, jõuludeks valmis ei jõudnud, kuid valmis ta sai.

Milliseid AI programme kasutasid ja kas need on tasuta ligipääsetavad?

Aluspiltide tegemiseks kasutasin MidJourneyt ja ChatGPT4/DALLE3 generaatoreid. Teatud juhtudel toimis üks paremini, teatud juhtudel teine. Kuna detsembri algul saabus mulle postkasti ka ligipääs Pika videogeneraatorile, siis võtsin kohe ka selle kasutusele – tegu on uue põlvkonna videogeneraatoriga, mis võimaldab üsna lihtsa vaevaga muuta staatiliselt genereeritud pildi liikuvaks. Tõsi, mul selles osas vedas, kuna tänaseks on Pika juba tasuline – minul aga õnnestus enamus stseene tasuta ära teha. Nende praeguste hindadega oleks see mul üsna kulukaks läinud, või siis oleksin seda vaid osaliselt kasutanud. Teksti muutsin kõneks Elevenlabsi veebiteenuse abil.

Need kõik on tasulised teenused – osad maksavad vähem, osad rohkem, enamus on kuutasulised. Ma pooldan tasuliste programmide kasutamist, kuna AI-genereerimine on väga ressursimahukas ning ka tarkvara välja töötanud arendajatele oleks aus palka maksta. Lihtsamad pildigeneraatorid pole ülemäära kulukad, kuid kogu komplekt muidugi läks isegi tasuta videogenereerimise puhul üksjagu maksma.

Palju kogu see loomisprotsess aega võttis?

Esimesed pildid genereerisin detsembri esimesel nädalal, loo sain valmis jaanuari teisel nädalal. Loomulikult tegelesin erineva aktiivsusega, kuid tolle kuu vältel oli see siiski projekt, mis tööpäevast kõige suurema ampsu võttis. Muidugi tavapärastel meetoditel oleks 23-minutilist animatsiooni üksinda tehes märkimisväärselt rohkem aega läinud.

Millised limiidid hetkel AI tööriistadel on, mis selle protsessi käigus välja tulid?

Peamiseks piiranguks on jätkuvalt tegelaste või keskkondade ühtluse (consistency) saavutamine, palju on varieeruvust ja nn täringu viskamist. Näiteks sama näoga karakterit pole ülemäära lihtne erinevates poosides genereerida. Kaht sama näoga tegelast on üldse keeruline saada. Seetõttu sobis antud lugu üsna hästi, kuna seal on kõik tegelaskujud pigem ebamäärased. Video puhul on peamiseks probleemiks ebarealistlik liikumine ning teravuse kadu – juba 3 sekundi järel kipuvad klipid minema liiga uduseks.

Loomulikult on generaatoreid märksa rohkem, näiteks Stable Diffusioni ja ComfyUI abil oleksin ilmselt saavutanud tugevama ühtluse ning nähtud näidiste põhjal säilib ka pildi teravus ning tegelaste ühtlus märksa paremini. Kuid tegu on keerulise ning täna veel üsna kasutajavaenuliku liidesega lahendusega, seega kindlasti poleks ma sellega saavutanud mainitud ajasäästu. Pigem võtab sel meetodil animeerimine umbes sama kaua aega kui klassikaline animatsioon. Kuid ilmselt järgmiste projektide puhul süübin lähemalt ka SD maailma. Plaanin järgmisena ette võtta mõne E.A. Poe lühilugudest ja ilmselt segan selle juures tavapärast animatsiooni AI-tööriistadega.

Kuidas su tehisintellekti võimaluste ja ohtude tunnid sel õppeaastal läinud on? Kas saavad õppijad nüüd ka sellise video meisterdamisega hakkama? (Valdek Lauri uut õppeainet “Tehisintellekti võimalused ja ohud” loetakse sel õppeaastal 3 rühmale – MS2291, MS2391, KOM238 – toim.)

Tunnid on läinud igati toredalt. Loomulikult videotundide puhul pole kaasamine nii tugev kui tavaliste klassitundide juures, aga kuna ma iga kord küsin õppijatelt ka nende endi tööde ja katsetuste nägemist, siis julgemad on alati kaasa löönud ja sellest on ka minule endale palju abi olnud. Kuna valdkond on veel väga uus ning kogu aeg võrsub uusi rakendusi kui seeni pärast vihma, siis on tudengid avastanud nii mõnegi tööriista, millega ma ise veel kokku pole puutunud. Ka oma tundides alati rõhutan seda, et seda teed käime praegu koos ning ka minul on palju õppust võtta sellest, mida nemad on leidnud ja uurinud.

Kas nad saaksid samasuguse animatsiooniga hakkama? Jah, kindlasti. Kasutatud tööriistad pole tehnilises mõttes nõiakunst. Ja nii Midjourney kui ka ChatGPTga oleme ka tundides tutvust teinud. Tõsi, kontrollitud ning soovitud tulemuseni jõudmine pole niisama lihtne ning see võtab aega ja katsetamist. Kuid õppijate jaoks on ilmselt peamiseks takistuseks tööriistade maksumus. Ühe pildigeneraatori jaoks kümme eurot kuus maksta polegi võibolla ülemäära palju, kuid videoks vajaliku renderduskrediidi ostmine on oluliselt kallim. Ühtlasi on vaja ka endal piisavalt vaba aega. Seega ma siinkohal loomulikult õhutan kõiki mainitud tööriistasid uurima, kuid säilitama praktilist meelt. Kui asuda tegelema video või animatsiooniga, siis üleliigset ajakulu aitab vältida klassikaline storyboardimine ja eeltöö – kui endal on täpselt soovitud tulemus välja mõeldud, vajadusel läbi kirjutatud, siis on palju lihtsam jõuda eesmärgini kiiremini ning ülemäärase ekslemiseta (seega ka aja- ja rahakuluta).

Lisaks Pikale on võimalik videot teha ka Runway ning Kaiberi abil, kuid ka nende puhul saab tasuta genereerida vaid loetud arvu sekundeid. Tasuta videogeneraatorid on peamiselt Stable Diffusioni erinevates variatsioonides, kuid nagu juba öeldud, nende ülesseadmine ning selgeks õppimine on juba astme võrra keerulisem.

Kes soovib digitaalkunstniku Valdek Lauri mõtetest AI-tööriistade kasutamise kohta rohkem teada, saab kuulata ja vaadata Tallinna Majanduskooli podcasti Turundus Taskus 5 episoodi “AI kasutamine piltide ja tekstide loomisel”.