Midjourney este un exemplu de IA generativă care poate converti solicitările din limbaj natural în imagini. Este doar unul dintre multele generatoare de imagini bazate pe învățarea automată care au apărut în ultimul timp. În ciuda acestui fapt, a devenit unul dintre cele mai mari nume din AI alături de DALL-E și Stable Diffusion .
Cu Midjourney, puteți crea imagini de înaltă calitate din solicitări simple bazate pe text. Nici nu aveți nevoie de hardware sau software specializat pentru a utiliza Midjourney , deoarece funcționează în întregime prin aplicația de chat Discord. Singurul dezavantaj? Va trebui să plătiți cel puțin puțin înainte de a începe să generați imagini. Acest lucru este spre deosebire de cea mai mare parte a concurenței, care oferă, în general, cel puțin câteva generații de imagini gratuit.
Midjourney poate genera imagini uimitoare și cu aspect convingător dintr-o descriere text simplă.
În unele cazuri, imaginile de la Midjourney au înșelat chiar experții în fotografie și în alte domenii. De asemenea, este posibil să fi văzut câteva imagini extrem de convingătoare generate de AI pe rețelele sociale. Exemplele variază de la Papa Francisc îmbrăcat într-o jachetă puf la Trump care ar fi fost arestat cu câteva zile înainte de evenimentul propriu-zis. Dar am văzut și câteva generații creative precum o scenă Star Wars în stilul lui Wes Anderson
Cum funcționează Midjourney?
Spre deosebire de DALL-E, care este susținut de creatorul ChatGPT OpenAI , Midjourney se descrie ca un proiect independent și autofinanțat. În plus, nu a primit nicio finanțare externă până în prezent. Pe de altă parte, OpenAI a strâns până la 10 miliarde de dolari de la Microsoft și o mână de alți investitori. Deci, având în vedere rădăcinile umile ale lui Midjourney, rezultatele sale sunt destul de impresionante.
Nu știm totul despre funcționarea interioară a lui Midjourney, deoarece este cu sursă închisă și rulează pe cod proprietar. Acestea fiind spuse, știm suficient despre tehnologia de bază pentru a oferi o explicație generală.
Midjourney se bazează pe două tehnologii de învățare automată relativ noi , și anume modele mari de limbaj și modele de difuzie. Este posibil să fiți deja familiarizat cu primul dacă ați folosit chatbot-uri generative AI, cum ar fi ChatGPT . Un model de limbă mare îl ajută mai întâi pe Midjourney să înțeleagă semnificația cuvintelor pe care le introduceți în solicitări. Acesta este apoi convertit în ceea ce este cunoscut ca un vector, pe care îl puteți imagina ca o versiune numerică a promptului dumneavoastră. În cele din urmă, acest vector ajută la ghidarea unui alt proces complex cunoscut sub numele de difuzie.
Midjourney folosește un model de difuzie pentru a transforma zgomotul aleatoriu în artă frumoasă.
Difuziunea a devenit populară doar în ultimul deceniu, ceea ce explică barajul brusc al generatoarelor de imagini AI. Într-un model de difuzie, un computer adaugă treptat zgomot aleatoriu setului său de date de antrenament de imagini. De-a lungul timpului, învață cum să recupereze imaginea originală inversând zgomotul. Ideea este că, cu suficientă pregătire, un astfel de model poate învăța cum să genereze imagini complet noi.
Deci, cum arată din perspectiva unui generator de imagini AI? Când introduceți un mesaj text, cum ar fi „pisicile albe așezate într-un Times Square post-apocaliptic”, începe cu un câmp de zgomot vizual. Vă puteți gândi la acest prim pas ca fiind echivalent cu statica de televiziune. Imaginea nu seamănă cu nimic din ce ați cerut în acest moment. Cu toate acestea, un model AI antrenat utilizează apoi difuzia latentă pentru a scădea zgomotul în trepte. În cele din urmă, va da o imagine care seamănă cu obiectele și ideile din lumea reală. Ca o notă secundară, acesta este și motivul pentru care, de obicei, trebuie să așteptați un minut sau două pentru ca o imagine generată de AI să se dezvolte complet. Dacă opriți procesul mai devreme, veți obține o imagine zgomotoasă care nu a trecut prin suficienți pași de eliminare a zgomotului.
Cât costă Midjourney?
Deși am văzut că chatbot-uri precum ChatGPT și Bing Chat oferă o utilizare aproape nelimitată gratuit, nu același lucru se poate spune despre generatoarele de imagini. Practic, toate au niște limite în vigoare, Midjourney nu oferă nici măcar o probă gratuită. Acest lucru se datorează faptului că fiecare sarcină de generare de imagini necesită multă putere de calcul, în special unități de procesare grafică (GPU). În plus, fiecare GPU are memorie video finită, care este folosită în cantități mari pentru procesul de dezgomot.
Deci, având în vedere asta, nu este surprinzător că un generator de imagini AI de ultimă generație vă va costa niște bani. Avem un ghid dedicat privind prețurile și nivelurile de abonament Midjourney , dar va trebui să plătiți minim 10 USD pe lună. Acest lucru vă oferă 3,3 ore de timp GPU, bun pentru aproximativ 200 de generații de imagini. Cel mai scump plan, între timp, vă oferă 60 de ore de timp GPU rapid la 120 USD pe lună.
Sursa: aici
Informațiile furnizate pe startmedia au un scop informativ general și sunt furnizate fără nicio declarație sau garanție de niciun fel, expresă sau implicită, cu privire la caracterul complet, acuratețea, fiabilitatea, caracterul adecvat sau disponibilitatea informațiilor, produselor, serviciilor sau conexe.
Conținutul prezentat în secțiunea `Excepția StartMedia` este o opinie și reflectă doar părerea autorului relativ la subiect.
Grafica conținută pe site este destinată utilizării în scopuri informative și nu trebuie interpretată ca fiind o garanție a caracteristicilor produselor sau serviciilor prezentate. Orice încredere acordată acestor informații se face pe propriul risc al utilizatorului. În niciun caz, startmedia nu va fi răspunzătoare pentru nicio pierdere sau daune, inclusiv, fără limitare, pierderi sau daune indirecte sau consecutive sau orice pierdere sau daune care decurg din pierderea de date sau profituri rezultate din sau în legătură cu utilizarea acestui site web.
Copyright @StartMedia 2025
Un răspuns
This blog is such a hidden gem I stumbled upon it by chance and now I’m completely hooked!