romanian_version
english version
german version
french version
italian version
hebrew version
Facebook
Twitter
Email

DOAR FAPTE. FĂRĂ COMENTARII.
Cu o singură excepție

Azi: 2026-04-18

la multi ani

Cat Woman – așa cum o înțelege inteligența artificială Midjourney

Midjourney - Cat woman

Midjourney este un exemplu de IA generativă care poate converti solicitările din limbaj natural în imagini. Este doar unul dintre multele generatoare de imagini bazate pe învățarea automată care au apărut în ultimul timp. În ciuda acestui fapt, a devenit unul dintre cele mai mari nume din AI alături de DALL-E și Stable Diffusion .

Cu Midjourney, puteți crea imagini de înaltă calitate din solicitări simple bazate pe text. Nici nu aveți nevoie de hardware sau software specializat pentru a utiliza Midjourney , deoarece funcționează în întregime prin aplicația de chat Discord. Singurul dezavantaj? Va trebui să plătiți cel puțin puțin înainte de a începe să generați imagini. Acest lucru este spre deosebire de cea mai mare parte a concurenței, care oferă, în general, cel puțin câteva generații de imagini gratuit.

Midjourney poate genera imagini uimitoare și cu aspect convingător dintr-o descriere text simplă.

În unele cazuri, imaginile de la Midjourney au înșelat chiar experții în fotografie și în alte domenii. De asemenea, este posibil să fi văzut câteva imagini extrem de convingătoare generate de AI pe rețelele sociale. Exemplele variază de la Papa Francisc îmbrăcat într-o jachetă puf la Trump care ar fi fost arestat cu câteva zile înainte de evenimentul propriu-zis. Dar am văzut și câteva generații creative precum o scenă Star Wars în stilul lui Wes Anderson

Cum funcționează Midjourney?

Spre deosebire de DALL-E, care este susținut de creatorul ChatGPT OpenAI , Midjourney se descrie ca un proiect independent și autofinanțat. În plus, nu a primit nicio finanțare externă până în prezent. Pe de altă parte, OpenAI a strâns până la 10 miliarde de dolari de la Microsoft și o mână de alți investitori. Deci, având în vedere rădăcinile umile ale lui Midjourney, rezultatele sale sunt destul de impresionante.

Nu știm totul despre funcționarea interioară a lui Midjourney, deoarece este cu sursă închisă și rulează pe cod proprietar. Acestea fiind spuse, știm suficient despre tehnologia de bază pentru a oferi o explicație generală.

Midjourney se bazează pe două tehnologii de învățare automată relativ noi , și anume modele mari de limbaj și modele de difuzie. Este posibil să fiți deja familiarizat cu primul dacă ați folosit chatbot-uri generative AI, cum ar fi ChatGPT . Un model de limbă mare îl ajută mai întâi pe Midjourney să înțeleagă semnificația cuvintelor pe care le introduceți în solicitări. Acesta este apoi convertit în ceea ce este cunoscut ca un vector, pe care îl puteți imagina ca o versiune numerică a promptului dumneavoastră. În cele din urmă, acest vector ajută la ghidarea unui alt proces complex cunoscut sub numele de difuzie.

Midjourney folosește un model de difuzie pentru a transforma zgomotul aleatoriu în artă frumoasă.

Difuziunea a devenit populară doar în ultimul deceniu, ceea ce explică barajul brusc al generatoarelor de imagini AI. Într-un model de difuzie, un computer adaugă treptat zgomot aleatoriu setului său de date de antrenament de imagini. De-a lungul timpului, învață cum să recupereze imaginea originală inversând zgomotul. Ideea este că, cu suficientă pregătire, un astfel de model poate învăța cum să genereze imagini complet noi.

Deci, cum arată din perspectiva unui generator de imagini AI? Când introduceți un mesaj text, cum ar fi „pisicile albe așezate într-un Times Square post-apocaliptic”, începe cu un câmp de zgomot vizual. Vă puteți gândi la acest prim pas ca fiind echivalent cu statica de televiziune. Imaginea nu seamănă cu nimic din ce ați cerut în acest moment. Cu toate acestea, un model AI antrenat utilizează apoi difuzia latentă pentru a scădea zgomotul în trepte. În cele din urmă, va da o imagine care seamănă cu obiectele și ideile din lumea reală. Ca o notă secundară, acesta este și motivul pentru care, de obicei, trebuie să așteptați un minut sau două pentru ca o imagine generată de AI să se dezvolte complet. Dacă opriți procesul mai devreme, veți obține o imagine zgomotoasă care nu a trecut prin suficienți pași de eliminare a zgomotului.

Cât costă Midjourney?

Deși am văzut că chatbot-uri precum ChatGPT și Bing Chat oferă o utilizare aproape nelimitată gratuit, nu același lucru se poate spune despre generatoarele de imagini. Practic, toate au niște limite în vigoare, Midjourney nu oferă nici măcar o probă gratuită. Acest lucru se datorează faptului că fiecare sarcină de generare de imagini necesită multă putere de calcul, în special unități de procesare grafică (GPU). În plus, fiecare GPU are memorie video finită, care este folosită în cantități mari pentru procesul de dezgomot.

Deci, având în vedere asta, nu este surprinzător că un generator de imagini AI de ultimă generație vă va costa niște bani. Avem un ghid dedicat privind prețurile și nivelurile de abonament Midjourney , dar va trebui să plătiți minim 10 USD pe lună. Acest lucru vă oferă 3,3 ore de timp GPU, bun pentru aproximativ 200 de generații de imagini. Cel mai scump plan, între timp, vă oferă 60 de ore de timp GPU rapid la 120 USD pe lună.

Sursa: aici

Un răspuns

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *