5 nejlepších generátorů obrázků AI s otevřeným zdrojovým kódem

5 nejlepších generátorů obrázků AI s otevřeným zdrojovým kódem

Rychlé odkazy

Modely generování textu na obrázek založené na umělé inteligenci jsou všude a jsou denně snadněji přístupné. I když je snadné pouze navštívit web a vygenerovat obrázek, který hledáte, open source generátory textu na obrázek jsou vaší nejlepší volbou, pokud chcete mít větší kontrolu nad procesem generování.





VYUŽITÍ VIDEA DNE POKRAČOVÁNÍ V OBSAHU POKRAČUJTE PŘEJÍMÁNÍM

Na internetu jsou k dispozici desítky bezplatných a open source generátorů AI textu na obrázek, které se specializují na konkrétní druhy obrázků. Takže jsme probrali hromadu a našli ty nejlepší generátory textu na obrázek s otevřeným zdrojovým kódem umělé inteligence, které můžete hned teď vyzkoušet.





jak používáte režim na výšku na iphone 7

1 Pastelka

  craiyon-home-page

Craiyon je jedním z nejsnáze dostupných open-source generátorů AI obrázků. Je založen na DALL-E Mini, a zatímco vy můžete klonovat úložiště Github a nainstalovat model lokálně na váš počítač, zdá se, že Craiyon od tohoto přístupu upustil ve prospěch svých webových stránek.





Oficiální úložiště Github nebylo aktualizováno od června 2022, ale nejnovější model je stále k dispozici zdarma na oficiální stránky Craiyon . Neexistují ani aplikace pro Android nebo iOS.

Pokud jde o funkčnost, uvidíte všechny obvyklé možnosti, které očekáváte od generátoru obrázků AI. Jakmile zadáte výzvu a získáte obrázek, můžete pomocí funkce upscale získat kopii ve vyšším rozlišení. Na výběr jsou tři styly: Art, Photo a Drawing. Můžete také vybrat možnost 'Žádné', pokud chcete, aby rozhodoval model.



  craiyon-generated-image

„Expertní režim“ navíc umožňuje zahrnout negativní slova, která modelu sdělují, aby se vyhnul konkrétním položkám. K dispozici je také funkce rychlého předvídání, která využívá ChatGPT k tomu, aby uživatelům pomohla napsat co nejlepší a nejpodrobnější výzvy. A konečně, funkce pro odstranění pozadí s umělou inteligencí vám mohou pomoci ušetřit čas a námahu při ořezávání pozadí z obrázků.

A to je asi všechno, co Craiyon dělá. Není to nejsofistikovanější model generování obrazu AI, ale jako základní model se hodí, pokud nechcete něco detailního nebo realistického.





Model je zdarma k použití, ale bezplatní uživatelé jsou omezeni na devět bezplatných obrázků najednou během jedné minuty. Můžete se přihlásit k odběru jejich úrovní Supporter nebo Professional (ceny 5 USD, respektive 20 USD měsíčně a účtované ročně), abyste nezískali žádné reklamy ani vodoznaky, rychlejší generování a možnost ponechat vygenerované obrázky soukromé. Vlastní úroveň předplatného také umožňuje vlastní modely, integraci, vyhrazenou podporu a soukromé servery.

2 Stabilní difúze 1.5

Stable Diffusion je možná jedním z nejpopulárnějších modelů generování textu na obrázek s otevřeným zdrojovým kódem. Pohání také další modely, včetně tří níže zmíněných generátorů obrázků. Byl vydán v roce 2022 a od té doby má mnoho implementací.





  stable-difusion-web-ui

Ušetřím vás příliš technických podrobností o tom, jak model funguje (pro které se můžete podívat na jejich oficiální úložiště Github ), ale model se snadno instaluje i pro úplné začátečníky a funguje dobře, pokud máte dedikovaný GPU s alespoň 4 GB paměti. Můžete také přistupovat Stabilní difúze online a my vám pomůžeme, pokud chcete spusťte Stable Diffusion na počítači Mac .

Pro Stable Diffusion je k dispozici několik kontrolních bodů (považujte je za verze). Zatímco jsme testovali verzi 1.5, verze 2.1 je také v aktivním vývoji a je přesnější.

  dreamshaper-ai-generated-image
Yadullah Abidi/MakeUseOf/DreamShaper

Provoz modelu je také poměrně snadný. Testovali jsme to s AUTOMATIC1111 Webové uživatelské rozhraní Stable Diffusion a všechny ovládací prvky a parametry fungují dobře. Je to také docela odolné proti NSFW díky databázi LAION-5B, na které model trénoval (ačkoli to není dokonalé, uvědomte si). Zatímco samotná doba generování se bude lišit v závislosti na vašem hardwaru, můžete očekávat, že vaše obrázky budou detailní a realistické i se základními výzvami.

3 DreamShaper

DreamShaper je model generování obrazu založený na Stable Diffusion. Byl zamýšlen jako open-source alternativa k MidJourney a zaměřuje se na fotorealismus ve generovaných obrázcích, i když si stejně dobře poradí se styly anime a malby s pár úpravami.

Model je schopnější než Stable Diffusion, což uživatelům umožňuje větší volnost při konečném výstupu, od bleskových vylepšení po volnější omezení NSFW. Provoz modelu je také snadný, s a stahovatelná, předem trénovaná dostupná verze online pro místní přístup a řadu webových stránek, včetně Sinkin.ai , RandomSeed , a Mage.space (vyžaduje základní předplatné), které vám umožní provozovat model s akcelerací GPU.

  dreamshaper-stabledifusion-srovnání

Jak už asi tušíte, obrázky generované DreamShaperem mají tendenci vypadat realističtěji ve srovnání se Stable Diffusion. I když spustíte stejnou výzvu na obou modelech, model DreamShaper bude pravděpodobně realističtější, podrobnější a lépe osvětlený.

To platí zejména pro portréty nebo postavy, což je něco, co mi Stable Diffusion ve srovnání se stejnou výzvou chybí. Pokud jsou vaše obrázky příliš realistické, zde jsou čtyři způsoby, jak identifikovat obrázek generovaný AI .

Ke spuštění modelu také nepotřebujete monstrózní počítač. Moje GTX 1650Ti s 4GB VRAM běžela model perfektně. Doba generování byla o něco delší, ale nezdálo se, že by to ovlivnilo skutečný výstup. To znamená, že ke spuštění DreamShaper XL, který je založen na modelu Stable Diffusion XL, možná budete potřebovat GPU s více VRAM.

4 InvokeAI

Invoke AI je další model generování obrázků založený na AI založený na Stable Diffusion, s XL verzí založenou na Stable Diffusion XL. Má také své vlastní webové uživatelské rozhraní a uživatelské rozhraní příkazového řádku, což znamená, že nebudete muset skákat obruče s věcmi, jako je webové uživatelské rozhraní Stable Diffusion.

  invokeai-user-interface-with-image

Model se zaměřuje na to, aby uživatelé mohli vytvářet vizuály na základě jejich duševního vlastnictví s přizpůsobenými pracovními postupy. InvokeAI je jedním z nejlepších modelů generování obrázků s otevřeným zdrojovým kódem pro trénování vlastních modelů a práci s duševním vlastnictvím.

Své oficiální úložiště Github uvádí dva způsoby instalace: instalaci pomocí instalačního programu InvokeAI nebo pomocí PyPI, pokud vám vyhovuje terminál a Python a potřebujete větší kontrolu nad balíčky nainstalovanými s modelem.

Dodatečné ovládání však přináší několik omezení, zejména přísnější hardwarové požadavky. InvokeAI doporučuje vyhrazený GPU s alespoň 4 GB paměti, přičemž pro provoz XL varianty se doporučuje šest až osm GB. Požadavky na VRAM platí pro GPU AMD i Nvidia. Budete také potřebovat alespoň 12 GB RAM a 12 GB volného místa na disku pro model, jeho závislosti a Python.

jak získat více zobrazení na twitchi
  invoke-ai-generated-image
Yadullah Abidi/MakeUseOf/InvokeAI

Přestože dokumentace nedoporučuje GPU řady Nvidia GTX 10 Series a 16 Series pro jejich nedostatek video paměti, poskytnutý instalační program fungoval v pořádku. I když se váš počet najetých kilometrů může lišit, pokud používáte GPU nižší třídy, počítejte s tím, že počkáte déle, než se vaše výzvy změní na obrázky. A konečně, pokud používáte Windows, můžete použít pouze GPU Nvidia, protože v současné době neexistuje žádná podpora pro GPU AMD.

Pokud jde o část generování obrazu, model inklinuje spíše k uměleckým stylům než k fotorealismu. Samozřejmě můžete model trénovat na své datové sadě a nechat jej generovat obrázky blíže k tomu, co chcete, i když to zahrnuje fotorealistické obrázky, zejména pokud pracujete v produktovém designu, architektuře nebo maloobchodních prostorech. Jedna důležitá věc, kterou je třeba mít na paměti, je, že InvokeAI je primárně engine pro generování obrázků, což znamená, že pro dosažení nejlepších výsledků budete pravděpodobně muset používat své vlastní modely (snadno je najdete prostřednictvím správce modelů ve webovém rozhraní) jako výchozí. model je velmi podobný samotnému Stable Diffusion.

5 Openjourney

Openjourney je bezplatný model generování obrázků AI s otevřeným zdrojovým kódem založený opět na Stable Diffusion. Pokud vás zajímá, proč se model nazývá Openjourney, je to proto, že byl trénován na snímcích Midjourney a dokáže napodobit svůj styl v obrázcích, které generuje.

PromptHero , společnost stojící za Openjourney, vám umožňuje testovat model spolu s dalšími modely, včetně Stable Diffusion (verze 1.5 a 2), DreamShaper a Realistic Vision. Při registraci získáte 25 bezplatných kreditů (jeden kredit za každý vygenerovaný obrázek), poté se musíte přihlásit k odběru jejich úrovně předplatného Pro, které stojí 9 $ měsíčně a poskytuje vám přístup k 300 kreditům každý měsíc s dalšími exkluzivními funkcemi.

  openjourney-stabledifusion-comparson

Pokud jej však chcete provozovat lokálně a zdarma, můžete stáhněte si soubor modelu z HuggingFace a spusťte jej pomocí webového uživatelského rozhraní Stable Diffusion. Openjourney je také druhým nejstahovanějším modelem generování obrázků AI na HuggingFace, hned za Stable Diffusion.

Openjourney na svých stránkách neuvádí žádné konkrétní hardwarové požadavky pro lokální spuštění modelu, ale můžete očekávat podobné hardwarové požadavky jako Stable Diffusion. To znamená vyhrazený GPU se 4 GB VRAM, 16 GB RAM a přibližně 12 až 15 GB volného místa v počítači pro uložení modelu a jeho závislostí.

  openjourney-ai-generated-image
Yadullah Abidi/MakeUseOf/OpenJourney

Obrázky generované Openjourney bývají vyvážené mezi fotorealismem a uměním, pokud není uvedeno jinak. Pokud hledáte všestranný model a dáváte přednost vzhledu a chování Midjourney, aniž byste museli platit za předplatné, Openjourney je jednou z nejlepších možností.