OpenAI dává ChatGPT hlas, který odpovídá na výzvy a příkazy

Čtenáři jako vy pomáhají podporovat MUO. Když provedete nákup pomocí odkazů na našich stránkách, můžeme získat provizi přidružené společnosti. Přečtěte si více.

ChatGPT se má stát interaktivním generativním zážitkem AI. OpenAI odhalilo, že přední světový chatbot s umělou inteligencí bude schopen mluvit a odpovídat na dotazy uživatelů pomocí syntetizovaného, pravděpodobně generovaného hlasu.

Spolu se svým nově nalezeným hlasem bude ChatGPT také schopen reagovat a diskutovat o konkrétních obrázcích nahraných do něj nebo pořízených při používání aplikace ChatGPT pro Android nebo iOS. Funkce rozpoznávání obrazu zní podobně jako Google Lens a další aplikace, které používají neuronové sítě k přesné detekci dat a informací.

OpenAI dává ChatGPT hlas

25. září 2023 vývojář ChatGPT OpenAI odhalen dal by hlas svému přednímu světovému generativnímu chatbotovi s umělou inteligencí. Uživatelé ChatGPT mohou mluvit přímo s chatbotem a požadovat, aby se ozval zpět, což efektivně umožňuje ChatGPT poprvé konverzovat přímo hlasem.

V ukázkovém klipu OpenAI je žena, která žádá ChatGPT, aby vytvořil jedinečný příběh před spaním, na který ChatGPT náležitě zareaguje ženským syntetizovaným hlasem.

Podle Kabelové , nový model převodu textu na řeč byl vyvinut interně. Dokáže generovat „lidský“ zvuk z textu a několika sekund ukázkové řeči ( pomocí modelu OpenAI Whisper ) a mluví různými tóny a styly. Řadu hlasových ukázek najdete na blog OpenAI .

jak těžit dogecoiny na pc

Některé společnosti již používají nový hlasový model OpenAI. Například Spotify používá model převodu textu na řeč OpenAI k překladu podcastů do různých jazyků, přičemž kombinuje schopnost ChatGPT jazykového překladu s novou schopností mluvit.

jak vyčistit ventilátor ps4 bez jeho rozebrání

Nový model převodu textu na řeč ChatGPT je k dispozici pouze předplatitelům Plus a Enterprise používajícím oficiální aplikace pro Android a iOS a očekává se, že bude spuštěn během příštích dvou týdnů (od 25. září 2023). Kromě toho je nová hlasová funkce zpočátku omezena na angličtinu, i když bychom očekávali, že se to rychle změní.

ChatGPT dokáže rozpoznat a fotografie

Druhou částí aktualizace ChatGPT OpenAI je schopnost analyzovat a mluvit obrázky nahrané do nástroje. Možnost vizuální analýzy obrazu byla uvedena v aktualizačních videích GPT-4, ale od té doby se o ní příliš nemluvilo ( Interpret kódu ChatGPT stranou ).

ChatGPT nyní získává funkcionalitu podobnou Google Lens. Můžete nahrát obrázek do ChatGPT nebo pořídit fotografii pomocí fotoaparátu smartphonu v aplikaci ChatGPT a obrázek bude podrobně popsán a v případě potřeby přidá další kontext.

Nazvat to „podobné jako Google Lens“ je opravdu nespravedlnost. Schopnost chatovat tam a zpět o obrázku, abyste získali více informací a kontextu, je mimořádně užitečná pro širokou škálu nastavení. Je však důležité si všimnout drobného písma, protože OpenAI jasně uvádí, že má omezenou „schopnost ChatGPT analyzovat a přímo vyjadřovat se k lidem“ z důvodů ochrany soukromí a přesnosti. Přesto, mohl by nástroj „Who Is This“ založený na OpenAI v budoucnu fungovat? (Doufejme, že ne!)

Stejně jako nový model převodu textu na řeč zavede OpenAI v příštích dvou týdnech rozpoznávání obrázků, i když bude dostupné na všech platformách, nejen na aplikaci ChatGPT.

Soukromí, bezpečnost a další problémy

Důsledky hlasově poháněného ChatGPT jsou výrazné. Jistě, je to vzrušující. Schopnost vytvořit jedinečně syntetizovaný hlas s použitím pouze krátkého úryvku jako příkladu však přináší značné problémy s ochranou soukromí a zabezpečením. Potenciál pro zlomyslné aktéry využít tyto nástroje je obrovský a jako u každého generativního nástroje umělé inteligence platí, že jakmile je džin z láhve venku, už se do něj absolutně nevrátí. Žádná regulace umělé inteligence od vlád nebo myšlenkových vůdců se nemůže vrátit zpět. příliv.

Zdá se, že i varování OpenAI na toto téma obchází samozřejmé, přestože tyto problémy zmiňuje:

baterie notebooku připojena, nenabíjí se

Tyto schopnosti však také představují nová rizika, jako je možnost, aby se zákeřní činitelé vydávali za veřejné osobnosti nebo se dopouštěli podvodu. To je důvod, proč tuto technologii používáme k podpoře konkrétního případu použití – hlasového chatu.

Vzhledem k tomu, že se jedná o špičku ledovce, očekávejte odmítnutí nově nalezeného hlasu ChatGPT, zvláště jakmile dojde k předvídatelnému nárůstu v nepříjemných titulcích, které tvrdí, že ChatGPT je používán k páchání podvodů a tak dále.

OpenAI dělá z ChatGPT aplikaci Go-To AI

Čím více OpenAI přidává do ChatGPT uživatelsky přívětivé funkce, tím více se stává běžnou generativní aplikací AI. Jako první, která dosáhla široké slávy během počátečního generativního boomu umělé inteligence, ChatGPT stále vede cestu a je jedinou aplikací, kterou lze použít, a to navzdory konkurenci jako Google Bard (a potenciálně Google Gemini) a Anthropic's Claude.

Dokud bude OpenAI moci i nadále přidávat funkce, které usnadňují používání ChatGPT, udrží lidi v kontaktu a budou se stále více přibližovat svému cíli, kterým je skutečně multimodální nástroj umělé inteligence.