Otwarcie we wtorek ogłoszenie Firma integruje najnowszą technologię generowania obrazów z Chatbot Chatgpt GPT-40 Modeluje, że firma ogłosiła w zeszłym roku.
Korzystając z połączonej technologii, CHATGPT staje się kompleksowym sklepem sztucznie generowanej treści, zastępując inny system, Dall-E 3, tylko dla tworzenia obrazu.
Zamiast Dall-e 3 zamiast tego używane jest generowanie obrazu Chatgpt SoraKolejna platforma, którą firma skoncentrowała się na generowaniu wideo w zeszłym roku. Openai nie szczegółowo opisał planów generowania wideo za pomocą ChatGPT w swoim komunikacie prasowym.
Openai powiedział, że największym postępem w możliwościach obrazu Chatbota jest jakość jego możliwości renderowania tekstu. Firma twierdzi, że system jest teraz w stanie generować obrazy ze sensownym i łatwym do odczytania tekstem.
„Szkoliliśmy modele do wspólnie dostarczania obrazów i tekstu online. Nauczyliśmy się nie tylko, w jaki sposób obrazy odnoszą się do języka, ale także jak odnoszą się do siebie”-powiedziała firma w komunikacie prasowym. „W połączeniu z agresywnym modelem po treningu istnieje niesamowita ilość przepływu wizualnego, który jest użyteczny, spójny i może wytwarzać obrazy, które są rozpoznawane kontekst”.
Firma powiedziała, że system pozwoli użytkownikom wykorzystywać przesłane obrazy jako inspirację wizualną, i lepiej jest przestrzegać instrukcji. Openai twierdzi, że „inne systemy zmagają się z ~ 5-8 obiektami, ale GPT-4o może obsłużyć do 10-20 różnych obiektów”.
Istnieją jednak pewne kompromisy. Model może przycinać długie obrazy u dołu i nadal ma tendencję do dostrzegania tego, czego nie ma, i ma trudności z renderowaniem języka lub obrazów pozbawionych leków lub obrazów z tekstem o bardzo małym rozmiarze.
GPT-4O jest łatwo dostępny na poziomach Plus, Pro, Pro, Pro, Team i Free, ale subskrybenci „plus” mają wyższe ograniczenia użytkowania niż „bezpłatni” subskrybenci. Firma powiedziała, że funkcja wkrótce zostanie wprowadzona nie tylko dla programistów korzystających z interfejsu API, ale także użytkowników Enterprise i EDU.
Poniżej znajduje się część demo obrazu z komunikatu prasowego firmy.