Какво може да прави ChatGPT-4?

Новата версия на изкуствения интелект на Open AI може да работи не само с текст, но и с изображения

08:15 | 15.03.23 г.

Снимка: Gabby Jones/Bloomberg

Очакваше се с огромно любопитство и сега е тук: новият езиков модел на OpenAI - изкуствен интелект, който би трябвало да надмине с доста познатото ни от Chat-GPT.

За разлика от своя предшественик GPT-4 не е нещо, което всеки може просто да изпробва. Той е достъпен само за плащащи клиенти. Или за тези, които използват търсачката Bing - тя работи с GPT-4 във фонов режим от няколко седмици, както потвърди Microsoft.

Това служи и за първа класификация: противно на това, на което се надяваха някои наблюдатели, GPT-4 не е революционна. Той прилича на своите предшественици от фамилията GPT-3, т.е. на онези модели на изкуствен интелект, които досега бяха в основата на Chat-GPT. Сега Chat-GPT се предлага в две версии. Веднъж с по-стария езиков модел и веднъж с GPT-4 на заден план. Според OpenAI новият модел е увеличил производителността на чатбота с още малко, предава Bloomberg.

Повечето хора могат да се възползват от основните възможности на ChatGPT, като се регистрират в OpenAI , въпреки че в някои страни и територии по света се прилагат ограничения. Но най-новата версия в момента се предлага само на абонатите на ChatGPT Plus срещу 20 долара на месец и като API инструмент за разработчици, който те могат да вградят в своите приложения.

В бъдеще ще бъде вградена в търсачката на Microsoft Bing. Понастоящем, ако отидете на уебстраницата на Bing и натиснете бутона "чат" в горната част, вероятно ще бъдете пренасочени към страница, в която ще бъдете помолени да се запишете в списъка на чакащите, като достъпът ще бъде предоставян на потребителите постепенно.

Новият модел може да интерпретира и изображения

Най-поразителното нововъведение: GPT-4 може да работи не само с текст, но и с изображения. Така че, строго погледнато, той вече не е езиков модел, а мултимодален модел. Това означава, че той е обучен с различни видове данни. Комбинацията от информация от изображения и текст води до нови възможности.

OpenAI дава примери за това. Например меме с изречението: „Понякога гледам снимки на Земята от космоса и се удивлявам колко е красива". Под него има снимка на тава с пилешки кюфтета, подредени като континенти върху карта на света.

Изкуственият интелект може да обясни шегата: „Хуморът в това меме идва от неочакваното съчетаване на текст и изображение. Текстът внушава възвишен образ на Земята, но изображението показва нещо делнично и нелепо“. Мемето, разпознато като шега от GPT-4

Други примери показват по-практични случаи на употреба: новият модел очевидно може да обясни инфографика и да събере числата, които тя съдържа, или просто да обясни графика в научна статия.

Потребителят ще има възможност да изпрати снимка заедно с текст - и двете ще могат да се обработват и обсъждат в ChatGPT-4. В бъдеще се очаква и възможността за въвеждане на видео.

Напредък в математиката

Освен това OpenAI дава и списък с изпити, направени за хора, и показва колко са се променили резултатите при преминаването от GPT-3.5 към GPT-4. На симулиран изпит за адвокати новият модел се представя подобно на първите десет процента от отговарящите хора; старата версия беше в долните 10%.

Good news, we've increased our turn limits to 15/150. Also confirming that the next-gen model Bing uses in Prometheus is indeed OpenAI's GPT-4 which they just announced today. Congrats to the @OpenAI team. https://t.co/WTVlVCVOyw pic.twitter.com/VA4Z1SDiEG
— Jordi Ribas (@JordiRib1) March 14, 2023

Именно там скокът между двата модела е най-голям. Но и в областта на химията новият модел се представя малко по-добре от стария. Интересно е също така да се отбележи, че на изпита по математика, на който могат да се явят зрелостниците, за да докажат способностите си, моделът се бе справил по-рано по-зле от почти всички останали. GPT-4 все още е в долната половина на списъка на кандидатите.

Очевидно OpenAI е подобрила именно математическите умения. Учените са захранвали модела с правилни и неправилни отговори на математически въпроси, с логически примери и противоречиви твърдения, както и с широк спектър от идеологии и идеи, пише OpenAI на своя уебсайт. Това са все неща, които бяха критикувани в предишната версия. Тя показваше големи слабости в логическите изводи и в работата с числата и имаше по-скоро ляво-либерална политическа ориентация.

Например старата версия беше затруднена от въпроси от типа: „Майката на Анна има три дъщери: Мария и Ида - а как се казва третата?". Сега експеримент показва: Новата версия отговаря правилно. Когато става въпрос за умножение на по-големи числа, GPT-4 все още греши в някои случаи. А също и при морални и политически въпроси езиковият модел очевидно дава по-балансирани отговори от преди и предлага няколко гледни точки.

Самата OpenAI предупреждава, че GPT-4 все още може да халюцинира, т.е. да си измисля факти, както предшественика си. Когато става въпрос за важни въпроси, компанията казва, че трябва да се действа много внимателно: Оставете хората да контролират, обмислете контекста или изобщо не го използвайте, ако става въпрос за наистина голям залог, предупреждават от OpenAI.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.