Създателите на чатбота ChatGPT представиха езиков модел от ново поколение. GPT-4 може да обработва не само текст, но и изображения. Какво още се знае за новите му възможности?
На 14 март компанията OpenAI официално представи нов модел изкуствен интелект (AI) GPT-4.
Няколко дни преди представянето възможният потенциал на новия AI беше активно обсъждан в социалните мрежи. Предвиждаше се, че GPT-4 ще бъде технология, променяща играта за цялото общество.
Очакваше се, че GPT-4 ще бъде 500 пъти по-мощен от своя предшественик и ще може да работи с визуално съдържание, не само да го анализира, но и да създава снимки и видеоклипове.
Пускането на петото поколение в семейството на GPT обаче не отговаря на всички очаквания на потребителите.
Популярният ChatGPT е базиран на GPT-3.5, който има 175 милиарда параметри. GPT-4 изследва много по-големи обеми от данни. Ръководството на OpenAI обаче отказа да разкрие колко данни е получил моделният език и да назове броя на неговите параметри.
Основната разлика е, че GPT-4 е мултимодален и може да приема изображения като вход. Тоест сега чатботът не само чете текст, но и анализира изображения. Тази иновация стана една от най-важните в представянето на GPT-4.
Какво може GPT-4
В представянето си OpenAI скромно претендира за постиженията на новия модел, наблягайки на стабилност, сигурност и предвидимост. Компанията отбелязва, че са поправили грешките, открити при използване на GPT-3.5.
Разработчиците разграничават три посоки на развитие на новия модел.
Първият е творческите способности. GPT-4 стана по-креативен и съвместен от своя предшественик GPT-3.5. Може да генерира, редактира и изпълнява творчески и технически задачи за писане с потребители: създава песни, пише скриптове, изучава стила на писане на потребителя.
Второто е визуално въвеждане. Новият GPT-4 е способен да приема изображения като вход. По-специално, новият езиков модел може да генерира своите отговори въз основа на входни данни, състоящи се от текст и изображения.
Тоест можете да качите документ с текст, снимки, диаграми и екранни снимки към него. GPT-4 ще ги анализира и ще даде отговори въз основа на всички тези данни.
Например, можете да споделяте снимки на продукти с модела и тя ще предложи опции за готвене.
Компанията допълва, че входните данни под формата на изображения не са публична, а изследователска версия.
Третото е възможността за работа с големи текстове. GPT-4 е в състояние да обработва повече от 25 хиляди думи, което ви позволява да го използвате за създаване на дълги текстове, разширени разговори, както и за търсене и анализ на документи.
Чатботът може да обобщава дълги текстове много по-добре. Дори когато потребителят добави едно произволно изречение, AI ще посочи неточността.
GPT-4 също подобри уменията си за аргументация и разбирането на контекста. Той е в състояние да генерира по-оптимизирани отговори, които наподобяват разговор с истински човек.
GPT-4 е успешен ученик
GPT-4 в обикновен разговор може да не се различава много от своя предшественик GPT-3.5. Компанията обаче уверява, че с по-задълбочено взаимодействие с чатбота GPT-4 е по-надежден, по-креативен и по-продуктивен.
За да демонстрира разликата между двата модела, OpenAI ги тества при различни задачи, включително симулиране на изпити, които първоначално са били предназначени за хора.
Изпитите, използвани в компанията, се състояха от тестове и подробни въпроси от различни области на науката – от хуманитарни до технически дисциплини.
GPT-4 се представи значително по-добре от GPT-3.5 в тестовете. Резултатите му от повечето професионални и академични изпити отговарят на нивото на успелите студенти.
Например, AI взе симулирана версия на един адвокатски изпит с резултат сред 10% от най-добрите участници в теста. Освен това перфектно оформя стандартизиран тест, който проверява уменията за аналитично писане за прием в магистърски и докторски програми в университети.
Освен това GPT-4 беше оценен спрямо традиционните тестове, предназначени за модели на машинно обучение. Резултатите далеч надхвърлят големите езикови модели на AI.
Освен това OpenAI реши да преведе един от тези MMLU тестове – набор от 14 000 задачи с множествен избор, обхващащи 57 теми – на 26 езика с помощта на Azure Translate.
Тестовете показаха, че в 24 случая GPT-4 превъзхожда GPT-3.5 и други LLM (Chinchilla, PaLM) на английски, особено сред рядко използвани езици като латвийски, уелски и суахили.
Все още има ограничения
OpenAI отбелязва, че GPT-4 има същите ограничения като предишните GPT модели, тъй като не е напълно надежден. Компанията го нарича „халюцинации“.
Разработчиците уверяват: въпреки че „халюцинациите“ остават, GPT-4 има много по-малко от тях в сравнение с предишните модели. Така новият AI модел получи 40% повече точки от GPT-3.5, според оценките на компанията.
GPT-4, подобно на предишния модел, няма информация за събития след септември 2021 г. Компанията също така добавя, че AI не се учи от собствения си опит.
Сигурност
Създателите на GPT-4 обърнаха специално внимание на проблемите със сигурността.
„Прекарахме шест месеца, за да направим GPT-4 по-безопасен и по-последователен. GPT-4 има 82% по-малка вероятност да отговори на искания за забранено съдържание и 40% по-вероятно от GPT-3.5 да предостави действителни отговори“, казва компанията .
Тъй като невронната мрежа беше обучена, разработчиците добавиха сигнали, за да намалят вероятността от даване на опасни съвети. GPT-4 има по-добри граници на сигурност, което трябва да предотврати злонамереното използване на чатбота.
GPT-4 ще се появи не само в ChatGPT Plus
Не всеки ще може да използва GPT-4 чрез чатбот, какъвто беше случаят с неговия предшественик. Езиковият модел ще бъде достъпен в платената версия на чатбота ChatGPT Plus за $20 на месец и като API за разработчици за създаване на приложения и услуги.
На презентацията на GPT-4 разработчиците казаха, че новият AI модел е интегриран в редица проекти извън компанията.
Microsoft потвърди, че неговата интернет търсачка Bing вече работи на GPT-4.
Освен това OpenAI разшири технологията си към други продукти, включително приложението за изучаване на езици Duolingo . В него GPT-4 ще действа като събеседник и обясняващ правилата, когато потребителят направи грешка.
Датският стартъп Be My Eyes , който създава технология за подпомагане на хора със зрителни проблеми, също ще използва GPT-4. Be My Eyes започна разработването на базиран на GPT-4 виртуален доброволец в приложение, което може да генерира същото ниво на контекст и разбиране като човешки доброволец.
Банковият холдинг Morgan Stanley , който управлява капитала, ще използва нов модел от OpenAI за работата на вътрешен чатбот.
Khan Academy, образователна организация с нестопанска цел , каза, че ще използва GPT-4 за захранване на Khanmigo. Това е захранван с изкуствен интелект асистент, който функционира като виртуален преподавател за ученици и асистент за учители.
Правителството на Исландия ще използва GPT-4, за да запази своя език.
Американската технологична компания Stripe , която разработва решения за получаване и обработка на електронни плащания, ще използва възможностите на GPT-4 за оптимизиране на взаимодействието с потребителите и борба с измамите.
Преведено от Мрежата