LLM (Chinchilla Archive - Стефан К.Стефан К.

Създателите на чатбота ChatGPT представиха езиков модел от ново поколение. GPT-4 може да обработва не само текст, но и изображения. Какво още се знае за новите му възможности?

На 14 март компанията OpenAI официално представи нов модел изкуствен интелект (AI) GPT-4.

Няколко дни преди представянето възможният потенциал на новия AI беше активно обсъждан в социалните мрежи. Предвиждаше се, че GPT-4 ще бъде технология, променяща играта за цялото общество.

Очакваше се, че GPT-4 ще бъде 500 пъти по-мощен от своя предшественик и ще може да работи с визуално съдържание, не само да го анализира, но и да създава снимки и видеоклипове.

Пускането на петото поколение в семейството на GPT обаче не отговаря на всички очаквания на потребителите.

Популярният ChatGPT е базиран на GPT-3.5, който има 175 милиарда параметри. GPT-4 изследва много по-големи обеми от данни. Ръководството на OpenAI обаче отказа да разкрие колко данни е получил моделният език и да назове броя на неговите параметри.

Основната разлика е, че GPT-4 е мултимодален и може да приема изображения като вход. Тоест сега чатботът не само чете текст, но и анализира изображения. Тази иновация стана една от най-важните в представянето на GPT-4.

Какво може GPT-4

В представянето си OpenAI скромно претендира за постиженията на новия модел, наблягайки на стабилност, сигурност и предвидимост. Компанията отбелязва, че са поправили грешките, открити при използване на GPT-3.5.

Разработчиците разграничават три посоки на развитие на новия модел.

Първият е творческите способности. GPT-4 стана по-креативен и съвместен от своя предшественик GPT-3.5. Може да генерира, редактира и изпълнява творчески и технически задачи за писане с потребители: създава песни, пише скриптове, изучава стила на писане на потребителя.

Второто е визуално въвеждане. Новият GPT-4 е способен да приема изображения като вход. По-специално, новият езиков модел може да генерира своите отговори въз основа на входни данни, състоящи се от текст и изображения.

Тоест можете да качите документ с текст, снимки, диаграми и екранни снимки към него. GPT-4 ще ги анализира и ще даде отговори въз основа на всички тези данни.

Например, можете да споделяте снимки на продукти с модела и тя ще предложи опции за готвене.

Компанията допълва, че входните данни под формата на изображения не са публична, а изследователска версия.

Третото е възможността за работа с големи текстове. GPT-4 е в състояние да обработва повече от 25 хиляди думи, което ви позволява да го използвате за създаване на дълги текстове, разширени разговори, както и за търсене и анализ на документи.

Чатботът може да обобщава дълги текстове много по-добре. Дори когато потребителят добави едно произволно изречение, AI ще посочи неточността.

GPT-4 също подобри уменията си за аргументация и разбирането на контекста. Той е в състояние да генерира по-оптимизирани отговори, които наподобяват разговор с истински човек.

GPT-4 е успешен ученик

GPT-4 в обикновен разговор може да не се различава много от своя предшественик GPT-3.5. Компанията обаче уверява, че с по-задълбочено взаимодействие с чатбота GPT-4 е по-надежден, по-креативен и по-продуктивен.

За да демонстрира разликата между двата модела, OpenAI ги тества при различни задачи, включително симулиране на изпити, които първоначално са били предназначени за хора.

Изпитите, използвани в компанията, се състояха от тестове и подробни въпроси от различни области на науката – от хуманитарни до технически дисциплини.

GPT-4 се представи значително по-добре от GPT-3.5 в тестовете. Резултатите му от повечето професионални и академични изпити отговарят на нивото на успелите студенти.

Например, AI взе симулирана версия на един адвокатски изпит с резултат сред 10% от най-добрите участници в теста. Освен това перфектно оформя стандартизиран тест, който проверява уменията за аналитично писане за прием в магистърски и докторски програми в университети.

Освен това GPT-4 беше оценен спрямо традиционните тестове, предназначени за модели на машинно обучение. Резултатите далеч надхвърлят големите езикови модели на AI.

Освен това OpenAI реши да преведе един от тези MMLU тестове – набор от 14 000 задачи с множествен избор, обхващащи 57 теми – на 26 езика с помощта на Azure Translate.

Тестовете показаха, че в 24 случая GPT-4 превъзхожда GPT-3.5 и други LLM (Chinchilla, PaLM) на английски, особено сред рядко използвани езици като латвийски, уелски и суахили.

Все още има ограничения

OpenAI отбелязва, че GPT-4 има същите ограничения като предишните GPT модели, тъй като не е напълно надежден. Компанията го нарича „халюцинации“.

Разработчиците уверяват: въпреки че „халюцинациите“ остават, GPT-4 има много по-малко от тях в сравнение с предишните модели. Така новият AI модел получи 40% повече точки от GPT-3.5, според оценките на компанията.

GPT-4, подобно на предишния модел, няма информация за събития след септември 2021 г. Компанията също така добавя, че AI не се учи от собствения си опит.

Сигурност

Създателите на GPT-4 обърнаха специално внимание на проблемите със сигурността.

„Прекарахме шест месеца, за да направим GPT-4 по-безопасен и по-последователен. GPT-4 има 82% по-малка вероятност да отговори на искания за забранено съдържание и 40% по-вероятно от GPT-3.5 да предостави действителни отговори“, казва компанията .

Тъй като невронната мрежа беше обучена, разработчиците добавиха сигнали, за да намалят вероятността от даване на опасни съвети. GPT-4 има по-добри граници на сигурност, което трябва да предотврати злонамереното използване на чатбота.

GPT-4 ще се появи не само в ChatGPT Plus

Не всеки ще може да използва GPT-4 чрез чатбот, какъвто беше случаят с неговия предшественик. Езиковият модел ще бъде достъпен в платената версия на чатбота ChatGPT Plus за $20 на месец и като API за разработчици за създаване на приложения и услуги.

На презентацията на GPT-4 разработчиците казаха, че новият AI модел е интегриран в редица проекти извън компанията.

Microsoft потвърди, че неговата интернет търсачка Bing вече работи на GPT-4.

Освен това OpenAI разшири технологията си към други продукти, включително приложението за изучаване на езици Duolingo . В него GPT-4 ще действа като събеседник и обясняващ правилата, когато потребителят направи грешка.

Датският стартъп Be My Eyes , който създава технология за подпомагане на хора със зрителни проблеми, също ще използва GPT-4. Be My Eyes започна разработването на базиран на GPT-4 виртуален доброволец в приложение, което може да генерира същото ниво на контекст и разбиране като човешки доброволец.

Банковият холдинг Morgan Stanley , който управлява капитала, ще използва нов модел от OpenAI за работата на вътрешен чатбот.

Khan Academy, образователна организация с нестопанска цел , каза, че ще използва GPT-4 за захранване на Khanmigo. Това е захранван с изкуствен интелект асистент, който функционира като виртуален преподавател за ученици и асистент за учители.

Правителството на Исландия ще използва GPT-4, за да запази своя език.

Американската технологична компания Stripe , която разработва решения за получаване и обработка на електронни плащания, ще използва възможностите на GPT-4 за оптимизиране на взаимодействието с потребителите и борба с измамите.

Преведено от Мрежата

Стефан К.

"Революционно действие е да казваш истината, във времена на универсална измама" – Джордж Оруел

Schlagwort-Archive: LLM (Chinchilla

GPT-4 е по-голям и по-добър от ChatGPT, но OpenAI не обяснява защо. Какво се знае за новия модел?

Какво може GPT-4

Все още има ограничения

Сигурност

GPT-4 ще се появи не само в ChatGPT Plus