ДТ РАБОТИЛНИЦА

Регистрирайте безплатен акаунт днес, за да станете член! След като влезете, ще можете да участвате в този сайт, като добавяте свои собствени теми и публикации, както и да се свързвате с други членове чрез вашата лична пощенска кутия!

  • Здравейте, майстори на заваряването, кодирането и автомобилните технологии!

    Аз съм Тони Ангелчовски, създател на dtgarage.eu - вашата нова дигитална работилница. С визията за място, където можем да обменяме идеи, да се обучаваме и да растем заедно, dtgarage.eu събира любители и професионалисти от света на заваряването, автомобилите, IT и уеб кодирането.

    В dtgarage.eu, ние сме общност, която е готова да помага и подкрепя всеки свой член. Ние вярваме, че всеки от нас може да допринесе за развитието на тази платформа, независимо дали е професионалист или ентусиаст.

    Само една стъпка ви дели от това да станете част от нашата общност - регистрацията. Регистрирайте се сега и открийте света на dtgarage.eu - мястото, където можем да създаваме и растем заедно.

    Приключението започва тук. Добре дошли в DTGARAGE.EU!

AI Изследване на Berkeley's 🦍 Gorilla Large Language Model: Новата ера на програмирането

Изследване на Berkeley's
🦍
Gorilla Large Language Model: Новата ера на програмирането


gorila1.png


Въведение​

В света на програмирането и изкуствения интелект, един от най-новите играчи на площадката е Gorilla Large Language Model (LLM), създаден от изследователите в UC Berkeley. Този модел е обучен върху три масивни машинни учебни хъбове: Torch Hub, TensorFlow Hub и HuggingFace, което му позволява да предоставя подходящи API извиквания. В тази статия ще разгледаме какво прави Gorilla толкова уникален и как той може да помогне на програмистите да кодират по-ефективно.

Какво е Gorilla Large Language Model?​

Gorilla е голям езиков модел (LLM), който е обучен да превежда английски език в API извиквания. Това означава, че ако въведете заявка на английски език, Gorilla ще върне API извикване (код), което е най-релевантно за вашата заявка. Например, ако попитате "Как да създам приложение, което намира популярни нишки в Reddit?", Gorilla ще върне код, който може да бъде използван за създаване на такова приложение.

Защо Gorilla е по-добър от другите LLM?​

Един от най-големите предизвикателства пред LLM е способността да генерират точни API извиквания без грешки в аргументите. Това е проблем, с който се сблъскват много програмисти, когато използват LLM като ChatGPT. Gorilla е обучен специално да решава този проблем, което го прави изключително надежден. Освен това, Gorilla е обучен да намалява грешките от халюцинации, което означава, че той е по-малко вероятно да генерира неверни или нерелевантни API извиквания.

Как работи Gorilla?​

Gorilla използва техника, наречена "retriever-aware training", където обучаващият набор от даннивключва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация. По време на извод, потребителите предоставят подсказки на естествен език. Gorilla може да работи в два режима: zero-shot и retrieval. В режим zero-shot, подсказката се подава директно на модела Gorilla LLM, който връща препоръчаното API извикване за изпълнение на задачата или целта. В режим на извличане, извличателят (или BM25, или GPT-Index) извлича най-актуалната API документация от API базата данни. Тази документация се конкатенира с потребителската подсказка, заедно със съобщение, указващо справката към API документацията. Конкатенираният вход се подава на Gorilla, който извежда API, което трябва да бъде извикано.

gorila2.png

Как мога да използвам Gorilla?​

Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT. Всъщност, този модел може да бъде добър кандидат за интеграция от мета-модел, така че API извикванията просто ще работят безпроблемно и дори няма да осъзнаете, че използвате Gorilla.

Как се справя Gorilla с предизвикателствата?​

Gorilla се справя с предизвикателствата на API извикванията, които често идват с ограничения, като добавя сложност към разбирането и категоризирането на извикванията от страна на LLM. Например, подсказка може да изисква извикване на модел за класификация на изображения с конкретни ограничения за размер и точност на параметрите. Тези предизвикателства подчертават необходимостта от LLM да разбира не само функционалното описание на API извикване, но и да разсъждава за вградените ограничения.

Какво следва за Gorilla?​

Със своята способност да превежда естествен език в API извиквания и да намалява грешките от халюцинации, Gorilla представлява един от най-интересните подходи в областта на инструментите, подкрепящи LLM. Надяваме се, че ще видим модела разпространен в някои от основните ML хъбове в областта.

Заключение​

Gorilla е мощен инструмент, който може да улесни работата на програмистите, като предоставя точни API извиквания. Той е обучен върху масивни машинни учебни хъбове и е способен да намалява грешките от халюцинации, което го прави изключително надежден. Ако сте програмист или изследовател в областта на LLM, Gorilla е инструмент, който трябва да разгледате.

Често задавани въпроси​

  1. Какво е Gorilla Large Language Model?Gorilla е голям езиков модел, създаден от изследователите в UC Berkeley. Той е обучен върху три масивни машинни учебни хъбове и е способен да предоставя подходящи API извиквания.
  2. Как работи Gorilla?Gorilla използва техника, наречена "retriever-aware training", където обучаващият набор от данни включва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация.
  3. Какво прави Gorilla по-добър от другите LLM?Gorilla се отличава с няколко ключови характеристики, включително способността да генерира точни API извиквания и намаляване на грешките от халюцинации.
  4. Как мога да използвам Gorilla?Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT.
  5. Какво е бъдещето на Gorilla?Gorilla е в началото на своята развойна пътека, но вече показва голям потенциал. Изследователите, които са го създали, продължават да работят върху подобряване на модела и разширяване на неговите възможности.
  6. Как работи Gorilla?Gorilla използва техника, наречена "retriever-aware training", където обучаващият набор от данни включва допълнително поле с извлечена API документация за справка. Тази подход цели да научи LLM да анализира и отговаря на въпроси, базирани на предоставената документация.
  7. Как се справя Gorilla с предизвикателствата?Gorilla се справя с предизвикателствата на API извикванията, които често идват с ограничения, като добавя сложност към разбирането и категоризирането на извикванията от страна на LLM.
  8. Какво следва за Gorilla?Със своята способност да превежда естествен език в API извиквания и да намалява грешките от халюцинации, Gorilla представлява един от най-интересните подходи в областта на инструментите, подкрепящи LLM. Надяваме се, че ще видим модела разпространен в някои от основните ML хъбове в областта.
  9. Как мога да използвам Gorilla?Можете да използвате Gorilla точно както използвате всеки друг LLM. Можете да го интегрирате в мета инструменти като Langchain или Auto-GPT.
  10. Какво е бъдещето на Gorilla?Gorilla е в началото на своята развойна пътека, но вече показва голям потенциал. Изследователите, които са го създали, продължават да работят върху подобряване на модела и разширяване на неговите възможности.
View attachment gorilla_720p.mp4
Моделът и кодът на Gorilla са достъпни на https://github.com/ShishirPatil/gorilla .


Тази статия е написана от Тони Ангелчовски и е публикувана ексклузивно във форума на DT Garage. Всички права са запазени. Забранено е всякакво копиране, разпространение или използване на тази статия без изричното писмено разрешение на автора.

 
Last edited:
Top Bottom