Kolejna wersja polskiego chatbota – Bielik v2 została zaprezentowana przez Fundację SpeakLeash oraz Akademickie Centrum Komputerowe Cyfronet AGH.
To polski model z kategorii LLM (Large Language Models), tj. dużych modeli językowych, posiadający 11 miliardów parametrów.
Bielik został opracowany na bazie modelu Mistral-7B i znacząco rozbudowany co czyni go jednym z najpotężniejszych modeli językowych stworzonych w Polsce. Wykorzystuje zaawansowane technologie, takie jak aktywacje SiLU, Grouped Query Attention, Sliding Window Attention, KV-Cache / Rolling Buffer KV oraz Positional Encoding w formie RoPE (Rotary Positioning Encoding).
Nowa wersja dzięki zwiększonemu rozmiarowi pozwala na jeszcze lepsze zrozumienie i generowanie języka polskiego. Ulepszona baza treningowa to większa ilość wysokiej jakości danych co oznacza poprawę wyników w różnorodnych zadaniach. Dostępne są wersje skwantyzowane, umożliwiające efektywne wykorzystanie modelu na różnych platformach sprzętowych.
Chatbot jest dostępny za darmo. Może być wykorzystywany także w komercyjnych zastosowaniach. Jego kod jest otwarty i każdy może go przeanalizować.
Żeby przetestować Bielika v2 oraz sprawdzić wszystkie niezbędne informacje, wystarczy kliknąć w ten link https://bielik.ai/