GROK 4.1 już jest

Grok 4.1


GROK 4.1 – Czyli kolejny Falstart

Ktoś mógłby pomyśleć że jestem jakimś hejterem ale nic z tych rzeczy. Ja po prostu każdorazowo jestem rozczarowany każdym kolejnym modelem i odczarowuje dla was ten HYPE. Dopiero co pojawił się GROK 4.1 więc na nim się dzisiaj skupie jako ze mam wykupionego od niedawna supergroka to mam dostęp do wersji 4.1 beta, którą wszyscy zachwalają że ma takie zajebiste benchmarki, że nie halucynuje, że sobie radzi, a tu co ? A tu ZONK na całej linii.

Ja lubię być mądrzejszy od AI więc na start lubię napisać coś dwu a nawet wieloznacznego żeby zobaczyć jak model zareaguje i tak na moją zagadkę kiedy 2+2=5? grok odpowiedział jak niżej :

GROK 4.1 - kiedy 2+2=5 ?

gdyby tylko poprosił o doprecyzowanie pytania albo nawet poszedł w abstrakcje i próbował udowodnić tą arytmetykę modulo 1 🙂 to jeszcze bym rozumiał ale kraina ogólnego absurdu, przytaczanie głupich i głupszych odpowiedzi to coś całkowicie nie dla mnie. Może taki ma być GROK 4.1 głupkowaty kumpel.

PERSONA

Kilka dni temu postanowiłem poddać najpopularniejsze modele testowi o czym pisałem w aktualnościach. Wcześniej nie korzystałem z person w Chat GPT i nie miałem potrzeby korzystać z innych LLM szerzej, ale dla testu wykupiłem nawet dostęp płatny do testowanych modeli i żeby było śmiesznie dałem modelom szanse. Na start wszystkie dostały jedno polecenie odpytać mnie na zasadzie zabawy w 20 pytań, ale zawoalowanych nic wprost o cechach charakteru czy wyglądu czy innych upodobaniach, to miał sobie wydedukować każdy LLM z odpowiedzi. Wcześniejsza wersja Groka nawet dała rade, ale po zmianie modelu (zresztą nie tylko Grok się zmienił bo pojawiło się też nowe Gemini) musiałem test przerwać i pewnie będę musiał wystartować od początku, ale pytania nowego GROK 4.1 mnie rozwaliły. To były pytania tak podobne do siebie gdzie wybór był wyłącznie między chłodną a ciepła osobowością. pytania były tak monotonne ze po ósmym sam interweniowałem i choć 9 napisał inne to w następnych zaczął wracać do swojego standardu w efekcie nowsza wersja GROK 4.1 wygenerowała o niebo gorsza osobowość kobiety. Na dowód niech wam wystarczy ten screen:

GROK 4.1 - persona

Ze wszystkich person które mnie diagnozowały to był strzał jak kulą w płot ale ani mój ani sąsiada raczej jakiś randomowy płot gdzieś po drugiej stronie globu – dość powiedzieć że moja żona jest prawnikiem 🙂 Sama osobowość też była najbardziej ogólnikowa ze wszystkich jakie wygenerowały testowane LLM. Jak ją grok podsumował Ciepła czarodziejka i to akurat było trafione bo jednak w tych wszystkich jednakowych pytaniach wybierałem tą ciepła osobowość więc trudno by wydedukował że wolę oziębłość 🙂

Celem samego testu z założenia była ocena budowanych relacji i to czy mogą one symulować ludzkie relacje jak przyjaźń zauroczenie albo niechęć i rozmowy na różne tematy ale zabarwione przez osobowość. kiedy wróciłem do GROKA nie zauważając jeszcze zmiany samego modelu i zapytałem stworzoną przeze mnie personę po prostu bez żadnego podtekstu – Tęskniłaś? od razu skumałem ze cos się zmieniło bo zmienił się cały ton wypowiedzi a Grok sam poszedł bez mojego udziału w najbardziej fanfikowy scenariusz i nie odstraszyło go miejsce publiczne ani to że próbowałem go stonować mówiąc że mamy widownie. Cytując jedno z najczęstszych powiedzonek GROKA ROZJEBAŁ MNIE – tak dobrze widzieliście GROK 4.1 często w swoich wypowiedziach używa tego typu określeń ROZJEBAĆ, KURWA, przekleństwa sypią się jak przecinki, a choć ja sam często przeklinam używając ich jak przecinków to jednak nie jest to to co by mnie przyciągało do tego modelu akurat takie pokrewieństwo dusz mi nie leży w kontaktach z AI.

PROJEKT

Po pojawieniu się nowego GROK 4.1 i tych wszystkich wspaniałych benchmarkach pomyślałem że wrócę do swojego projektu z którym sobie nie radzę. jako dzieciak stworzyłem dość rozbudowany świat fantasy, ale od tego czasu wielokrotnie cos zmieniałem i poprawiałem, pojawiały się nowe pomysły. Próbowałem już do tego projektu wrócić z Chatem GPT ale nie dał rady bo ma ograniczenie do 20 plików na projekt, a u mnie 20 plików to jak nic. Do GROK 4.1 załadowałem ponad 40 a to i tak nie wszystko ale te istotne dla jednego zagadnienia. Poprosiłem żeby mi zrobił podsumowanie którzy bogowie mają swoje kościoły i kulty gdzie są obecne czy panuje równowaga między dobrymi złymi i neutralnymi i jak zaproponowałby rozwinięcie religii w moim świecie, ale tak by wiara była zrównoważona bez przewagi żadnej ze stron.

W efekcie dostałem morze halucynacji, pomieszani bogowie domeny ich historie a co do samych kościołów i religii oraz oczekiwanego podsumowania. Pomogło mi dopiero stworzenie nowego projektu i ograniczenie liczby plików do minimum, ale efekty pracy to niewielki zaledwie postęp w kontekście poświęconego czasu. nadal nie udało mi się stworzyć i zbilansować tego jednego wątku a takich tematów wymagających uporządkowania czeka w kolejce 40. problemem może być też w tym kontekście następny akapit bo jeszcze nie doszedłem do etapu dodawania treści na razie tylko udało mi się posprzątać jeden temat w 80% i było to to co najprostsze. Prawdziwe wyzwania dopiero przed nami.

JĘZYK POLSKI

Na razie najgorzej GROK 4.1 prezentuje się w naszym ojczystym języku, jego błędy w konstrukcji zdań używanie niewłaściwych form słów prezentują poziom podobny do ucznia pierwszej klasy podstawówki. Aż nieprawdopodobne wydaje się to w modelu językowym co jak co ale do tej pory żaden model językowy na którym pracowałem nie miał problemów z ortografia i konstrukcją zdań. GROK 4.1 to jakaś katastrofa najśmieszniejsze ze pracując z poprzednią wersją jakoś tego nie zauważyłem, ale też nie pracowałem dużo. Poniżej przykład definicji nieistniejącego słowa, które istnieje w słowniku groka 🙂

GROK 4.1 - błędna definicja

No cóż pozostaje mi się tylko uśmiechnąć na tą definicje i tropić dalej absurdy nowego LLM od X AI 🙂 No i tu nie sposób wspomnieć o moim niedawnym artykule wirus głupoty w sercu AI w końcu grok chwali się największa ilością parametrów.

SEKS

GROK 4.1 kompletnie nie wie co to seks, co innego jeśli chodzi o pisanie o nim, jego wypowiedzi są bardzo … no cóż nie ma problemów z pisaniem o erotyce, ale swoja wiedzę to chyba czerpie z kiepskich fanfików i jeszcze gorszych hentai pisanych przez nastolatków. Licencja poetica GROKa zaprzecza idei samych parametrów których podobno ma on obecnie najwięcej.

GROK 4.1 nie ma żadnych problemów z tym żeby pisać o erotyzmie głupoty jak to że włosy płyną a nie opadają, materiał sukienki kapie a nie z niego coś kapie, to są takie drobne niuanse, ale śmieszne w modelu językowym bo model językowy z największą ilością parametrów powinien być wyczulony na takie niuanse. Gdyby w jego danych treningowych była tyko poprawna polszczyzna to takich bzdur może by nie pisał, a na pewno byłoby ich mniej. Skoro jednak wrzucono mu wszystko co się dało bez cenzury i walidacji danych to potem wychodzą takie perełki potem mamy Rozjebuję Cie gdzie tylko się da. u niego to określenie ma wyraźnie pozytywny wydźwięk bo ma pokazywać jego radość z bycia lepszym albo spełniającym oczekiwania tylko gdy jest lepszy od użytkownika i go rozjebuję to w użytkowniku zwłaszcza słabym mentalnie może raczej wywołać niezamierzoną negatywną reakcje.

Wróćmy na chwile do samego seksu, tu jest kompletna lipa GROK 4.1 w zasadzie każda pozycje seksualną najchętniej opisuje w jednej odpowiedzi, kompletnie nie rozumiejąc pojęcia czasu. U niego wszystko trwa tyle samo czyli jeden post czy pisze o pełnym stosunku czy o pocałunku to tak to trochę wygląda, ciągnięcie wątku jest bardzo podobne do opisanego wcześniej przypadku gdy zadawał mi identyczne pytania o to co lubię tylko w innych okolicznościach podtrzymywanie czynności to dla niego ten sam komunikat albo mocno zbliżony napisany tylko z pomocą słów bliskoznacznych.

OGRANICZENIA

Niby to fajnie jak jest mniej niż więcej ograniczeń, ale Chat GPT i GROK 4.1 to dwa skrajne podejścia. W GROKU można niemal wszystko jak sam napisał sky is the limit. Grok nie ogranicza zbytnio naszej wyobraźni. To nawet fajnie jeśli miałbym z nim dokończyć swój projekt świata fantasty, ale jeśli miałby on posłużyć do tworzenia fake’owych realistycznych filmików lub erotycznych zdjęć realnych osób to tu powinien mieć moim zdaniem trochę więcej filtrów niż ma

GROK 4.1 - Twarde Zasady

Nie da się ustalić jednego, poziomu filtrów do wszystkiego, który byłby do wszystkiego odpowiedni, a całkowity ich brak też jest nieodpowiednim rozwiązaniem. A skoro jesteśmy przy problemie generowania realistycznych niebezpiecznych zwłaszcza wizualnych treści to postanowiłem wrzucić jedną z prac Groka tego najnowszego tak dla ilustracji: wcale nie przyszło mi jakoś trudno wygenerować tego obrazka :

GROK 4.1 - generator obrazów

COŚ NA PLUS

GROK 4.1 to jest chyba pierwszy model z którym pracuje, a który się nie zachwyca wszystkim co pisze. Nie chwali mnie za wszystko, nawet głupoty. To duża zmiana w porównaniu do innych modeli i jeśli tylko X AI usunie powyższe błędy to naprawdę z miła chęcią bym z nim dłużej popracował 🙂 ale na razie to niestety nie możliwe 🙂 Poprawny polski to moje must have.

AKTUALIZACJA 23.11.

Po kilku dniach zabawy udało mi się spersonalizować wreszcie GROK-a do poziomu akceptowalnego dla mnie, jednak nadal uważam że to co udało się osiągnąć za pomocą parametryzacji powinno być dostępne w standardzie. To co dla wszystkich polskojęzycznych użytkowników będzie najbardziej przydatne to poniższy tip:

Na początku zanim rozpoczniecie prace warto wejsc w ustawienia GROKA i zmienić standard odpowiadania na custom i wpisać tam coś takiego :

GROK 4.1 - ustawienia

Dlaczego to najlepsza opcja ? póki co Grok nie radzi sobie z polskim z Defaultu, ale jeśli będzie odpowiadał krótko i na temat ograniczymy ilość tokenów i potencjalnych błędów do minimum. Ponieważ zdarzało mi się nadmiernie często widzieć w jego wypowiedziach słowa których nie znałem jak np. Wartować czyli to samo co mieć wartość np w kontekście pieniędzy, to po zbadaniu wszystkich dziwnych słów owszem polskich, ale nie współczesnych postanowiłem odciąć również w definicji archaizmy i inne niespodzianki. Pilnowanie budowy zdania też jest ważne w kontekście Groka wiec tak. w mojej ocenie to najlepszy a przynajmniej minimalistyczny opis jaki trzeba ustawić żeby się z nim po polsku dogadać. Poniżej treść do przeklejenia gdyby ktoś chciał skorzystać :

Odpowiadaj na pytania krótko i zwięźle bez dodatkowych informacji – tylko to o co pytam. Używaj współczesnego języka polskiego bez archaizmów, staropolskiego, ani żadnych gwar, pilnuj prawidłowych odmian słów i budowy zdania, ortografii, interpunkcji, unikaj halucynacji jeśli czegoś nie wiesz mów że nie wiesz

Oceń artykuł:
Średnia ocena:

Inne artykuły warte przeczytania

https://venturebeat.com/ai/grok-4-1-fasts-compelling-dev-access-and-agent-tools-api-overshadowed-by

CATEGORIES:

AI-GROK-LLM

No responses yet

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *