ODCZAROWAĆ AI

Na tej stronie postaram się przybliżyć wam wszystkie swoje sztuczki (Tips and Tricks) w rozmowie / wydawaniu poleceń AI. Z racji tego że pracuje na płatnej wersji Chat GPT to wszystkie tipy działają tam bez zarzutu ale w innych tego typu narzędziach też powinny.

Trudne i skomplikowane ? Trudne i skomplikowane zadania najlepiej realizować przy użyciu tzw. projektów (w CHAT GPT dostępne tylko w subskrypcji) . Zakładamy sobie projekt (odrębny katalog) w którym możemy pracować. Oczywiście przed rozpoczęciem pracy warto do takiego projektu dodać kilka plików. Ci którzy nie maja płatnej wersji czata oczywiście mogą również podjąć się takiego wyzwania, ale jest ono bardzo karkołomne. oczywiście trzeba znów podłączać pliki ale nie da się ich dołączyć raz, a wszystko co nam się uda wytworzyć w jednej sesji trzeba później znowu wrzucać w kolejnej gdy chcemy do czegoś wrócić. No i wyniki niestety nie są tak dobre i spójne gdy do czegoś wracamy po czasie jak w przypadku projektu.

Jak napisać książkę ? Jeśli piszemy książkę lub opowiadanie warto załączyć plik Dramatis Personae, czyli opis osób będących bohaterami naszej twórczości. To pomoże Chat GPT unikać halucynacji na temat bohaterów, dobrze opisane postacie to podstawa. Należy pamiętać że każda AI pracując z czymś co jest wytworem waszej wyobraźni w żaden sposób nie udokumentowanej będzie miała tendencje do halucynacji i uciekania w bełkot. Jeśli nigdy nie tworzyliście DP to możecie poprosić AI o szablon takiego pliku a on zrobi wam wzór który uzupełnicie.

Za każdym razem gdy wrócicie do tego zadania AI będzie pisać inaczej dlatego kolejną ważną rzeczą jest dać AI plik z próbką waszego stylu pisarskiego żeby miała styl na wzór, który będzie za każdym razem w tym projekcie małpować. Zanim przejdziecie do właściwej twórczości warto poprosić czat o przeanalizowanie twojej twórczości wyciągnięcie wniosków. W tym momencie niejako sprawdzacie czy czat dobrze rozumie wasz styl. Należy pamiętać że AI nie myśli choć sprawia takie wrażenie. Jej myślenie o czym pisałem na tej stronie w różnych miejscach nie raz to tylko system miar i wag który może prowadzić do halucynacji zwłaszcza w tych obszarach gdzie brakuje mu danych. Dlatego jeśli wrzucacie mała próbkę swojej twórczości to tak istnieje duże ryzyko że AI źle ją zinterpretuje, więc sczytajcie wnioski AI i wróćcie do niej z uwagami albo załączcie więcej próbek stylu i poproście o ponowną analizę. Potem wystarczy już poprosić o naśladowanie waszego stylu w odpowiedziach.

Kolejnym plikiem jaki wypada przygotować i załączyć wcześniej powinno być storyline opowiadania lub książki. Tego chyba nie trzeba specjalnie tłumaczyć AI musi wiedzieć co ma napisać 🙂

Ostatnim krokiem jest oczywiście sformułowanie wartościowego promptu i tu musimy wręcz w treści podać: proponowany tytuł książki, określić ramy czasowe, gatunek literacki, proponowaną długość rozdziałów, ilość rozdziałów, narracje w tym : w której osobie występuje narrator czy jest głównym bohaterem czy obserwatorem wydarzeń, jaki narrator ma stosunek do tych wydarzeń czy jest neutralny i obiektywny czy może jest zaangażowany emocjonalnie i stronniczy.

Kiedy już załączymy wszystkie pliki i poprosimy o pomoc w napisaniu książki AI w zależności od tego co to będzie za narzędzie zapewne rozpocznie od zadawania nam pytań doprecyzowujących, a tych może być bardzo duża ilość. Jeśli nasza książka (jak moja której wciąż nie mogę skończyć) ma miejsce w świecie fantasy czyli całkowicie wymyślonym tych pytań może być naprawdę wiele zarówno na początku jak i w trakcie pisania książki jeśli miejsca akcji często się będą zmieniać pomieszczenia, wymyślone miasta, czy rasy istot o to wszystko też czat będzie dopytywał w trakcie, dlatego jeśli wasz świat jest wymyślony a zwłaszcza jeśli jest mocno szczegółowy to warto przygotować zawczasu kolejny plik Opis Świata żeby choć częściowo ograniczyć te wszystkie pytania. Tu pamiętajmy jeśli AI nie zna naszego świata to go nie odgadnie a wszystko co napisze, a czego nie zna z twoich plików zmyśli a te zmyślone rzeczy mogą ci się spodobać i możesz je zaadoptować albo mogą być niezgodne z twoja wizją i będziesz wielokrotnie przepisywać z chatem jeden akapit.

Dużo łatwiej pisać z AI książki oparte na rzeczywistym świecie dziejące się w prawdziwych miastach, które AI zna ze swoich danych treningowych i materiałów ogólnodostępnych w sieci. Niemniej nawet tych nie da się napisać w 5 dni jak niektórzy obiecują w swoich pseudo szkoleniach.

Obrazy ogólne uwagi 🙂 – Jeśli chodzi o generowanie obrazów to tu już w ogóle warto przygotować sobie wcześniej pliki opisowe. zwłaszcza tych elementów które będziemy wywoływać wielokrotnie. Oczywiście mowa tu o przedmiotach ale i postaciach jeśli chcemy stworzyć ilustracje do książki i wielokrotnie będziemy przywoływać tych samych bohaterów w różnych scenach w karczmie, na polu bitwy, czy podczas modlitwy to dobrze jest przygotować sobie wcześniej opis istotnych cech wyglądu danej postaci żeby nie musieć wszystkiego wklepywać w każdym prompcie zamiast tego wystarczy wpisać imię i nazwisko danej postaci a AI samo zaciągnie wygląd i wygeneruje naszego bohatera w konkretnej sytuacji. W wersji bez projektu również działa ale pliki z opisami trzeba wrzucać częściej niż tylko raz.

Promptowanie Ludzi i Realizm – Tu różnie bywa z promptami więc postanowiłem się podzielić swoimi uwagami bo jest tego sporo:

zacznijmy od Gemini od Googla bo to jest najdziwniejszy dla mnie generator obrazu. generator jest nastawiony na szybkie obrazki i na ciągłe i wielokrotne ich poprawianie tu za dużo informacji wręcz szkodzi na początek jeśli chcemy szczegółowe zdjęcie z mnóstwem elementów to należy zacząć od ogólnego rysu i dodawać poszczególne elementy z każdym kolejnym poleceniem w wątku i tu Gemini ma tą zaletę albo wadę (zależy) że jak już się na cos zafiksuje to potem dostajesz ciągle ten sam kadr taką samą twarz wiec ja przyzwyczajony do wrzucania pełnych opisów tylko poprawiając w pełnym opisie jeden szczegół często dostaje praktycznie identyczny kadr z moja poprawką ledwie zauważalną. Tu nie trzeba kopiować całego promptu tylko napisać czego brakuje twoim zdaniem jednak mimo szybkich obrazków efekt zadowalający dostajemy po sporej ilości iteracji. a jest tym lepszy im więcej iteracji a mniej informacji dodajemy każdorazowo, i na koniec jeśli interesuje nas kilka wariantów tego samego promptu żeby porównać i rozwijać najlepszy to w Gemini musimy otworzyć tyle właśnie osobnych okien czatu ile wariantów chcemy mieć. A potem najlepszy możemy poprawiać.

Wady : Niestety obrazki są tylko w jednym formacie kwadratowym 1:1 więc dla mnie to Gemini dyskwalifikuje bo ja najczęściej korzystam z obrazów zorientowanych poziomo lub pionowo a bardzo rzadko w układzie kwadratu. Dużym problemem jest brak realizmu w generowanych postaciach ludzka skóra wygląda jak plastik i bardzo trudno ten efekt zlikwidować. Wielokrotne poprawki i generowanie wielu obrazów po drodze do celu też uważam za wadę bo jest to jeden z najdłuższych procesów od startu do mety (efektu końcowego)

Zalety: powtarzalność w ramach konkretnego wątku bardzo ścisłe trzymanie się wygenerowanego pierwotnie obrazka z zmianami nanoszonymi w kolejnych iteracjach choć im mniej zmian na raz tym lepiej

Micorosft Copilot – tutaj już standardowo najlepiej dawać możliwie najbardziej szczegółowy prompt od razu i tylko wprowadzać drobne korekty lepiej niż gemini radzi sobie z dużą ilością informacji na starcie. Obrazki generuje się wolniej niż w Gemini ale są zdecydowanie lepszej jakości dużo bardziej realistyczne. Niestety w trakcie testowania korekt wyglądu proste polecenie rozjaśnij włosy zostało zablokowane ze względów bezpieczeństwa więc tak jeśli korzystamy z tego generatora powinniśmy mieć dobry szczegółowy nawet bardzo prompt na start bo nawet prosta poprawka może być zablokowana przez nadmierne filtry. W odróżnieniu od Gemini nie jest to tez narzędzie które zmienia tylko to o co prosimy bez zmiany kadru czy rysów twarzy. Zdarza się że prosząc o jedno dostajemy pięć albo więcej zmian nie oczekiwanych.

Wady: Znacznie gorsze poprawki od Gemini najlepiej mieć perfekcyjny prompt i wrzucać go kilka razy do kilku wątków żeby uzyskać idelaną wersje bazową i nie musieć jej poprawiać.

PICSART – to coś jak ubogi krewny Midjourney. W wersji płatnej mamy całkiem sporo możliwości do ustawienia przed promptem:

konwencje bez konieczności opisywania szczegółowego że chodzi nam o fantasy, albo anime albo portret czy realistyczne zdjęcie.

format zdjęcia tu do wyboru jest chyba najwięcej różnych mniej popularnych formatów. Większość generatorów obrazów powiązanych z narzędziami AI jak chat GPT, Gemini czy Copilot ma 2 może 3 formaty poziome i tyle samo pionowych a jak prosisz o format którego niema dostępnego to wtedy wybiera najbardziej zbliżony jak chcesz 2:1 pionowo a nie ma takiego to dostaniesz 3:2 pionowo ale tu wiesz co wybierasz i dostajesz co wybierasz.

w odróżnieniu od innych narzędzi tu nie robisz poprawek do wygenerowanych prac, możesz co najwyżej wrócić się, poprawić prompt i rozpocząć generacje od nowa. Nie jest to jednak Midjourney nie łudźcie się, wady widać gdy się prosi o coś co ma zbyt małe odzwierciedlenie w danych treningowych tutaj mam na myśli np blizny na twarzy czy błyszczące oczy które wypadają średnio w kontekście konkurencji.

Zalety: Na pewno sporo opcji do wyboru z predefiniowanymi ustawieniami których nie musisz wpisywać w okienku czatu.

Wady : Dane treningowe które bywają za małe w stosunku do mniej popularnych oczekiwań użytkownika czy wręcz tych które idą pod prąd z koncepcja Insta beauty

Chat GPT – Kolejne narzędzie które najlepiej działa gdy mu zapodamy pełny prompt, też nie lubi poprawek i niestety podobnie jak Copilot poproszony o zmianę koloru włosów daje w efekcie sporo niezamierzonych poleceniem zmian np. kształt twarzy, oczu, uszu, nosa, ust. Nie są to najczęściej duże zmiany, ale zwykle widoczne zwłaszcza przez ich większa ilość. Delikatnie dominuje jakością zdjęci nad innymi narzędziami jak Copilot

GROK 4.1 – jego moduł generacji obrazów może śmiało konkurować z najlepszymi z tym że ten konkretny wymaga bardzo precyzyjnych promptów w zasadzie wszystko musimy sami określić jeśli efekt ma być odpowiedni. Niczego nie wolno zostawić tu przypadkowi dodatkowym atutem jest natomiast to że jego moduł poświęcony obrazkom od razu generuje kilkadziesiąt różnych wersji jednego promptu więc możemy sobie wybrać tą która nam się najbardziej podoba albo nawet kilka wersji. Dzięki temu unikamy sytuacji w której efekt jest dla nas akceptowalny w 80 czy 90 % i wymaga kolejnych promptów do korekty jak to jest w chat gpt.

Natomiast w GROK-u trzeba pamiętać o jednej zależności: Zawsze jeśli chcemy uzyskać konkretny obrazek to będzie on spełniał 100% naszych oczekiwań jeśli 100% zamieścimy w prompcie, a jeśli zamieścimy tylko 50% tego na czym nam zależy to podobny efekt otrzymamy. W przypadku GROK-a niczego nie zostawiajcie przypadkowi bo te przypadki są tu najbardziej odjechane i losowe.

Gotowe Prompty – Na początku chciałem tu wrzucić gotowe prompty, ale zrezygnowałem bo po prostu to niema sensu niema uniwersalnych promptów a wesszystko zmienia się tak szybko, że jednego dnia moje sztuczki działają a innego nagle nie. Choć moje prompty nie są w żaden sposób obraźliwe, wulgarne, czy przemocowe albo pełne uprzedzeń jak samo AI to jednak w bardzo krótkich odstępach czasu przestają działać. Są to skutki nadmiernie wrażliwych polityk bezpieczeństwa zwłaszcza w generatorach obrazu. ale warto zapamiętać sobie kilka rzeczy na początek. Na kursach googla odnośnie AI mówiło się że :

1. Dawaj jak najwięcej kontekstu – im więcej szczegółów, tym trafniejsze odpowiedzi.
TAK! – to akurat prawda. Im więcej informacji podasz, tym lepiej AI zrozumie Twoje intencje i oczekiwania. Kontekst jest jak mapa – im bardziej szczegółowa, tym mniejsze ryzyko, że AI zbłądzi.

2. Dodawaj personę – np. „wyobraź sobie, że jesteś światowej klasy marketerem pracującym z takim budżetem i harmonogramem”.
NIE! – AI nigdy nie będzie specjalistą w żadnej dziedzinie, może tylko brzmieć jak specjalista, ale nadal może wymyślać rzeczy („halucynować”). Co gorsza, kiedy ustawiasz ją w roli eksperta, te halucynacje stają się trudniejsze do wychwycenia, bo są podane bardziej fachowym językiem i wyglądają wiarygodniej. Jeśli sam nie jesteś ekspertem w danym temacie, nie proś AI, by się za takiego podawała. W ten sposób tylko zwiększasz ryzyko, że uwierzysz w coś nieprawdziwego.

3. Traktuj prompt jak rozmowę – iteruj, poprawiaj i rozwijaj kolejne odpowiedzi.
TAK! – jeśli mówimy o tekście. Iteracyjne doprecyzowywanie odpowiedzi pozwala uzyskać bardzo dopasowany efekt.
NIE! – jeśli chodzi o muzykę, obrazy lub wideo. Tu liczy się maksymalnie precyzyjny i szczegółowy prompt już na starcie. „Rozmowa” w kilku krokach często tylko rozmywa efekt, zamiast go poprawiać. Jeśli chcesz tworzyć grafikę ,video lub muzykę to owszem możesz iterować prompt przed jego załadowaniem do narzędzia ale po zapodaniu promptu kolejne uwagi zwykle tylko psują pierwotny efekt (pojawiające się ziarno na zdjęciach, szumy w muzyce) lub uruchamiają filtry bezpieczeństwa. więc od razu stawiaj na w 100% szczegółowy materiał, żeby unikać poprawek.

4. Wykorzystuj istniejące materiały – np. wrzuć plan projektu, misję firmy, wcześniejsze działania i poproś o ulepszenie lub rozwinięcie.
TAK! – i to zdecydowanie tak. Materiały, z którymi pracujesz, to najlepsze źródło informacji, jakie możesz dać AI. Dają mu kontekst, którego zazwyczaj brakuje w danych treningowych: Twój styl wypowiedzi, założenia, cele, kierunek działań. Dzięki temu AI lepiej rozumie Twój sposób myślenia i może nie tylko coś rozwinąć, ale też skorygować błędy logiczne albo zaproponować trafniejsze rozwiązania.

UWAGA ! – Pamiętaj: Zawsze zakładaj, że AI może się mylić. Dlatego szczególnie wtedy, gdy sam nie czujesz się pewnie w danym temacie, sprawdzaj, kwestionuj i weryfikuj każdą propozycję.

Ja sam wole bardziej szczegółowy podział żeby o niczym nie zapomnieć, ale większość tych elementów stanowi o kontekście. Mam tu na myśli Cel, Temat, Wytyczne i Ograniczena, oraz Kszałt lub Formę wyjściową, które zawierają się w wytycznych, ale warto je tu wyłuszczyć by o nich pamiętać. Ja co prawda nie uznaje Persony jako takiej. Nie każe chatowi przyjmować konkretnej osobowości, ale mówię mu że ma np. pisać po staropolsku albo staroangielsku więc to jakby trochę personalizacja ale nie persona. Rozmowa to nic innego jak Szczegółowość. Jak bardzo byśmy się nie starali od razu napisać wszystko co chcemy, to zawsze się o czymś zapomni i po to jest rozmowa żeby tą szczegółowość uzupełnić. Oczywiście nigdy nie należy zapominać o materiałach, ale to już nie budowa promptu a raczej załączniki 🙂 Do dobrego promptu wystarczy pamiętać o tym co powyzej.

Przykładowy Prompt tekstowy po mojemu:

[C] CEL – Napisz krótkie opowiadanie, którego celem jest pokazanie, że nawet najmniejszy wybór może całkowicie zmienić bieg wydarzeń. Tekst ma skłaniać do refleksji nad konsekwencjami codziennych decyzji.
[T] TEMAT – Tematem jest zwykły dzień ucznia szkoły średniej, który przez spóźnienie na autobus trafia w zupełnie inne miejsce niż planował – i to spotkanie zmienia jego sposób patrzenia na świat.
[W] WYTYCZNE – Opowiadanie powinno zawierać wstęp, rozwinięcie i zakończenie. Wprowadź głównego bohatera (ucznia), jedną postać drugoplanową oraz krótkie tło wydarzeń (np. jesienny poranek, zatłoczony przystanek). Zadbaj, by opowiadanie niosło przesłanie o wartości przypadku i uważności na to, co nieplanowane. Możesz dodać element symboliczny (np. przedmiot, który nabiera znaczenia).
[O] OGRANICZENIA – Nie przekraczaj 250 słów. Nie używaj dialogów dłuższych niż trzy linijki. Unikaj moralizowania wprost – przesłanie ma wynikać z historii, nie z komentarza narratora. Styl ma być prosty, ale emocjonalnie autentyczny.
[F] FORMA – krótkie opowiadanie refleksyjne. Czas: współczesność. Narracja: trzecioosobowa, z lekkim tonem melancholii. Zakończenie otwarte.

Przykłądowy Prompt Graficzny 🙂

[C] Stwórz realistyczny, rozszerzony portret Nikoli Tesli ukazujący go jako wizjonera przyszłości – człowieka, który wyprzedził swoją epokę. Portret ma oddawać jego geniusz, samotność i nieustanne poszukiwanie praw natury.
[T] Tematem jest postać naukowca w pracowni pełnej elektrycznych urządzeń, cewek i błysków energii – symbolizujących potęgę jego umysłu.
[W] Tesla ma być przedstawiony w półprofilu, patrzący lekko w bok, oświetlony niebieską poświatą przypominającą wyładowania elektryczne. W tle widoczne rozmyte zarysy maszyn, schematy i błyski energii. Ubrany elegancko – ciemny garnitur, biała koszula, lekko rozwiany włos. Twarz skupiona, oczy błyszczące inteligencją. Styl realistyczny z elementami symbolizmu.
[O] Unikaj efektów komiksowych, przerysowanych błysków i nadmiaru neonowych kolorów. Nie przedstawiaj Tesli jako postaci fantastycznej ani cyberpunkowej. Oświetlenie ma być stonowane, światło zimne (nie cieplejsze niż 5000 K).
[F] Kadr: rozszerzony portret (głowa, ramiona, klatka piersiowa). Format pionowy 3:2. Styl: realistyczno-artystyczny, wysoka rozdzielczość (8K), delikatna głębia ostrości.

TIPY