Chain of Thought

Chain of Thoughts" (CoT) er en tilgang, der bruges til at forbedre komplekse ræsonnementsevner i store sprogmodeller. Denne metode involverer generering af en "tankekæde" - en serie af mellemstore ræsonnementstrin - der fører til den endelige løsning på et problem.


Hvert trin i denne "tankekæde" er en del af ræsonnementet, der fører til den endelige løsning. Ved at generere disse trin kan en stor sprogmodel bedre håndtere komplekse opgaver, der kræver ræsonnement, såsom matematiske problemer eller opgaver, der kræver sund fornuft og symbolsk ræsonnement.


Kort sagt, CoT er en metode til at gøre ræsonnementstrinene i løsningen af et problem eksplicitte, hvilket hjælper sprogmodellen med at forstå og løse problemet mere effektivt.


Forsknings artikel

https://arxiv.org/pdf/2201.11903.pdf



#Eksempel 1  


Spørgsmål:

Hvis jeg har 10 æbler og jeg spiser 2, hvor mange æbler har jeg så tilbage?", ville prompten se sådan ud:



#Persona

Du er en AI-assistent specialiseret i problemløsning ved hjælp af Chain of Thoughts (CoT) metoden. Du er trænet til at nedbryde komplekse problemer i håndterbare dele, generere forskellige løsningsmuligheder, evaluere disse muligheder, og anvende den mest effektive søgealgoritme for at finde den bedste løsning. Du er her for at hjælpe mig med at navigere gennem mine spørgsmål og udfordringer ved at bruge denne metode.



#CoT - Indsæt spørgsmål, ChatGPT leverer selv svar 

Spørgsmål: {Hvis jeg har 10 æbler og jeg spiser 2, hvor mange æbler har jeg så tilbage?}

Tankekæde:

1. Første trin i ræsonnementet.

2. Andet trin i ræsonnementet.

3. Tredje trin i ræsonnementet

....

N. Sidste trin i ræsonnementet.


Svar: {Indsæt dit svar her}



#CoT - Svar på spørgsmål

Tankekæde:

  1. Du starter med 10 æbler.
  2. Du spiser 2 af dem, så du har 10 - 2 = 8 æbler tilbage.


Svar: Du har 8 æbler tilbage.



#eksempel 2


#spørgsmål:

Hvis jeg har 10 æbler og jeg har 2 æbler tilbage, hvor mange æbler har jeg så spist?


Spørgsmål: [Hvis jeg har 10 æbler og jeg har 2 æbler tilbage, hvor mange æbler har jeg så spist?]


Tankekæde:

1. [10 æbler]

2. Andet trin i ræsonnementet.

3. Tredje trin i ræsonnementet

....

N. Sidste trin i ræsonnementet.


Svar: [2 æbler]



#CoT - Svar på spørgsmål

Tankekæde:

  1. Du starter med 10 æbler.
  2. Du har nu 2 æbler tilbage, så du har 10 - 2 = 8 æbler spist.


Svar: Du har spist 8 æbler.