관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

프롬프트 엔지니어링 테크닉 3 - Chain of Thought 본문

인공지능/프롬프트 엔지니어링 & 생성형 AI

프롬프트 엔지니어링 테크닉 3 - Chain of Thought

huenuri 2024. 12. 20. 09:02

오늘의 공부를 본격적으로 시작해보겠다. 이번에는 Chain of Thought라는 다소 생소한 단원을 배우게 된다.


 

 

 

 

 

이론 3 - Chain of Thought

 

 

복잡한 추론에 대해서 낮은 성능을 보인다. 원래는 9개가 되어야 하는데 답을 제대로 맞추지 못한다. 언어 모델은 왜 이러한 문제를 풀지 못할까?

언어모델은 숫자, 기호에 대한 문제를 잘 이해하지 못한다.

 

 

 

 

 

 

사람이 하는 방식을 따라하자는 의도에서 만들어냈다. 시스템 1은 직관이고, 시스템 2는 이성으로 느리고 복잡한 작업에 대해 논리적으로 해결한다.

 

 

 

 

 

 

멘탈 시뮬레이션은 미리 그려보며 생각하는 것이다. 이러한 과정이 사람이 복잡한 사고를 추론해나가는 요소이다.

 

 

 

 

 

 

Chain of Thought에서는 답변에 중간중간의 풀이 과정을 적어준다. 단계적인 풀이 과정은 언어 모델이 따라갈 수 있는 과정이다. 앞에서 어떻게 풀었는지 되돌아볼 수 있다.

 

 

 

 

 

 

예시로 준 풀이 과정을 따라하면서 답을 도출한다.

 

 

 

 

 

 

 

 

 

 

이렇게 했을 때 언어모델의 정확도가 크게 올라간다.


 

 

 

 

 

 

 

풀이 과정을 서술하기 어려운 문제가 있다.

 

 

 

 

 

 

하나의 문장만 더 추가하여 질문을 던지면 모델이 차근차근 생각하면서 답변을 해나간다. 이러한 과정을 제로샷이라고 한다.

 

 

 

 

 

중간 과정을 서술하도록 했을 때 점수가 많이 높아짐을 볼 수 있다.

 

 

 

 

 

 

결과를 다수결의 원칙에 의해 가장 많이 나온 결과를 사용한다. 풀이 과정을 많이 만든 다음에 적절한 풀이 과정을 선택하는 방식이다.


 

 

 

 

 

퀴즈 5 - 프롬프팅 방식

 

 

 


 

 

 

 

퀴즈 6 - CoT 기법의 특징

 

 

 


 

 

 

 

학습을 마치고

Chain of Thought가 무엇인지 배우는 수업이었다. 언어 모델의 정확도를 향상시키는 가장 좋은 방법이라는 것을 알게 되었다. 나도 ChatGPT에게 어떤 질문을 했을 때 어떨 때는 질문의 의도와는 다른 답변을 해서 화가 날 때도 있었다. 어떤 식으로 접근해야 문제의 정확도를 높일 수 있는지 확실히 배울 수 있었다.

마지막 이론 수업도 이어서 공부해보겠다.