일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- html/css
- 중학수학
- 디버깅
- JSP/Servlet
- 중학1-1
- CSS
- 자바스크립트
- 오블완
- 파이썬
- 자바
- 정보처리기사실기
- rnn
- 개발일기
- 데이터베이스
- 순환신경망
- 머신러닝
- 컴퓨터비전
- 자바스크립트심화
- 딥러닝
- JSP
- JDBC
- 컴퓨터구조
- 자바 실습
- 정보처리기사필기
- c언어
- 연습문제
- SQL
- 혼공머신
- 상속
- 데이터분석
- Today
- Total
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
프롬프트 관련 확장 프로그램 1 - 프롬프팅의 한계 본문
2주 차 수업을 시작해 본다. 수업 두 개만 듣고 아침 공부를 마치려고 한다. 1주 차 수업이 많이 어려웠지만 2주 차는 왠지 더 할만할 것 같다.
이론 1 - 프롬프팅의 한계
프롬프팅은 위의 3가지에 근간을 두고 있다.
언어 모델의 규모가 크므로 학습하는데 막대한 비용이 소모된다. 파라미터 70개로 추가되었을 때 원화로 30억원이 넘게 든다. 따라서 데이터가 추가되었다고 할지라도 이를 언어 모델로 새로 만드는 건 쉽지 않다.
최신 지식에 대해 물었을 때는 답변을 할 수 없다고 말하기도 한다.
언어 모델 안에서 텍스트를 나누는 단위를 토큰이라고 한다. 입력 토큰의 수가 2배가 되면 계산 비용이 4배가 된다. 그렇기에 입력 토큰으로 사용할 수 있는 최대수가 제한되어 있다. 사실 15000개의 토큰은 충분한 것은 아니다.
모델별로 다르다.
퀴즈 1 - 프롬프팅의 한계
퀴즈 2 - 언어 모델의 효율성
트랜스포머 모델은 토큰의 길이가 짧아져도 여전히 효율적이다. 그 이유는 인코더와 디코더 레이어 구조에서 위치에 따른 정보를 잘 담기 위해 포지셔널 인코딩을 사용하기 때문이다. 그래서 입력 벡터의 길이에 제한이 없고, 다양한 길이의 문장도 잘 처리할 수 있다.
맞추기는 했으나 자세한 내용은 알지 못해서 헬피에게 물어보았다.
퀴즈 3 - 언어모델의 유연성
학습을 마치고
이론 수업과 퀴즈 문제를 모두 풀어보았다. 수업을 한번 들었더니 퀴즈를 푸는 건 하나도 어렵지 않았다. 이번 시간에는 프롬프팅에는 어떠한 한계점이 있는지 공부해 보았다.
프롬프팅이라는 단어도 생소했는데 조금씩 익숙해지고 있다. 2주 차 수업은 1주 차에 비해 짧아서 비교적 빨리 학습을 마칠 수 있을 것 같다.
'인공지능 > 프롬프트 엔지니어링 & 생성형 AI' 카테고리의 다른 글
프롬프트 관련 확장 프로그램 3 - AIPRM을 활용해 ChatGPT로 홈페이지 만들기 (0) | 2024.12.20 |
---|---|
프롬프트 관련 확장 프로그램 2 - 프롬프트 템플릿 (0) | 2024.12.20 |
프롬프트 엔지니어링 테크닉 8 - ChatGPT와 면접 연습하기 (1) | 2024.12.20 |
프롬프트 엔지니어링 테크닉 7 - ChatGPT로 홈페이지 만들기 (0) | 2024.12.20 |
프롬프트 엔지니어링 테크닉 6 - ChatGPT API 사용해보기 (0) | 2024.12.20 |