센세이션을 불고 온 ChatGPT
개요
ChatGPT 열풍이 한창이다. 뉴스와 유투브, 친구들과 회사에까지 이 주제로 떠들썩하다. 그도 그럴 것이 구글이나 넷플릭스가 몇 년에 걸쳐 달성한 사용자를 단 몇 개월 만에 이루 냈으며 기능 또한 놀라웠기 때문이다. 질문만 하면 여러 분야에 걸친 방대한 지식을 기가 막히게 찾아서 문장을 생성해 내고 보여줬기 때문이다. 이전에 나온 GPT-2나 Bert 등이 안 좋았다는 건 아니다. 어느 정도 한계가 보여줬던 면들을 혁신적이게 바꿔놓았기 때문이다.
무엇이 가능한가?
정보 검색을 해준다.
구글이나 네이버 등의 포털 사이트에서 검색하듯이 "헬스로 살을 빼려면 어떤 식으로 계획을 세우는 것이 좋을까?" 등 운동 정보 뿐만 아니라 IT, 건강, 정치 등 다양한 부분에서 2021년까지 수집한 정보를 기반으로 답변해준다.
코드를 작성해준다.
Python에서 가장 유능하며 JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL 및 Shell을 포함한 12개 이상의 언어에 능숙하다고 한다. 취업을 위한 LeetCode 코딩 테스트 예제 질문을 하면 완벽하게 풀어줄 뿐만 아니라 시간, 공간 복잡도에서 뛰어난 코딩 능력을 발휘한다.
이메일, 노래 가사 작성해준다.
한계점
아직까지 긴 문장이나 코드에 대해 생성하는 것은 한계가 있다. 문단을 생성해 주더라도 하나의 단락정도의 문단 정도를 생성해 줄 뿐 긴 문단을 뽑아내기는 어렵다.
개발자 대신 코드를 작성해 준다 하더라도 일부의 함수나 리펙토링에 대해서는 높은 수준의 퀄리티를 낼 수 있지만 긴 양의 코드 생성이나 의존성이 있는 코드들에 대해서는 작성에는 아직 사용자가 개입해야 되는 어려움이 있다. 좋은 점은 생산성은 엄청 빨라질 수 있다.
최신 정보의 한계
2021년까지의 수집 데이터를 기반으로 답변을 해주기때문에 최신 정보에는 한계가 있다.
한글 기반의 한계
- 영어 기반이기 때문에 한글로 작성시 영문보다 속도가 느리다.
- 속도가 느리기 때문에 타임아웃이 걸리는 일이 발생한다.
- 국문에 대한 신조어의 정보가 제한되어 있다.
기업에서 어떻게 도입해야 하는가?
chatGPT 같은 모델을 처음부터 만들겠다는건 카카오나 네이버 같은 인프라, 인력 등이 갖추어져 있는 기업이 아니면 무리가 있는 이야기이며 이렇게 갖추어져 있지 않는 환경에서 만들 자고 하는 기업이면 그 오너의 비즈니스를 의심해봐야 한다.
첫 번째로는 chatGPT를 그대로 사용하거나 파인튜닝을 하는 방향으로 생각을 해야 할 것이다. 재무가 어느 정도 튼실하면 모르겠지만 chatGPT도 파인튜닝을 하게 되더라도 엄청난 요금 부과는 각오해야 할 것이다.
두 번째로는 재무적으로 가장 아낄 수 있는 방법은 chatGPT가 아닌 GPT-2 버전이나 경량화 버전을 파인튜닝하는 방향으로 갈 수도 있다. 기업에서 도입을 한다 하더라도 모든 분야에서 사용하지는 않을 것이다. 초기에 인프라 비용이 들겠지만 여러 가지 제약사항도 없을 뿐만 아니라 비용을 아낄 수 있다.