O1-preview는 어떨 때 쓰면 좋을까?
medium 원문: OpenAI 01-Preview — SECRETS 99% of People Don’t Know
o1-preview를 더 잘 활용하기 위해 어떤 동작 원리인지 간단히 알아보자!
o1-preview는 어떻게 동작하는가?
o1은 진짜 새로운 모델인 것은 아니다.
다양한 모델을 합치고, 응답 전 여러번의 반복적인 “system prompt”를 추가한 것이다.
o1은 최종 응답 전 계획하고 실험하도록 설계되어있다.
예시를 보자.
아래의 프롬프트를 날려보자.
Write a coherent paragraph that is exactly 80 words long, and has the word “tomato” as the 4th word, the 19th word, and the 72nd word.
- 4o 응답
The garden was filled with various plants, but the tomato stood out. Its vibrant red color drew attention as the tomato ripened under the summer sun. Every day, the gardener would inspect the tomato vines, ensuring the plants were healthy and thriving. The sweet smell of a ripe tomato is unmistakable, and soon it would be ready for harvest. Eager to taste the tomato, the gardener imagined the flavor it would bring to a fresh salad on the dinner table.
- o1-preview 응답
The red ripe tomato sat on the kitchen counter, glistening under the warm sunlight. Maria picked up the tomato and smiled. She remembered her grandmother’s recipe for soup, a family favorite. Gathering fresh ingredients, she began to cook. The aroma filled the house, bringing back cherished memories. As the soup simmered, she set the table. Soon, her family arrived, eager to taste her creation. They sat together, sharing stories and laughter. Tomato soup warmed their hearts and satisfied their souls.
둘다 단어 수 80개 생성은 성공하였으나, tomato의 위치가 4, 19, 72번째에 위치해야 한다는 것에 대해서 4o는 실패하였고, o1-preview는 성공하였다.
4o를 비롯한 다른 모델들은 프롬프트에 대해 최초로 생성한 답변을 반환하기 때문에 이러한 질문에 답을 하기 어렵다.
o1-preview의 답변 과정
이러한 질문에서 중요한 것은 실험
, 즉 생각하는 방식이 필요하다.
o1-preview는 아래와 같은 과정에 따라 진행한다.
- 먼저 문제를 세분화하고 이 문제를 해결할 계획을 세운다.
- 대략적인 첫 번째 추측을 작성한다.
- 질문을 다시 읽고 수정하거나 조정할 수 있는지 확인한다.
- 응답이 완벽한지 다시 한 번 확인하고, 완벽하면 보여주고, 아니면 계속 조정한다.
- 응답이 100프로 완벽할 때 까지 반복하고, 항상 응답 반환 전에 최종 응답에 대해 더블체크하는 걸 기억한다.
즉, o1-preview는 스스로 내부 대화를 통해 completion(LLM의 답변)에 대한 조정을 반복한다.
o1-preview 최대활용 방법
자신의 질문이 “생각”이 필요한 질문인지 아닌지 구분한다.
대부분의 질문은 모델로부터의 “thinking”이 필요치 않다.
예를 들어 토마토에 대한 재밌는 이야기를 작성해달라는 질문에 대한 응답을 얻는 데에는 o1-preview가 필요 없다. 그 이유는 이러한 질문에는 제약이 거의 없기 때문이다. (기본적으로 개방형 작업이다.)
이야기를 작성하면서 다시 첫 번째 문장으로 돌아가고, 단어의 개수를 셀 필요가 없기 때문이다.
💡포인트!💡
- o1-preview : 실험 없이 한 번에 수행하기 어려운 특정 작업을 요청하는 경우 (정확한 조건이나 반복적 과정을 요구하는 작업)
- 그 외 모델: 개방형 질문을 요청하는 경우
개방형(Open-ended) 작업
- 정해진 제한이나 구체적인 요구사항이 없는, 비교적 자유롭고 유연한 작업
- 일반적인 창의적 콘텐츠 생성, 이야기 작성
그렇기에 o1-preview는 지금까지의 기존 모델들이 잘 하지 못했던 답변들을 할 수도 있다.
o1-preview의 답변을 생성하는 과정을 보면 Agent가 떠오르기도 합니다.
조금 다르긴 하지만 멀티 에이전트, 혹은 단일 에이전트에서 최종 응답 전까지 반복적으로 응답을 생성한다는 것이 비슷하게 느껴집니다.
Agent를 구현하고 사용하는 비용과 o1-preview의 비용 차이가 클까요..?