AI Engineer가 되기 위한 Roadmap
AI Engineer가 되기 위한 Roadmap
AI Engineer가 되기 위한 Roadmap
Skills, learning resources, and project ideas to become an AI Engineer in 2024
전제 조건
- python/js 프로그래밍에 대한 중간정도의 이해
- Flask/Rails/Node.js를 통해 2-3개 정도의 적당한 복잡한 수준(블로그앱)의 코딩 개발 경험
- documentation 을 편안히 읽을 수 있는 능력
- IDE(vs code)를 편안히 사용
- 깃헙, 깃 사용 <- 하지만 공부 하면서 자연스레 익힐 수 있음
Roadmap
Beginner
LLM API를 활용한 기본 앱 개발 <- 앱에 적합한 프롬프트 엔지니어링을 고려하며 해보세요!
- LLM의 기본 이해 - ChatGPT이 어떻게 높은 수준으로 작동하는지 알기
- 개발자를 위한 Prompt Engineering 배우기 - LLM의 답변을 향상시키는 프롬프트 작성법
- API에서 데이터(특히 JSON)가 이용되는 방법 배우기
- closed LLM과 open-source LLM의 함수 호출, 프롬프트 전달, 응답 파싱 방법 배우기
- 대화에서 context space를 관리하는 방법 배우기
- 작업을 생성 / 자동화 방법 배우기 - 랭체인 사용
- Gradio나 Streamlit을 이용해서 간단한 POC/demo app 만들어보기
- 접근가능하도록 app을 배포하기 - HuggingFace Space혹은 Streamlit Cloud를 통한 기본 배포 이용
- 멀티 모달 생성 - HuggingFace
transformer
library를 통해 code, 이미지, 음성을 이용
Intermediate
- RAG를 이용해서 컨텍스트 인식을 더 잘하는 앱을 개발
- vector DB에 대해 배우고, 어떻게 동작하는지에 대해 배워보세요
- LLM을 이용한 agent와 tool을 개발하는 것에 대해 배워보세요
- vector 임베딩과 DB에 대해 이해하기
- 나의 app에 vector db 적용하는 법 배우기
- RAG 생성해보기
- 고급 RAG 파이프라인 개발하기 - 여러 데이터 소스를 거친 후 응답을 제공할 수 있도록 하위 질문 쿼리 엔진 구축
- Agent 구축 - 반복적 워크플로우를 통한 큰 작업 수행
- Multi Agent 어플리케이션 구축 - 단일 Agent보다 서로 더 좋은 솔루션을 제공할 수 있는 협력 Agent 구축
- Multi Agent를 통한 자동화 - Autogen, CrewAI
- RAG 평가 - RAGAs framework
- DB관리 , retrieval, 완성된 app 배포, versioning, logging, 모델 행동 monitoring
Advanced
- app개발 마스터 후, 배포/최적화/운영에 대해 배워보세요 => LLMOps
- 사전 학습된 모델을 파인튜닝을 해서 다운스트림 애플리케이션에 효율적이고 저렴한 비용하고 적용하는 방법을 배워보세요
- domain-specific knowledge를 위한 파인튜닝 - 의료연구, 금융연구, 법률분석과 같은 맞춤형 대응(tailored reponses)
- 모델 미세 조정을 위한 dataset 및 엔지니어(ETL 파이프라인) 파이프라인 큐레이션
- 모델 성능에 대한 평가 및 벤치마킹
- LLMOps - 모델 레지스트리, observablity, 자동화 테스트를 통해 완전한 e2e 파이프라인 구축
- 멀티모달 어플리케이션 구축 - 텍스트와 이미지에 대해 하이브리드 시맨틱 검색
- 다른 개발자가 사용 가능한 SDK 패키지 및 맞춤형 솔루션 구축
- AI app 보안 - 프롬프트 해킹과 같은 기술을 통해 취약점과 잠재적 위험을 확인하여 방어조치를 취함
Learning resources, references and projects 📚
위 깃헙에 다양한 리소스와 각 컨셉별 학습을 위한 좋은 프로젝트들이 있으니 참고하세요.
저는 Beginner와 Intermediate 사이 어디쯤엔가 있는 것 같군요.. 제공된 github 자료들을 통해 하나하나 도장깨기 해가며 공부하면 많이 배울 수 있을 것 같아요!