인스트럭션 튜닝 썸네일형 리스트형 Instruction tuned model과 eos 토큰 인스트럭션 튜닝이 된 모델을 사용하다가 eos 토큰을 어떻게 써야하는지 탐색해보았다.사용한 모델은 CodeLlama-Instruct-7B, Temperature는 0.2, TopP 0.95, Max Tokens 64으로 생성하고, eos토큰 ()가 나오면 생성을 멈추도록 구성했다. 파이썬 문제를 구현하는 MBPP 테스크로 실험했다.싱글턴 실험 (제로샷)CodeLlama-Instruct에 맞는 인스트럭션 템플릿으로 구성하고, 인스트럭션을 가져와서 프롬프트를 만들어봤다.[INST] > Write Python function to complete the task and pass the assertion tests. >Task:These are the assertions for your function:asse.. 더보기 이전 1 다음