gsm8k benchmark

using gsm8k-rft-llama7b-u13b_evaluation

env: lm_evaluation
llama2 7B
image

using GSM8K-eval

llama2 7B

image

llama2 13B

image

posted @ 2024-01-11 08:35  Daze_Lu  阅读(173)  评论(0)    收藏  举报