Llama2 Chinese – 号称是目前最好的中文 Llama 大模型

分享到社交媒体

 

Llama2 Chinese – 号称是目前最好的中文 Llama 大模型

https://github.com/FlagAlpha/Llama2-Chinese

?体验地址

https://chinese.llama.family/

?根据介绍,「Llama2-Chinese-13B」是基于 200B 中文语料从头训练的,所以它从模型底层实现了 Llama2 中文能力的优化和提升

并且它的中文训练数据源非常广泛,比如经过筛选地互联网上公开的中文网络数据、中文维基百科、中文悟道开源的 200G 数据等等

?众所周知,Llama2 是目前最强的开源大模型,但是中文预训练数据的比例仅占 0.13% ,所以对中文支持比较不友好。幸运的是因为其是开源的,所以「Llama2-Chinese-13B」应运而生

?如有兴趣,你可以自行对比原版与中文版的差异

Llama2 Chinese – 号称是目前最好的中文 Llama 大模型

 

 

分享到社交媒体