Publicado : Apr 03, 2024
Apr 2024
Evaluar
Baichuan 2 es parte de una nueva generación de modelos de lenguaje de gran tamaño de código abierto. Fue entrenado en un corpus de alta calidad con 2,6 billones de tokens, logrando un rendimiento bastante bueno para su tamaño tanto en chino como inglés y en comparativas con varios idiomas. Baichuan ha sido entrenado en varios corpus de dominios específicos, incluidos conjuntos de datos legales y de atención médica, por lo que preferimos usarlo en estos campos y sus relacionados.