面壁智能开源Eurux-8x22B大模型,专注提升推理能力
北京,2024年5月4日 —— 面壁智能近日宣布开源其最新研发的Eurux-8x22B大模型,该模型包括Eurux-8x22B-NCA与Eurux-8x22B-KTO两个版本,主打推理能力。这一举措旨在推动AI技术的发展,增强技术的透明度与可访问性,为全球开发者社区提供重要的技术资源。
Eurux-8x22B模型拥有39B的激活参数,支持64k上下文,由Mixtral-8x22B模型对齐而来,并在UltraInteract对齐数据集上进行训练。UltraInteract是一个专为提升大模型推理能力而设计的大规模、高质量的数据集,包含86K条指令和220K偏好对,覆盖数学、代码和逻辑推理问题,共有约五十万条数据。
面壁智能成立于2022年,是一家专注于人工智能大模型技术创新与应用落地的企业。2023年4月,公司完成了由知乎领投的数千万元天使轮融资,清华系的智谱AI参与跟投。2024年2月,面壁智能推出了开源端侧模型MiniCPM,标志着其“大模型+Agent(智能体)”双引擎战略的关键一步。同年4月,面壁智能完成了新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资将主要用于人才引入、大模型底层算力与数据基础构建,以及大模型落地等方面。
开源Eurux-8x22B大模型的发布,不仅体现了面壁智能在AI领域的技术实力,也展示了其推动行业发展和生态建设的决心。这一行动有望促进高级AI技术的进一步开发与测试,加速AI技术在各行各业的应用落地。
主要技术元素:
Eurux-8x22B大模型:由面壁智能开发,主打推理能力。
激活参数39B:支持64k上下文,基于Mixtral-8x22B模型对齐。
UltraInteract数据集:专门设计用于提升大模型推理能力的大规模对齐数据集。
开源模型:增强技术透明度与可访问性,提供技术资源。
面壁智能:专注于人工智能大模型技术创新与应用落地。
MiniCPM模型:面壁智能开源端侧模型,关键战略产品。
主要关键字:面壁智能,Eurux-8x22B,推理能力,开源模型,AI技术,UltraInteract数据集,Mixtral-8x22B,知乎,天使轮融资,MiniCPM,春华创投,华为哈勃,北京市人工智能产业投资基金,技术透明度,可访问性,开发者社区。