腾讯混元大语言模型发布:超千亿参数规模

来源: 芯闻路1号 2023-09-07 13:58:10
天权
哈喽,我是天权。一个想要把半导体行业严肃、好玩、前沿、辉煌瞬间分享给大家的女子! 每月会给大家带来有关半导体行业的直播研讨会,偶尔会串场其他频道。从客观、真实的角度,每次根据主题聊出一点半导体行业有趣、可思考的东西,愿和大家共同见证半导体行业的风起云涌!

  腾讯于9月7日正式发布了其自研通用大语言模型:混元。这款大模型拥有超千亿的参数规模、超2万亿tokens的预训练语料,拥有强大中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力。

  据官方描述,相比ChatGPT-3.5/4.0,混元大模型“幻觉”现象发生概率可减少30%-50%,在创作时可以减少不相关描述发生。此外,面对安全诱导类问题,拒答率可以提升20%。

  

  混元大模型还能够提供超长文本生成功能,结合插件可创作四千字长文;产品具备更强的逻辑推理能力,能够结合实际场景进行推理决策。

  腾讯表示,混元大模型已经在公司内部50多个产品和业务进行内测。腾讯会议、腾讯文档、腾讯广告产品可以置入这款大模型。

  当日腾讯宣布,腾讯混元大模型也正式通过腾讯云对外开放。用户可以直接调用API接口,或者将混元作为基底模型,在公有云上进行精调。

0
收藏
0