腾讯混元大语言模型发布:超千亿参数规模
腾讯于9月7日正式发布了其自研通用大语言模型:混元。这款大模型拥有超千亿的参数规模、超2万亿tokens的预训练语料,拥有强大中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力。 据官方描述,相比ChatGPT-3.5/4.0,混元大模型“幻觉”现象发生概率可减少30%-50%,在创作时可以减少不相关描述发生。此外,面对安全诱导类问题,拒答率可以提升20%。 混元大模型还能
快讯
芯闻路1号 . 2023-09-07 2220
部署700亿参数,阿里云率先支持Llama2大模型
7月25日,阿里云宣布在国内率先推出针对Llama2全系列版本的训练和部署方案,欢迎所有开发者来阿里云上打造专属大模型。 近日,Llama2大语言模型宣布开源,覆盖70亿、130亿及700亿参数版本。Llama2可免费用于研究场景和月活7亿用户以下的商业场景,为企业和开发者提供了大模型研究的新工具。 然而,对Llama2的再训练和部署仍存在较高门槛,尤其是针对效果更胜一筹的大尺寸版本。
快讯
芯闻路1号 . 2023-07-25 1 2645
Meta宣布通过微软亚马逊等云平台开放大模型商用
7月19日消息,Meta宣布,将与包括微软在内的主要云计算服务提供商合作,将其AI大语言模型Llama 2投入商业应用。Meta表示,不会对其大模型的访问或使用收费。同时,通过向其他公司开放这项技术,当更多开发者使用其大模型、对大模型进行压力测试并暴露问题后,Meta可以更好地进行改进。 通过这项举措,Meta也和其他科技巨头一样参与到AI军备竞赛中。目前,Meta在AI基础设施上的支出达
快讯
芯闻路1号 . 2023-07-19 2689
京东将推出言犀 AI 大模型:参数达到千亿级,支持各类芯片架构
6 月 27 日消息,在京东云城市大会上海站上,京东集团技术委员会主席、京东云事业部总裁曹鹏介绍,即将推出的言犀大规模预训练语言模型,是参数达到千亿级的新一代模型。 据介绍,京东大模型将面向多模态,深入零售、物流、工业等产业场景。言犀是“京东版”ChatGPT,其预训练参数达到千亿级、品类覆盖 3000+、人工审核通过率 95%+、生成文字 30 亿 +。 曹鹏还强调,在产业智能时代,
快讯
芯闻路1号 . 2023-06-27 1 4100
英国投资 1 亿英镑,成立 AI 工作组和 OpenAI 等共建基础模型
6 月 13 日消息,英国首相在近日召开的 2023 年伦敦科技周上,宣布成立 AI 工作组,并计划在人工智能法规和负责任人工智能的发展方面,投入 1 亿英镑,用于确保人工智能在安全环境下健康发展。 英国首相里希・苏纳克(Rishi Sunak)今天发布推文,表示正在与 DeepMind,OpenAI 和 Anthropic 合作,打造基于研究和安全目的的早期、优先访问模型。 苏纳克在
英国
芯闻路1号 . 2023-06-13 1 2480
- 1
- 2