• 我们真的需要那么多“超大模型”吗?

         自2018年谷歌发布BERT以来,预训练大模型经过三年的发展,以强大的算法效果,席卷了NLP为代表的各大AI榜单与测试数据集。2020年OpenAI发布的NLP大模型GPT-3,实现了千亿级数据参数。GPT-3除了具备传统的NLP能力之外,还可以算术、编程、写小说、写论文摘要,一时之间成为科技圈中的爆点。到2021年,我们可以看到各大学术机构、科技企业都在打造自己的大模型,并且对其能力边

    模型

    虎嗅APP . 2021-10-27 3251

  • 理解机器学习中的算法与模型

    机器学习涉及到机器学习算法和模型的使用。对于初学者来说,这很容易让人混淆,因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢,还是不一样的东西?作为开发人员,你对排序算法、搜索算法等“算法”的直觉,将有助于你厘清这个困惑。在本文中,我将阐述机器学习“算法”和“模型”之间的区别。 机器学习中的“算法”是什么? 机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。

    机器学习

    Datawhale . 2020-07-31 930

  • 图文详解:深度学习的学习任务

    一、典型的学习任务包括: 分类(classification) 回归(regression) 聚类(clustering) 排序(ranking) 密度估计(density estimation) 特征降维(dimensionality reduction) … … 1.1分类(classification) 基于已知类别标签的样本构成的训练集,学习预测模型;最终预测模型,对新的观测样本,预测相应

    模型

    百家号 . 2020-07-01 905

  • 深度学习模型压缩与加速综述

    目前在深度学习领域分类两个派别,一派为学院派,研究强大、复杂的模型网络和实验方法,为了追求更高的性能;另一派为工程派,旨在将算法更稳定、高效的落地在硬件平台上,效率是其追求的目标。复杂的模型固然具有更好的性能,但是高额的存储空间、计算资源消耗是使其难以有效的应用在各硬件平台上的重要原因。所以,卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战,深度学习模型压缩与加速成为了学术

    模型

    yxw . 2019-06-08 1015

  • 让机器学习模型不再是”黑盒子“

    提高机器学习模型的可解释性和透明度,将有助于模型的除错、引导未来的数据收集方向、为特征构建和人类决策提供真正可靠的信息,最终在人与模型之间建立信任。 过去几年来,人工智能研究人员在图像识别、自然语言理解和棋类等领域取得了重大突破。但由于缺乏对复杂机器学习模型的真正理解,导致模型在传播时出现了偏见,这种偏见在零售、面部识别和语言理解等领域的应用中出现了多次。 说到底,机器学习模型大多数时候仍然是“黑

    人工智能

    lp . 2019-03-12 1360

  • 两亿多用户,六大业务场景,知乎AI用户模型服务性能如何优化?

    用户模型简介 知乎 AI 用户模型服务于知乎两亿多用户,主要为首页、推荐、广告、知识服务、想法、关注页等业务场景提供数据和服务,例如首页个性化 Feed 的召回和排序、相关回答等用到的用户长期兴趣特征,问题路由、回答排序中用到的 TPR「作者创作权威度」,广告定向投放用到的基础属性等。 主要功能 提供的数据和功能主要有: 用户兴趣:长期兴趣、实时兴趣、分类兴趣、话题兴趣、keyword 兴趣、作者

    API

    工程师李察 . 2019-01-05 1715

  • 盘点那些有趣的微缩模型

    看看这些微缩模型,能买到铜或者铅的话,也可以自己做一些。就是那个小烧杯一般人弄不出来,得会吹玻璃才行。

    模型

    未知 . 2018-08-06 1135

  • OSI七层模型及其功能

    OSI七层模型及其功能 在七十年代末,国际标准化组织 ISO 提出了开放系统互连参考模型。协议分层大大简化了网络协议的复杂性,这实际也是自顶向下、逐步细化的程序设计方法的很好的应用。网络协议按功能组织成一系列“层”,每一层建筑在它的下层之上。分成的层数,每一层的名字、功能,都可以不一样,但是每一层的目的都是为上层提供一定的服务,屏蔽低层的细节。 物理层涉及到通信在信道上传输的原始比特流,它实现传输

    七层

    本站整理 . 2009-06-09 970