简单粗暴而有效的改图:自动语音识别数据扩增的“一条野路”
神经网络的调参无疑是一个巨大的工程。 如何在调参之前拥有更佳的表现?千辛万苦调好了但却过拟合,如何拥有更好的泛化能力?这无疑是人肉调参的必经之痛。一个通用的认知是,训练数据会限制模型表现的上限,能拥有更好的训练数据,无疑成功了一大截儿。 近日,Daniel S. Park 等人在自动语音识别(Automatic Speech Recognition,ASR)模型训练上,找到了一种简单却强大的数据增
神经网络
工程师李察 . 2019-05-05 485
翻译“黑科技”语音识别芯片让你无所顾忌
准备来一场“说走就走的旅行”的小伙伴们,你们已经在狂补英语、法语、德语、日语了吗?其实不必这么麻烦,只要带上这些“黑科技”,走遍全球都无忧。 “口袋”翻译机 这款叫做Travis的口袋翻译机,据说能翻译80种语言,而且翻译时间只需要2秒,最牛的是,其内置的离线语音识别芯片,即便是在离线的状态下也可以翻译20种比较大的语种,所以外出这些常见的国家,基本没什么障碍了。 而且它还有自动学习功能,用的时间
芯片
杨湘祁 . 2019-03-11 1225
爱思唯尔发布了《人工智能:知识的创造、转移与应用》报告
日前,爱思唯尔发布了《人工智能:知识的创造、转移与应用》报告,分析了全球人工智能科研的发展趋势。报告显示,2017年中国在人工智能领域出版的文章数量位列全球第一,科研产出已在2004年超过美国,但引文影响力较低,围绕人工智能研究开展的国际合作成果不足中国人工智能研究产出的四分之一。 报告显示,在政策的扶持下,中国的人工智能发展迅猛,有望在全球范围引领人工智能浪潮,其在人工智能领域的人才引进同样表明
语音识别
lq . 2019-01-17 1050
AI录音笔亮相,科大讯飞翻译拿下创新奖
AI录音笔亮相,科大讯飞翻译拿下创新奖 在CES2019上,科大讯飞带着升级之后的讯飞翻译机,讯飞智能录音笔系列出席,再一次获得CES创新奖。在生态建设上,讯飞吸引了92万开发者,交出了一份让人满意的答卷。本次,中国声谷的合作伙伴们也在讯飞展区上联合展出。 说话,是人类基本的交流途径。我们在认字读写之前,已经就能能够用语言成熟的表达自己的想法了。但是,没有共同语言,说话不懂,也变成了人
AI
刘林华 . 2019-01-11 1525
改变智能家居的五种方式
智能家居一直在变得越来越聪明,但是和科技一样,一旦我们实现了一个愿望(为什么我不能直接和灯泡通话来打开它们?),我们就开始希望有更好的东西。以下五种方式可以让智能家居变得更聪明。 1、更多交叉兼容:智能家居平台取得了长足的进步,您可以将飞利浦和LifX灯泡放在同一栋房子里,所有这些灯泡均由您的Amazon Echo智能助理控制。 2、更多视觉智能:语音识别的复杂性使得告诉房子开门或开灯成为可能
智能家居
cg . 2018-12-26 860
人工智能识别率提升解决方案
科技高速发展的今天,人工智能已经逐步成为了客户选择产品的一项硬性指标,语音识别、声纹认证、人脸识别等技术也深入到各行各业的应用中。 目前,多家人工智能引擎厂商宣布他们的语音识别技术达到95%以上的正确率--在理想环境下。在实际使用环境中,准确率则会有所下降。厂商认为影响识别率的原因之一是原始数据中存在的噪音。 VoiceCyber宇高推出的人工智能识别率提升解决方案从原始数据着手,通过软硬件结合的
语音识别
未知 . 2018-11-08 940
谷歌称语音识别是下一个机会,尤其在发展中国家
本文来源:网易科技 9月24日是谷歌成立二十周年之际,而戈麦斯在接受《卫报》采访时发表了上述言论。而在七年前,谷歌面向公众推出了其第一个语音服务,也就是一个简单的将语音转换成文字的搜索工具。 如今,语音识别已经成为谷歌搜索和人工智能语音助手的一部分。谷歌的人工智能语音助手嵌入了全球数十亿部智能手机中,相应的语音识别技术在识字率低的发展中国家显得尤为重要。 “对我们来说,语音识别看来
谷歌
网易科技 . 2018-09-25 730
利用语音识别技术保护方言不被灭绝
语言是人类文化的载体和重要组成部分。每种语言都能表达出使用者所在民族的世界观、思维特性、社会特性等,都是人类珍贵的无形遗产。当一种语言消失后,与之对应的整个文明也会消失。 据统计,目前世界上的语言有6000-10000多种。语言学家曾预言:大部分语言将于本世纪末消失。我国随着普通话普及程度的提升,一些少数民族语言、方言等弱势语言已经濒临灭绝。 如何解决这一难题呢? 带着这一疑问,到合肥高新技术开发
语音识别
未知 . 2018-07-31 1125
Mozilla使用开源Common Voice语音识别数据集进行多语言操作
Mozilla 宣布它正在使其众包项目 Common Voice 支持更多语言。Common Voice 是一个旨在创建开源语音识别数据集的项目,于去年6月发布,它邀请来自世界各地的志愿者通过网络和移动应用程序,用他们的声音记录文本片段。 业内普遍认为语音将成为下一个重要的技术平台,近年来随着人工智能理论与技术的迅猛发展,语音识别技术在不断突破,通过语音助手如 Alexa、Google Assis
Mozilla
未知 . 2018-06-12 685
人工智能目前的地位就如同“黑盒”而人就是“白盒”
日前,在谷歌年度开发者大会上,谷歌语音助手Google Assistant打电话帮用户预约剪发服务和预定餐厅的录音让人印象深刻。同样,微软的人工智能语音助手小娜也能够预订会议室,和与会人员打招呼。而令中国大众最熟悉的“语音识别”恐怕就是苹果公司开发的Sire了,作为语音识别的元老,在和使用者直接的交流中以“段子”多,“神回复”而著称,多次登上微博是一个名副其实的“网红”。而“语音识别”也让大众对“
语音识别
未知 . 2018-05-22 725
比语音识别还炫酷,搜狗推出的“唇语识别”有啥牛的?
从键盘打字到触控屏,再到现在的语音交互和手势交互,人工智能技术的发展正在促使人机交互方式向更加多元化方向变革。日前,搜狗又推出一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统。通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。 与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。搜狗首创了复杂
唇语识别
来源:互联网 . 2017-12-18 1360
语音识别市场需求旺 ST/英飞凌等抢推解决方案
语音识别市场夯,根据市调机构Strategy AnalyTIcs研究指出,到2022年,预估全球消费市场将有超过六千两百万个装置具备个人语音助理。为插旗此一市场,半导体业纷纷推出新一代解决方案。例如英飞凌(Infineon)结合雷达、MEMS麦克风和音频处理器,进一步提升MESM麦克风语音识别效能;而意法半导体(ST)则是携手语音接口和关键词检测算法开发商--Sensory,以及通讯无线芯片组解决
语音识别
新电子 . 2017-03-20 1330
MIT芯片将语音识别功耗降低99% 荣耀V9将于5天后发布
编者按:2017年消费电子产品展(CES)的主要议题之一是将互动语音控制功能(如Amazon Echo和Google Home)越来越多地集成到智能家居平台。业内专家,语音交互作为人工智能的重要一环,已经受到国际厂商重视。Ovum发现今年展会上几乎每个智能家居公司都强调了语音控制的重要性。MIT最新开发的芯片可以将语音识别功耗降低99%。此外,华为中兴遭遇专利侵权起诉,荣耀V9将在2017MWC发
荣耀v9
电子发烧友整理 . 2017-02-17 1015
福布斯评出2017年最热门的10大AI技术
据《福布斯》报道,人工智能市场正在快速发展。除了引发的讨论和媒体的高度关注,以及不断涌现的创业公司和试图收购这些创业公司的互联网巨头之外,这一领域吸引的投资和企业使用也越来越多。 NarraTIve Science进行的调查显示,去年38%的企业已经在使用人工智能,而到2018年将增长至62%。Forrester Research则预计,2017年人工智能领域获得的投资将同比增长超过300%。
人工智能
AI世代 . 2017-01-27 1475
亚马逊echo音箱也能破案 语音识别如何更智能?
亚马逊Echo智能音箱作为智能家居的明星产品已经被普通消费者所熟知,Echo一个重要的功能就是Alexa虚拟助手,只需透过语音命令,Alexa 就能帮你找到答案。但是最近美国阿肯色州警方认为它曾经“听到”过嫌疑犯的某些对话,而这些信息对一桩命案破解谋杀案至关重要,要求亚马逊交出嫌犯家中 Echo 记录下来的声音信息。 不过,亚马逊拒绝向警方上缴 Echo 服务器上的相关信息,但它们会将嫌疑的帐号资
亚马逊echo
网站整理 . 2016-12-29 835
2019年智能手机用户20%的人机互动将使用语音助理
各大手机平台业者积极投入,让虚拟个人语音助理(VPA)的功能日益强大,甚至连苹果Siri都会唱PPAP,研究机构Gartner表示,相关技术进展将促使用户更常使用VPA,预计到2019年,智能型手机用户20%的人机互动,都将使用VPA。 Gartner还公布了2016年第四季的行动应用调查,在中国、英国与美国调查了3021名手机用户,发现美国有42%、英国有32%用户在过去三个月内使用过VPA功能
VPA
ithome . 2016-12-23 750
IBM 语音识别新方向:仿生蝙蝠耳能用声纳精准“聆听”
蝙蝠使用生物声呐,为夜晚在丛林中飞行导航。他们的超声波脉冲,可以比人造声呐装置更精确地对声音进行定位。为复制、驾驭这种能力,IBM 学院奖获得者 Rolf Müller 教授协同他在弗吉尼亚理工学院(Virginia Tech)的团队,设计了一种人造蝙蝠耳。 Rolf Müller 的研究引起了 IBM 的注意。IBM 专家韩金萍(音译)的神经计算团队,和 IBM Watson 语音专家崔
语音识别
雷锋网 . 2016-11-29 810
百度语音识别再获突破,DeepCNN能翻出多大的浪花?
近日,百度在语音识别技术方面再获突破,将图像识别技术成功“跨界”到语音领域,利用深层卷积神经网络(Deep CNN)应用于语音识别声学建模中,将其与基于长短时记忆单元(LSTM)和连接时序分类(CTC)的端对端语音识别技术相结合,错误率相对降低10%,大幅度提升语音识别产品性能,是继端对端语音识别后取得的另一次重大技术突破。 Deep CNN语音识别的建模过程 近年来,运用CNN
DeepCNN
雷锋网 . 2016-11-03 940
微软今日发布用于语音识别技术“认知工具包”
一个月前,微软的对话语音识别技术在产业标准 Switchboard 语音识别基准测试中实现了词错率(word error rate, 简称 WER)低至 6.3% 的突破 ,创造当时该领域内错误率最低纪录。 近期,微软进一步将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现。 微软的语音识别技术可以一次又一次刷新纪录,在很大程度上要归功于 CNTK (Computa
语音识别
未知 . 2016-10-26 1045
“谷歌助手”把人工智能带给大众
谷歌(Google)押注计算机可以自主学习的赌局,即将面临最重大的考验。 “机器学习”把人工智能(AI)带回到科技主流中,对谷歌而言,这意味着利用它的计算能力来分析海量数据以识别模式并作出预测,从计算用户可能觉得相关的广告,到一幅数字图像显示的是猫还是狗。 “它现在正在解决我们完全不知道如何解决的问题,”自谷歌在近5年前开始聚焦该领域以来一直引领研究的工程师杰夫?迪恩(Jeff Dean)表示。他
人工智能
英国《金融时报》 . 2016-09-27 1215
- 1
- 2
- 3