百度AI开放平台(百度大脑)简介
百度大脑是百度AI核心技术引擎,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。百度大脑对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速AI技术落地应用,赋能各行各业转型升级,并通过百度智能云赋能行业客户。 N,;,vS6:6dx5.1n
2019年4月20日,“百度大脑核心技术及开放平台”荣获2018年度中国电子学会科学技术奖科技进步奖一等奖。2019年7月3日,在2019年百度AI开发者大会上,百度CEO李彦宏透露,迄今为止百度大脑已经向所有开发者开放了200多项AI核心能力。2020年9月15日,在2020百度世界大会直播现场,百度CTO王海峰在现场发布全新升级的百度大脑6.0,核心技术方面,百度大脑6.0已具备“知识增强的跨模态深度语义理解”能力。 u1?2Uj4!2af4.3p
百度大脑概述
百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台,对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速AI技术落地应用,赋能各行各业转型升级。 z7+7sj7?3dG29I
2016年百度世界大会,百度大脑1.0完成基础能力搭建和核心技术初步开放;2017年百度AI开发者大会,百度大脑2.0形成了完整的技术体系,开放60多项AI能力;2018年百度AI开发者大会,百度大脑3.0核心技术突破为“多模态深度语义理解”,同时开放110多项核心AI技术能力。 J,+4ev7~4aW4+1m
百度大脑已对外开放了150+项领先的AI能力,构建起AI全栈技术布局。未来百度将继续平等赋能开发者,让每一位开发者都能平等便捷地获取AI能力。 E9~8NW8=1ix9!8d
发展历程
以搜索业务为核心 X3?7qt5?3WU3;,N
2000年1月,百度作为一家搜索引擎公司诞生在中关村。搜索引擎的背后,除了有链接分析等互联网技术,还需要自然语言处理、信息检索等AI技术,因此,百度从诞生之初,就开始了人工智能技术研发与应用。 M4;6Uf6;6le5+,C
全面布局AI基础技术 h98mg7?2vX8~1z
2010年初,已经有了10年技术积累的百度,开始全面布局人工智能,陆续开始了包括自然语言处理、机器翻译、语音、图像、知识图谱、机器学习、数据挖掘、用户理解等技术的研发。 S6?7NB,+7PH2!9Z
2012年1月,百度开始研发深度学习技术,并于当年上线语音识别和图像识别能力,大幅提升了识别效果。正是由于看到了深度学习在应用中的惊艳效果,百度在2013年初成立了世界上第一个深度学习研究院。 v2=9Jx6=4Ru1+4G
2013年下半年,百度在世界上首次将深度学习技术应用于大规模搜索排序系统。2015年,百度上线了世界上首个大规模神经网络机器翻译系统,比Google早了一年多时间。 b3?7Jo6.7bc9~1C
对外开放AI核心能力 R4-1KE7?,QC,:5z
2016年9月的百度世界大会上,基于百度16年的深厚积累,百度大脑正式发布,同时宣布对外开放百度AI核心技术。 o8?3nQ3+5hG3~,F
2017年7月百度AI开发者大会上,百度大脑2.0正式公布包含基础层、感知层、认知层和平台层在内的完整技术布局,并通过AI开放平台对外开放包含语音、图像、视频、增强现实、自然语音处理等在内的90余项AI核心能力,积极与行业合作伙伴和广大开发者一起共建AI技术生态。 l,.,Eu5-,Al,=8O
2018年7月百度AI开发者大会,百度大脑宣布升级至3.0,开放110多项核心AI能力,并公布百度大脑每日的调用次数已超过4000亿次。百度大脑3.0的核心技术突破是“多模态深度语义理解”,不仅让机器听清、看清,更可深入理解其背后的含义,从而更好地支撑各种应用。 D92Rg9-7OR,.9G
2019年7月3日,在2019年百度AI开发者大会上,百度CEO李彦宏演讲开场。李彦宏透露,百度大脑作为一个拥有全体系AI能力的技术平台,迄今为止已经向所有开发者开放了200多项AI核心能力,这些能力和开发者结合起来,就会产生魔幻一般的力量。“星火燎原,AI一定会在各行各业产生越来越大的价值。” v1?1fr21b03!5J
2020年9月15日,在2020百度世界大会直播现场,百度CTO王海峰在现场发布全新升级的百度大脑6.0。据介绍,核心技术方面,百度大脑6.0已具备“知识增强的跨模态深度语义理解”能力。基于掌握的5500亿知识,以及“知识增强的持续学习语义理解”技术,百度大脑综合语音、语言、视觉等不同信息,实现跨模态语义理解,获得对世界的统一认知。有了这一能力,机器就能听懂语音,看懂图像视频,理解语言,进而理解真实世界。 m,:9km1+5xh4;,s
百度大脑核心AI技术
1、深度学习 I27pP9:,Na1~8d
深度学习是人工智能(AI)最热门的研究领域之一,已经成为引领人工智能持续突破的关键技术。 m9.6fg9.1fW5-6w
技术研发方面,12年,百度开始研发深度学习技术,并于当年上线语音识别和图像识别能力。2013年,百度成立深度学习研究院。2017年,由中华人民共和国国家发展和改革委员会批复,百度牵头筹建了国内唯一的深度学习技术及应用国家工程实验室,百度以“领头雁”身姿引领中国深度学习核心技术研发。 q,=8gP6:8ar,!6V
能力开放方面,2016年,百度正式宣布对外开放PaddlePaddle,它是国内最早开源、也是当前唯一一个自主研发功能完备的深度学习平台。依托百度业务场景的长期锤炼,PaddlePaddle具备了最全面的官方支持的工业级应用模型,支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,拥有强大的多端部署能力。18年PaddlePaddle3.0版本正式发布,升级为全面的深度学习开发套件,除了核心框架,还开放了VisualDL、PARL、AutoDL、EasyDL、AIStudio等一整套的深度学习工具组件和服务平台,更好地满足不同层次的深度学习开发者的开发需求,具备强大支持工业级应用的能力。 i72nh2-1IO2.6Q
2、语音技术 f1;,Vs7:6Gv6+8U
百度语音技术基于业界领先的声学模型和语音模型,可将声音与文字信息进行相互转换,可用于智能导航、语音输入、语音搜索、智能客服、文字有声阅读等场景。主要包括语音识别、语音合成、语音唤醒三大能力。 r8?,Ra8=3qt5+20
3、视觉技术 F7;2JL4~5Hw7?6q
百度图像技术是基于深度学习算法,输出多种核心人工智能视觉技术,包括图像识别、人脸与人体识别、视频技术、AR与VR等AI能力和多场景的行业解决方案。百度大脑图像处理技术可智能识别图像类别、内容和含义,支持基于图像识别的场景应用。百度视频技术,输出视频内容分析、封面选区、对比检索、内容审核等能力。AR技术上,百度ARDumix平台为开发者提供了涵盖AR应用开发、内容生产、内容管理和内容分发的一站式解决方案。 z6=2Ic,.4cC7;,n
4、自然语言处理 T2+,oA,9fd5!2C
百度自然语言处理技术输出如情感倾向分析、评论观点抽取等语言处理基础技术、智能写作、文本审核、机器翻译等核心AI能力与多场景行业解决方案。该技术的目的,就是让计算机能够处理和生成人类语言,从而让机器具备人类的思考和理解能力。 g8+8GE3:,pv3!6l
5、知识图谱 a1:,kz6:8xI8=1u
百度知识图谱是全球最大规模中文知识图谱,包含6亿实体、3780亿事实,面向开放域多形态数据的知识挖掘技术及高性能图检索和计算框架,突破了传统知识获取规模小、成本高、效率低的瓶颈,实现了千亿级知识的实时查询和计算。在知识图谱规模、图谱数据容量及检索性能等指标上均达国际领先水平。知识图谱大规模应用于百度搜索、信息流、百度地图和对话式人工智能操作系统,覆盖超过85%的搜索请求,日均用户请求超过13亿次。 K9:2mf6=4tP16i
百度大脑AI技术成果
2018年2月,美国权威杂志《麻省理工科技评论》(MITTechnologyReview)揭晓了2018年“全球十大突破性技术”(10BreakthroughTechnologies2018),在官方榜单中,百度被列为实时语音翻译领域“关键玩家”,成为本年度唯一一家入选的中国公司,也是史上首个连续三年入选该榜单的中国公司。 r3?2cV9:,Vh3~5K
2018年2月,百度自然语言处理(NLP)团队研发的V-Net模型以46.15的Rouge-L得分登上微软的MSMARCO(MicrosoftMAchineReadingCOmprehension)机器阅读理解测试排行榜首。百度NLP在MARCO提交的V-NET模型,使用了一种新的多候选文档联合建模表示方法,通过注意力机制使不同文档产生的答案之间能够产生交换信息,互相印证,从而更好的预测答案。此外,此次百度只凭借单模型(singlemodel)就拿到了第一名,并没有提交更容易拿高分的多模型集成(ensemble)结果。 B2~6Dy3.8bz2+5g
2018年3月,百度凭借全新的人脸检测深度学习算法PyramidBox,在世界最权威的人脸检测公开评测集WIDERFACE的“Easy”、“Medium”和“Hard”三项评测子集中均荣膺榜首,刷新业内最好成绩,超过了国内外众多科技公司和高校实验室,这也是继2015年提出DenseBox算法之后百度再次刷新人脸检测纪录。 g3:6lT3.3rC7=9d
2018年4月,以“大数据+”为主题的第十三届中国电子信息技术年会在苏州召开,百度知识图谱荣获2017中国电子学会科技进步一等奖。 x24KG3~1Zk5~6n
2018年6月,百度视觉技术团队凭借领先的图像识别和视频理解技术在全球两大视觉竞赛WebVision和ActivityNet中分别击败100多家参赛单位和队伍,获得多项世界第一,并受邀在全球视觉技术领域顶级学术会议CVPR(IEEE国际计算机视觉与模式识别会议)上做报告分享。 L3:7TO9;2Ne8;,F
2018年9月,百度视觉团队在最大规模目标检测竞赛GoogleAIOpenImages-ObjectDetectionTrack中再获佳绩,击败了全球450多支参赛队伍,脱颖而出获得世界第一,并受邀在顶级视觉学术会议ECCV2018上做分享。 s4-1IC,+5BJ4.,w
2018年11月,人工智能顶级峰会NIPS八大挑战赛之一AIforprostheticsChallenge(人工智能假肢挑战赛)已经决出胜负,百度击败来自全球400个技术团队夺得冠军,其9980分的高分,足足领先第二名高达30分之多。据媒体报道,此次挑战赛是通过强化学习算法,来实现对人类骨骼仿真模型的训练,使模型能最大限度模仿人类运动方式,从而实现人工智能与生物科技的真正结合。 z,?5wj1~2Pc4+2m
NeurIPS是人工智能和机器学习领域的国际顶级会议,百度数篇学术论文入选NeurIPS2018。百度大数据实验室于当地时间2018年12月2日组织了一场主题为《CommonModelInfrastructure》的Workshop,邀请了来自谷歌、微软、XPrize的研究者,就自动机器学习这一专题进行分享,百度方面也介绍了自己在这方面的研究成果。 W22di,:1Mw1~8S
AAAI是人工智能领域的国际顶级会议,早期由计算机科学和人工智能创始人AllenNewell,MarvinMinsky和JohnMcCarthy等人首创,被中国计算机学会(CCF)推荐为A类会议。百度共有15篇论文被人工智能顶级学术会议AAAI2019收录,多位百度科学家、研究者受邀将赴会作报告。 L,+,op9.1Ez8:6R
2019年2月,第十三届国际语义评测比赛(InternationalWorkshoponSemanticEvaluation,SemEval2019)论坛评论建议挖掘任务评测(Task9A:SuggestionMiningfromOnlineReviewsandForums)中,百度一举击败来自全球的210余支队伍,最终以F值78.12%的成绩夺得冠军,再次印证了百度在语义理解等核心技术的世界领先地位 d,!1bh33mT,-,h
百度大脑AI开放平台
百度AI开放平台持续升级,是最完整、最前沿、最开放、最具活力的AI技术平台。现阶段从深度学习框架、深度学习实训平台、场景化AI能力、定制化训练平台,到软硬一体模组和解决方案等实现全面开放,为各行各业赋能,加速创新AI产品落地,助力企业智能化转型。 F5-6ld8-6BZ,-4C
百度AI开放平台上的开发者数量超过100万,加入燎原计划的合作伙伴超过300家,入选百度AI加速器企业覆盖金融、工业、农业、零售、医疗、互联网等17大行业。 n9+6rU7~2js8.2M
百度大脑落地及应用案例
百度大脑持续不断地开放,让越来越多行业和企业变得越来越智能,借助AI提升效率,创造新价值。百度AI能力已被广泛应用于医疗、零售、金融和安防等不同领域,让任何人在任何地方,都能通过百度平等获取顶尖的AI能力。 J2?5Cf2:,vS8=20
1、第一产业 Q,?1Ct1;1ve,!,I
农业遥感无人机 F4~,XK1?,aF8~9s
辽宁盘锦的农民张玉军,通过使用百度与麦飞科技合作的农业遥感智能监测系统,引入边缘计算,对农作物病虫害实施智能化监测,并完成精准施药,能够将农药使用量降低50%。百度正利用AI能力让农业生产提质增效,“打好中国粮,端好中国碗。” D7?3AQ3.8My4~8K
利用PaddlePaddle搭建智能桃子分拣机 n5+1WX2?9qn7?3f
北京工业大学的4位学生利用百度PaddlePaddle开源平台上的深度学习模型,用这些大桃照片,通过机器学习和模型训练,制造了一台智能桃子分拣机,从形状、大小、色泽、光洁度等多维度,对桃子自动分级,从而实现自动分拣。该团队将6400张大桃照片按照红、大、中、小等元素按照分档建立图片数据集合,将图片数据集放入卷积神经网络(CNN)中进行训练,自动提取用于分级的影响要素并形成分类逻辑。实现对大桃的自动分列、判断、分装,准确率达到90%以上。 p6+3Xr3+4SM9~8p
2、第二产业 o4=3wo1:5ww3;6i
无人自主挖掘机 n7.,NX4!5CW88p
百度与铁甲合作推出的无人自主挖掘机,是世界上首台基于视觉技术构成的低成本、可以量产的解决方案工程装备。采用百度的无人自主挖掘机,能够将施工效率提升15%,人力成本降低40%,实现收入提升50%以上。制造业的AI化不仅可以解放人力,还可以激活产业,推动智能制造的发展。 N5;6ln2-3hC8;2q
智能零件分拣机 J9.8mu4!3KB5=,K
质检是绝大多数制造企业的必备部门。但现在,大多数零件制造企业的质检,还只能靠高密度的人工检测。PaddlePaddle与领邦智能深度合作打造了领邦智能零件分拣机,实现零件的自动分拣,基于官方支持的ICNET模型,分拣精度可达到99%以上,预测速度较同类产品快20%。此外,分拣机还在通用性上有很好的表现,机器可支持几十种形状的高精密小零件的分拣。 H3:7jt6+8Bb6;2p
3、第三产业 Z1;9v08?8wl3=3P
AI眼底筛查一体机 Z2.,zb4!9Wf,:40
基于百度大脑的AI眼底筛查一体机在2018百度世界大会上正式亮相。AI眼底筛查一体机已在广东肇庆等多个地区落地,可以帮助患者快速的筛查包括糖网、青光眼、老黄等多种眼底疾病,提早预防致盲风险,该系统经过权威测试,筛查准确率已经相当于10年以上的眼科医生。大会现场,李彦宏宣布百度将与卫计委合作,在834个国家级贫困县中的500个贫困县的医院,部署搭载AI眼底筛查系统的一体机,帮助基层的眼病患者尽早的发现致盲的风险,及时就医。 j9!9Lt9!6pC,~,F
援藏医生利用深度学习进行显微镜下寄生虫虫卵识别 f7:3ih,3HS1+3q
陈静飞,援藏医生(4年,西藏农牧学院),去西藏前是临床方面的医生(主要集中在微生物感染疾病上)。援藏医生陈静飞在西藏地区9地调研后发现,藏区牧民、牲畜寄生虫感染率比内地明显严重。原因不仅在于西藏人少地广、牧区面积大,人畜接触多,同时也因为西藏地区基层医疗单位缺乏技术过硬的检验人员,感染率居高不下,且医生不知道病人感染的是什么寄生虫,也不知道该用什么药。 l7;9yL6+2HL6-6k
零AI基础的援藏医生陈静飞借助百度EasyDL进行显微镜下寄生虫虫卵识别,辅助检验人员进行寄生虫虫卵的相关诊断,有效改善人工识别的诸多不足。现在这套系统已经可以识别10多种寄生虫虫卵,在小范围的临床检验试点里,识别测试准确率稳定在97%以上,未来几个月,可以实现识别常见的40多种寄生虫虫卵,并不断提高识别准确率和识别速度。换句话讲,这个系统只用了几个月时间,识别能力可以相当于一位有20多年临床经验的检验专家,比一般检验医师识别寄生虫的种类要多很多,同时准确率和识别速度更好。 j42CS5;9kF3=6f
陈静飞表示,希望借助EasyDL辅助西藏基层医生诊断寄生虫,解决基层一线医疗单位寄生虫虫卵识别能力不足的问题,改善西藏地区寄生虫危害。 r6?8Ar9!4Yg8!2Y
美国零售商Checkpoint超市购物车监控 p7!6RR7:9Ci2.2w
美国零售安防提供商Checkpoint基于百度AI技术能力,通过与普通摄像头结合,打造智能抓拍机,用于监视超市购物车下层是否有未付款商品,并精准排除残疾人购物车及儿童购物车。这种方案成本低、效率高,已在美国纽约州、新泽西州、宾夕法尼亚州等七个州的160个超市中,总计约1600台摄像头设备上落地。该模型的准确率达到95%以上,远超此前靠传感器判断的准确率。 j7?7Ga,=5sP,-4x
免责声明
网站收录目的在于传递更多信息,致力于为中文网站提供动力。不代表本网赞同其观点和对其真实性负责。