欢迎大家来到IT世界,在知识的湖畔探索吧!
深度学习的突破引发了第三次人工智能浪潮,获得了空前成功。但深度学习存在的局限性,同时也加速了新一轮“AI泡沫”的到来。
自2016年AlphaGo战胜韩国围棋名手李世石后,世界掀起了新一轮的人工智能热潮。曾经有一种观点认为,由于围棋的极度复杂性和深厚的文化秉性,人工智能几乎不可能战胜人类。但这一天终究到来了,而且来得如此之快!但当前的人工智能技术存在固有缺陷,社会对人工智能的美好期望与AI现有能力的不匹配,将可能会导致“AI泡沫”的破灭。
颠覆性技术的本质
“人工智能”这一概念自诞生起,就没有一个严谨的定义与界限。1956达特茅斯会议上,“人工智能”的叫法甚至一度落后于“控制论”。但由于其浪漫主义色彩和通俗易懂的称谓,很快就抓住了人们的“芳心”。自此以后,政府机构、社会资本、科技巨头的强势介入,使得人工智能研究获得了飞速的进步。但与一般的技术发展规律不同,人工智能发展过程经历了三次浪潮,其表现与传统Gartner曲线有着显著区别(见下图)。
传统Gartner曲线 V.S. 人工智能曲线(国际技术经济研究所整理)
- 第一次浪潮时间段约为1956年至1976年,其核心是符号主义(逻辑主义),当时最大的成果是专家系统、知识工程。如1956年,卡耐基梅隆大学的LT程序证明了《数学原理》第二章的38条定理;1963年,经过改进的LT程序证明了《数学原理》第二章的52条定理,该程序随后被改进成GPS。但由于这些成果几乎无法解决实用问题,计算能力也严重不足,人们对AI未来产生失望,社会资本开始退出,政府资助不断下降,导致第一次“AI寒冬”到来。
- 第二次浪潮时间段约为1976年至2006年,其核心是连接主义。在这一次浪潮中,符号主义退居幕后,AI神经元网络方法开始盛行。1975年,Paul Werbos提出了BP算法(Backpropagation Algorithm),使得多层人工智能神经元网络的学习成为可能。1982年,JohnHopfield提出可用作联想存储器的互连网络——Hopfield模型,大家发现人工智能的春天又来了。80年代,新一波人工智能热潮开始兴起,包括语音识别、语音翻译计划,以及日本提出的第五代计算机。尽管当时有商业应用的实例,但应用范畴却很有限,AI热潮在90年代开始逐渐消退。
- 第三次浪潮是从2006年开始至今,其核心是深度学习的突破。众所周知,Geoffrey Hinton、YannLeCun和Yoshua Bengio于2006年发表了多篇关于“深度神经网络”的文章。在计算能力和大数据技术的加持下,人们发现深度学习技术可以解决前两次AI浪潮中解决不了的问题。2015年12月,微软亚洲研究院在ImageNet计算机识别挑战赛中凭借深度神经网络技术的突破,获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。2016年3月,谷歌Deepmind开发的人工智能程序AlphaGo以4:1的战绩击败韩国围棋职业九段选手李世石,被认为是人工智能发展的重要里程碑。
为何以深度学习为代表的第三次AI浪潮获得了巨大的成功与空前的关注?从方法论上看,第二次和第三次AI浪潮都属于连接主义,没有本质上的不同。从研究范畴上看,人工智能包含的子领域众多,包括专家系统、遗传算法、机器学习等(见下图),而深度学习仅仅是机器学习中的一个子领域。
人工智能研究范畴(来源:网络)
究其原因,主要是人类对于人工智能的认知产生了显著变化。以符号主义和连接主义为代表的第一、二次人工智能发展浪潮,正是人类对人工智能抽象性认知的真实写照。但经历过时间的洗礼后,这两次人工智能发展浪潮都遭遇了严重的失败。这主要是因为符号主义和初始的连接主义都是对人类大脑活动的模仿,并没有合理利用大脑产生智能的机制,最终导致结果不尽人意、AI项目纷纷落马。深度学习的成功,表明大脑启发的人工智能是其能够得以广泛应用的根本原因。深度学习不仅依赖计算能力和大数据技术的进步,更加依赖的是卷积神经网络(CNN)等模型和参数训练技巧的进步。
人工智能的颠覆性
在数据、算力、算法这三驾马车的拉动下,人工智能正以超乎想象的速度进步,不断颠覆着社会生产生活的各方面。面向特定领域的人工智能(专用人工智能)由于应用背景需求明确、领域知识积累深厚、建模计算简单可行,因此形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。如在图像识别领域,深度神经网络的统计学习模型持续创新,ImageNet图像识别的错误率已由2010年的28%降低至2017年的2%左右,明显超出了人类的平均水平。
Imagenet图像识别错误率(来源:电子前沿基金会)
在专用人工智能不断取得突破的背景下,各国政府、社会资本、产业界都对人工智能产生了强烈的兴趣,纷纷投入人力、物力、财力加强人工智能研发,旨在争夺科技发展的制高点。2013年以来,全球人工智能行业投融资规模就开始呈现不断上涨的趋势。2017年成为人工智能发展新的元年,Facebook、谷歌、微软、百度、阿里巴巴和腾讯等科技巨头纷纷发布自己的人工战略,全球人工智能投融资总规模约400亿美元,融资事件1000余笔。其中,中国AI企业融资总额占全球融资总额70%,融资笔数达31%(见下图)。
全球人工智能投融资变化趋势(来源:清华大学中国科技政策发展研究中心)
在资本的追逐下,人工智能初创企业如雨后春笋般拔地而起,逐渐渗透进人们生产生活的各个方面。Bloomberg Beta风险投资人ShivonZilis对从事机器学习的企业进行了梳理,将人工智能企业分为以下几类:第一类专注于底层技术(Core Technologies),涉及领域包括人工智能、深度学习、机器学习、图像识别、语言识别、自然语言处理等;第二类专注于企业经营(Rethinking Enterprise),涉及领域包括销售、安全、欺诈检测、招聘、市场、智能工具等;第三类专注于工业界(Rethinking Industries),涉及领域包括广告、农业、教育、金融、法律、制造业、制药业、油气业、自动驾驶、医疗等;第四类专注于人类拓展(Rethinking Humans),涉及领域包括增强现实、姿态计算、情绪识别、机器人等;第五类专注于支持性技术(Supporting Technologies),涉及领域包括硬件、数据收集、数据处理等。
机器学习产业图谱(来源:Shivon Zilis)
第三次人工智能浪潮获得了巨大的成功,智能翻译、智能选股、自动驾驶、语音识别等相关应用已经无处不在。但人工智能为人们的生产、生活带来便利的同时,同样也对国家安全、社会治理、伦理道德等产生了强烈冲击。以AI伪造技术为例,2017年5月,加拿大创业公司琴鸟(Lyrebird)发布人工智能语音系统,可通过分析讲话记录与文本之间的关联,模仿人类讲话并加入逼真的情感和语调,该系统成功模仿了特朗普、奥巴马和希拉里的对话;2017年7月,美国华盛顿大学开发出“可伪造真人视频”的人工智能技术,该技术可将音频文件转化成真实的口型并嫁接至视频中的人脸上,生成的新视频让人难以辨别真伪;2017年11月,英伟达利用生成式对抗网络(GAN)生成的人物照已经达到了真假难辨的地步(见下图)。随着人工智能技术的不断进步,音频、视频、笔迹和图片等数据的伪造技术将会更加逼真,甚至专业人士也将难以辨别。
图片伪造技术的发展历程(来源:人类未来研究所)
第三次浪潮的局限性
毋庸置疑,以深度学习为代表的第三次人工智能浪潮取得了巨大的成功,人工智能应用正加速落地并不断商业化。但从人工智能总体发展水平来看,其仍处于初始的“起步”阶段。截至目前,人工智能的发展史可以简单近似为模仿人类智能的历史。随着第一、二次人工智能发展浪潮的失败,学者们纷纷将研究重心放在了神经网络模型的突破。深度学习概念的提出与发展,直接开启了人工智能在学术界和工业界的第三次浪潮。但从本质上讲,深度学习是机器学习算法的重要进展,却并非是颠覆性创新。
深度学习神经网络示意图
算法、算力、数据是深度学习成功的先决条件,但深度学习在算法、算力、数据层面均存在“瓶颈”问题。何宝宏在《电信网技术》2018年第四期中给出了4点总结。在算法层面,人工智能存在可解释性不足、训练效果无法预知、个人经验主义和通用型不足等问题;在计算层面,目前的模型训练仍依靠蛮力计算,成为吞噬算力的巨兽,且摩尔定律面临失效的困境,算力增长变得困难;在数据层面,数据透明度、数据攻击问题和监督学习问题成为人工智能的新瓶颈;在认知层面,现有的人工智能模型缺乏常识,因此无法理解实体概念,无法识别关键影响因素,且缺乏伦理道德。
人工智能技术的天花板(来源:《电信网技术》2018年第四期)
算法层面
黑盒子问题:缺乏理论指导,对“智能”行为无法做出合理解释
效果无法预知:为提升训练效果,只能不断增加网络深度和算力算法
个人经验主义:调整参数仍是在碰运气,没有总结出系统经验做指导
没有记忆能力:机器学习系统被训练于执行单一任务,通用性不足
计算层面
依靠蛮力计算:吞噬“算力”的巨兽,在线实时训练几乎不可能
算力存在瓶颈:GPU等并行式计算硬件获得成功,但算力仍是瓶颈
摩尔定律失效:硅芯片逼近物理和经济成本的极限,计算性能增长困难
数据层面
数据的透明性:训练用数据集往往不透明,易出现“数据改变信仰”情况
数据攻击问题:对抗性样本攻击可致使系统直接被“洗脑”
监督学习问题:深度学习对实时、海量的大数据打上标签几乎不可能
认知
缺乏常识:无法理解实体概念,无法识别关键影响因素,缺乏伦理道德
谭铁牛认为人工智能的发展存在数据瓶颈、泛化瓶颈、能耗瓶颈、语义鸿沟瓶颈、可解释性瓶颈和可靠性瓶颈。他用“四有四无”概括人工智能总体状况:
- 人工智能有智能没智慧:智慧是高级智能,有意识、悟性,可以决策,而AI缺乏意识和悟性,缺乏综合决策的能力;
- 人工智能有智商没情商:机器对人的情感理解与交流仍处于起步阶段,科幻电影中跟人类谈情说爱的人工智能还差很远;
- 人工智能有计算没算计:人工智能系统可为有智无心,更无谋;
- 人工智能有专才没通才:会下围棋的“阿尔法狗”不会下象棋。
AI泡沫将会如何呈现
与学术界的客观审慎不同,政府机构、社会资本、民众对于人工智能的热情,导致人工智能宣传被夸大,很多初创企业也有蹭人工智能“热度”的嫌疑。近年来,人工智能“泡沫论”的声音一直不绝于耳。李开复在接受采访时表示,“到2018年年底,我们除了会看到一些非常成功的人工智能案例,还会看到更多的泡沫破裂,这将耗尽公司资金甚至导致破产,最后可能会导致人工智能的整个环境冷却一段时间。”随后,Yann LeCun在网络上表达了赞同,并补充评论道:“(人工智能泡沫将破)确实如此。李开复提到的泡沫就是指有些公司许下了过高的承诺,但是今年要不了多久他们的钱就花完了。”
结合2000年左右的互联网“泡沫”经历,我们可以总结出目前“AI泡沫论”的主要论点:
- 人们对于人工智能改变生活的预期与AI现实能力不匹配。以自动驾驶为例,车企对于全自动驾驶(Level 4)的实现时间盲目乐观。特斯拉和谷歌预测将于2018年实现全自动驾驶,Delphi和MobileEye承诺于2019年实现Level 4自动驾驶系统,Nutonomy公司则计划于2019年在新加坡街头部署数千辆无人驾驶出租车。但加里·马库斯等专家认为,实现完全自动驾驶可能需要数年甚至数十年,届时才能实现可以避免事故的自动驾驶系统。
- 资本界和自媒体对人工智能的理解与AI现实能力不匹配。部分投资界人士和自媒体对人工智能的理解较为片面,对人工智能现阶段的能力认识不足。扭曲的信息在网络中多次传导,逐级放大,最终导致社会整体认知的缺陷。
以人类智能为基准,现有的人工智能技术或许连婴儿的水平都达不到。以深度学习为代表的机器学习技术,也仅仅是实现真正人工智能的一小步。在可以预见的未来,新型AI算法、算力和大数据技术或将不断取得新突破,人工智能也仍将持续保持高速发展态势。与前两次AI浪潮相比,第三次AI浪潮可以解决的问题已大大拓展,我们对人工智能未来的发展应该持有乐观的心态。但同时,资本的疯狂追逐、误导性的宣传也会持续下去,人们对AI改变生活的预期和AI现实能力的不匹配,必将导致“AI泡沫”的产生。未来一段时间,人工智能的发展或将呈现冰火两重天:有能力的公司疯狂扩张,没能力的公司迅速溃败。待理性的社会心态重新回归,我们必将迎来人工智能健康发展的一天。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/35369.html