大约在2002年时,凯文·凯利参加了谷歌的一个小型聚会,当时谷歌还在一心一意地做网络搜索。凯文与谷歌联合创始人拉里·佩奇攀谈中提到,“我还是搞不懂,现在有这么多搜索公司,你们为什么要做免费的网络搜索?”但佩奇的回答让凯文,其实也会让所有人难以忘怀:“哦,我们实际上是在做人工智能。”
所以,当浙江省海创科技交流研究院驻京代表赵峰先生将谷歌的第一位华人工程师介绍给我的时候,我马上就想到了这段对话,并特地确认了下。
于是,我急速的推进了周哲先生和他的同事、也是谷歌同事,或者按国内的风格称之为谷歌校友的黄博文先生一起来到了杭州,为海创院及其合作伙伴做了一场有价值的分享。
在这之前的1月27日,针对人工智能(AI)的各项问题,海创院智库专家、阿尔伯塔人工智能学会中国分会会长陈羡博士以《人工智能的前世今生》为题,作客海创科学沙龙第四场活动,与大家共同讨论人类的机器智能时代到来的机遇与挑战以及人工智能第三次浪潮的未来。所以,我们有了一些基本的知识,但听了两位谷歌校友的分享,我们还是发现对于人工智能的误解,还是很深。
与之前在深度学习重镇阿尔伯塔出身的陈羡博士风格的不一样之处,两位谷歌校友目前专业从事着人工智能的探索和产业化结合探索。因此在报名的时候,我们就要求提交希望通过人工智能想解决的痛点,比如有如何节约保险公司的人力成本、制造业生产资料和生产模式的智能化、珠宝鉴定中人工智能是否可以有效应用,等。对于这些问题,作为一个外行无法评价,却在前一天的接风宴上,周哲先生对珠宝鉴定这个问题表示了极大的兴趣;究其原因,听完整个课程我才略懂一二。
目前人工智能的发展日新月异,如同上个世纪90年代的互联网,人类对人工智能的发现,会在未来的5-10年深刻的影响到我们的工作。无人驾驶技术就如同以前的飞机、移动支付等,属于刚需,当大家体会到它的好处后,就会发现它的坏处并没有那么坏。AI的应用在未来的十年中国会领先世界。美国很多研究成果都是通过论文等形式对外开放,但是只有顶尖的人才能理解,越来越多的高手努力的将论文转化成代码;正如当年旧金山挖矿一样的从这些论文中挖掘宝藏。
周哲先生告诉大家,人工智能并非是我们的发明,而是“发现”;他的重要程度,如同原始人发现了火,和现代人发现了电。在这个发现之前,火和电都是摸不着的东西。电刚发现的时候,只有顶尖的科学家才能理解,而在电灯发明后的很长时间,电的应用也仅仅限于此。所以,目前谁都无法预言人工智能的应用场景会有多大。
跟大多朋友理解不一样的是,周哲先生告诉大家,人工智能并非我们想的那么“聪明”,越传统的行业越需要也越可以得到人工智能的协助。
人工智能的机器学习属于输入型经验学习,然后是深度学习。就目前而言:
AI=深度学习=大数据
在深度学习中,放进去的类型越多越繁杂,AI在学习中根据公式代码来进行分类,这些公式是几十年前就有的,只是当年没有配套的硬件去承担。随着GPU芯片的发展,人工智能才迎来了这个最好的时代。数据标签、数据分类。AI需要大量的数据、数据标签。你能想到的都扔进去,AI会自行学习并识别。自动到什么程度是取决于人的设定。只要人能判断的东西,人工智能高概率的都能做到:视觉、声音、机器人(目前的自动驾驶)。
每一个新事物的出现都会受到传统势力的阻止。周哲也举了一个例子,那就是当年飞机受到地主的阻扰,因为当年美国的法律规定土地之上到无限空间到之下无限都是属于私有财产,所以飞机飞过来必须要交钱,最后最高法院的判决推翻了这些不合理的规定。所以,自动驾驶现在碰到的困难,并非是技术方面的,而是必然会受到出租车行业、驾校等的反对;因为自动驾驶会让这些行业消失掉;当然还有更多法律和社会方面的问题,因为驾驶的安全目前实际已经超过了人类驾驶。自动驾驶的最后成果,是跟着训练它数据的人来走的,而不是跟着技术。正如AlphagoZero的发明,用一台电脑没有任何人类数据的输入,通过三天学习就超过了它的祖宗Alphago。技术的进步让人咂舌。
当有了大量的数据,就需要做大量的处理。先进行数据清洗,再加工,打标签。形成行业的标准是未来的趋势,也就是工业上的数据处理流水线-数据工厂。当数据没有标签时,去找相对应的标签,或者人工做标签,这种情况下5-10年会有更多的就业机会。标签的精细化、准确化,还在经验积累阶段。所以,在这个时候,所以很多人会失业,但同时也会产生很大的就业。所以,人并不用担心太多,关键的是在这个过程中,如何寻找到适合自己发展的道路。目前人工智能趋向标准化靠机械化的学习,而非经验,所以经验性的事情,人类的优势,人工智能还远远不能企及。
想到一个例子,我从小生活在印刷厂,对那个大型的排字车间印象非常深刻,那是中国四大发明对于传承文化具有里程碑的意义;当时有通过“传说”了解到一种所谓的电脑排版,就不用那么多工人在排版了。于是想到了那么多人会失业下岗,但是电脑排版普及的今天,似乎排版员并非过剩,而且还有所不够。因为我们普罗大众是没有能力去构想技术革命后的工作场景。无须害怕,但必须有所准备。比如那个时候,你就想着用电脑去排版,而不是购进因为其他印刷厂更新换代后淘汰的便宜的铅字字模。
那么作为传统行业如何开始应用人工智能;既然核心的算法已经在美国顶尖高校得到了研发;我们中国最大的优势在于各种场景的应用。首先是大量的数据,其次是大量的实验。如同炼金术让爱迪生发现了最合适的用于制造灯丝的材料,我们将大量数据通过大量实验去筛选和整合就能获得各种意想得到或意外的收获。
今天的人工智能大概是5-10岁的小孩智商,未来10-20年也就有成长到18-20岁智商的可能性。在那个时候,你要追赶就已经来不及了。正如十几年前我们的父母并没有想到互联网和他们的生活有什么关系,但微信链接了一切,几乎很少有没有不被覆盖。
因此,未来人工智能的应用,正如互联网与我们无法分开;人工智能,就是要让数据发挥它的价值而不是沉睡。而人工智能的相关工作,更多是在咨询上。因此,周哲和他的谷歌校友创建了子歌集团,它的定位就是人工智能咨询服务,希望理解企业对人工智能的需求,为企业提供量身定制的人工智能服务。
两位谷歌校友通过一个上午和下午一个多小时深入浅出的讲解,让来宾对人工智能有了一个全新的认识。在随后两个小时的问答环节,前来听讲的朋友纷纷从数据的获取、应用场景的设定、人工智能在其行业的各种可能应用与之进行了深入的交流。比如智慧城市:城市管理上,人脸识别、云脑;稽查毒品:毒品更新快、采样判定问题,数据量大但只有样本没有信息,想通过AI技术判定人是否吸毒——吸毒者和不吸毒者的大数据量,传感器;建筑行业的工程师替代问题;珠宝鉴定中如何邀请工程师参与观察鉴定师操作的过程来学习和判定是否有AI改进的可行性;在中小学教育是否可能通过给学生推送的题有针对性、精准化,管理学生数量的增加;在声学领域,语音、声纹的识别和人脸语音个性化识别的成熟度等等问题。直到两位赶着飞回北京,才恋恋不舍的结束了海创学习沙龙的第六场活动。
我也狗尾续貂的发表了一点感想,针对保险公司余先生表达的在理财规划痛点,由于家庭资产的数据量因保密原因和无法量化的问题而难以获取,同时也应该看到因为人工智能的应用,可通过一套完善的程序,客户放心的输入自己的真实数据,获得更加客观的指导意见。针对浙江联泰建筑节能有限公司总经理吕人伟先生谈到的建筑中的图纸审查,我也发表了对高中生选择专业的一些想法,比如在传统的建筑学大类中,土木工程由于需要学生大量的记忆这些规范,是否还有必要去学习,或者说如果大学这几年不从人工智能未来发展的需求出发,在记忆规范方面降低要求,那么是否还是去读建筑学、城市规划更好一些;或者说,未来医疗辅助诊断发达了,那么医学生是否也无须记忆更多知识,但是,如果没有这些知识,是否也会影响到未来作为人类工作最有价值的“经验”的累计,等。
鉴于介绍非本人专业的内容,所以回头还是得总结两句:
首先,人工智能是很傻的,它只能在人类的规定范围内,机械的重复某些动作,正如一个智商5岁的小孩做一个事情1000年,显然就会很熟练。
然后,传统企业更需要人工智能的帮助,因为在传统产业中有很多可以分解出来的机械重复的工作,让人工智能做的更快更准确,从而提升企业的生产效率。这就是子歌存在的意义,以及海创院愿意和子歌一起努力的原因之所在。
顾东东,2018年4月2日凌晨3点
其中1000字左右来自于童勤芳的活动现场记录