移动互联网时代结束,未来“人工智能”当道?
2016年11月16日下午,第三届世界互联网大会拉开大幕,其中最引人关注的无疑是世界互联网领先科技成果发布活动。颇值一提的是,在今年百度世界上亮相的“百度大脑”成果入选15大领先科技。
无论以任何谨慎的态度判断未来,受益于人口红利的移动互联网时代都已来至增长的末端,在世界互联网大会开幕当天下午的全体会议上,百度CEO李彦宏认为,移动互联网时代结束,靠移动互联网的风口已经没有可能再出现独角兽了。而接力棒的继任者看起来已达成共识人工智能。譬如大洋彼岸,谷歌CEO桑达尔·皮查伊就寄语这家公司从“移动设备优先”转为“人工智能优先”,因为“放眼未来,‘设备’的概念将渐行渐远。有朝一日各种外形的计算机将会在我们生活的各个方面,扮演智能助手的角色。”
未来已经在发生,人工智能仿佛一个植入系统,已经改变了搜索引擎,电子商务,金融,媒体,交通,人机交互等生活的日常片段,并期待自己如百年前的电力系统一般为人类延伸出更多的可能。
而这种延伸与植入需要某种集大成者的“技术端口”——换句话说,能为某个行业带来技术升维的“大脑”,譬如在中国,今年9月1日,百度便对外详细披露了其人工智能的核心百度大脑。
两年前,百度曾宣布这颗大脑达到了2—3岁儿童的智力水平,如今百度称它已在部分能力上超越人类。就像吴恩达——这位Google Brain项目的缔造者所言“百度最重要的产品都大量依赖人工智能,包括搜索,广告,糯米,自动驾驶等等。”而百度大脑正是为这些人工智能项目赋能的核心。
所以无论从何种角度,拆解这颗“大脑”,都有助于了解这家公司以及未来科技世界的样貌。
大脑全貌
大体而言,这颗“大脑”由三股合力共同拼接超大规模神经网络,计算能力以及海量数据。逐一拆解模拟人脑神经元组成的超大规模神经网络可支持万亿级参数,千亿样本以及千亿特征训练;这颗大脑的计算能力则基于数十万台服务器和国内最大的GPU集群;,数据量亦无需赘言,百度握有包括全网万亿网页,数十亿级搜索数据,百万级图像视频数据和百万级定位数据。
在现阶段,百度大脑上述三股合力落地于四大能力之上语音,图像,自然语言处理以及用户画像。先来说语音——其又包括了语音识别技术与语音合成技术百度深度语音识别技术Deep Speech2基于“端对端”的深度学习技术,准确率为97%,这也让它入选了《麻省理工科技评论》“2016年十大突破技术”;而语音合成技术则运用最新的深度学习算法,得以让语音合成效果如真人一般逼真且赋予情感。
而图像能力又包括人脸识别和OCR识别、AR(增强现实)、无人车视觉能力、颗粒度算法等多个维度,以人脸识别为例,识别准确率达到惊人的99.7%;采集全景图片时,可以利用OCR技术自动进行目标识别,实现百度地图中的POI,导航等信息的快速更新。同样令人惊异的还是百度大脑的自然语言处理能力——让机器听懂人类语言无疑符合人们对未来的想象,百度就可基于自然语言处理技术,结合基于大数据挖掘产生的知识图谱及相关技术,对自然语言进行分析,理解,生成,翻译,最终实现人机对话交互。
,用户画像能力则是对每一位具体用户的全盘描绘,通过技术勾勒出虚拟世界中呈现的真实人格。如你所知,百度系产品拥有10亿日活量,基于大数据,机器学习等技术将这些数据划分为千万级的细分标签。目前百度用户画像分为两个维度,垂直画像支持金融、保险、生活服务、零售、旅游、房产、咨询等深度行业应用,通用画像基于人口属性、位置、长期兴趣、短期意图、APP偏好等描绘用户画像,支持全行业的个性化应用。
而倘若细化这颗大脑的技术底层逻辑,在我个人看来,除了PaddlePaddle深度学习平台(百度大脑的算法模型)以及作为技术基础的AI超级计算机,如前所述,百度惊人的数据量,是让这颗大脑飞速运转的最大“养料”——事实上,这很容易令人想到吴恩达著名的“太空飞船理论”从事人工智能研究就像是造太空飞船,高性能计算能力是引擎,数据是燃料。
嗯,你知道,在民间乃至包括霍金在内的精英描述中,未来的人工智能会像洪水猛兽一般侵蚀人类社会——尽管漫长的生物史告诉我们,一个物种“彻底取代”之前物种成为星球主宰的故事从未发生,但却不妨碍它成为多数人关于人工智能的最佳谈资。
真相并非如此,事实上,虽然技术发展迅猛,但近些年来一切人工智能领域的进步,几乎都可归为相似的框架即“输入数据,生成回应”(其中以深度神经网络最为人所知)——而这需要海量数据的“喂养”,拿百度大脑功能之一的语音识别来说,准确率97%的背后是无数小时的输入语音数据和语音转录文本数据。换句话说,在人工智能的主战场,数据本身即是最坚实的护城河。
人工智能+时代
李彦宏在谈及人工智能的影响时说“人工智能其实也是从今年开始变得很火,每个人都非常关注。它会给我们每一个人、每一个行业、每一个国家带来什么样的变化?其实我觉得很多人还没有完全想清楚,每每当我想到这些可能性的时候,我都觉得非常兴奋。”
其实在我看来,通过百度大脑——这一现在人工智能技术集大成者的能力所及,倒是一个回眸人工智能发展阶段的不错机遇它现在究竟发展到哪一步了?
用吴恩达的话说,,只要人类在正常情况下1秒就能做的事,人工智能现在几乎都可以做到。譬如上文提到的图像识别,“你在看到一张照片时1秒就可以看出上面发生了什么,图案是什么颜色。既然人类可以很快辨别出这些问题,那么人工智能也可以做到。”
,拜数据所赐,人工智能在“由过去推导未来”的预测能力上已颇有建树。譬如百度大脑的用户画像,一个具体的例子是,百度大脑利用用户画像技术帮助电影《魔兽》实现了精准的广告投放,并最终达到200%的票房增长。
了,在吴恩达看来,人工智能未来最值得期许的价值皈依,是《Her》里如萨曼莎那般不可或缺的“私人助手”(我知道电影里她不只助手那么简单……)。事实上,未来的雏形已初见端倪,仍拿百度大脑的应用举例——度秘。要知道,度秘集语音识别,图像识别,自然语言理解等技术于一身,并在真实的用户服务场景中积累数据,不断得到训练,无论是“KFC首位机器人员工”,“高考志愿填报小秘书”,还是“史上首个人工智能解说员”,与各个行业的嫁接,让人依稀看到那个最理想的“通用型人工智能”并非遥不可及。
而谈及嫁接,度秘的“母体”——百度大脑,显然是个更好的例子。如你所知,百度已经宣布将向各个行业开放百度大脑平台,衍生出不同领域的行业大脑。
上个月,百度正式发布人工智能在医疗领域内的最新成果百度医疗大脑。它可以从百度亿级用户医疗健康类数据及医学论文,指南和教材中,针对900多种常见疾病进行辨别。百度医疗大脑在线模拟医生问诊流程,与用户进行多轮交互,并从中收集、汇总、分类、整理病人的症状描述,完成与海量数据库中的样本匹配,并快速推导使用者患某种疾病的可能。可便捷智能地服务百姓疾病自检,助力提升基层医生的临床诊断效率与诊断质量。而在未来,百度医疗大脑的计划是能打造成开放的医疗智能平台。
嗯,如今“互联网+”余温退热,更高阶的“人工智能+”成为热门话题,在我看来,这个“+”尤为关键——当医疗大脑诞生,你完全可以期待诸如交通大脑,金融大脑等各个“大脑”的脱颖而出。
更进一步讲,大体而言,人工智能与大数据的落地有两片最肥沃的土壤第一是可被轻易体察的2C市场;第二是垂直行业,而相比于洞察个体的轻巧与迅捷,数据价值在行业中的落地无疑要相对沉稳——毕竟,理解一个拥有无数细碎分工的行业总要比理解一个具体的用户困难些,也正因如此,沉稳之后的爆发才尤为可期。对百度而言,百度大脑的未来应用是一个更恢弘的愿景。
想说,其实正如李开复所言“大家对人工智能讨论的重心都放在了它是不是在模仿人脑,‘奇点’是否即将来临这样的问题,却没有真正关注人工智能对我们的现实影响。”确实,倘若从现实角度,“意识”这东西,无论它是进化而来的一个“副产品”还是某种“精神污染”,不妨交给上帝未来的眷顾吧,相比冀望“照抄”人类大脑思维,在不同现实行业锻造出可以落地的“机器大脑”也许才更具意义。