任正非为何说华为不能错过“图像时代”?-最极客

任正非擅长谋略,是企业家中的战略家。上世纪八十年代华为创业之初,任正非审时度势采取毛泽东“农村包围城市”战略逐步打开市场,站稳脚跟之后又在华为内部设立“蓝军机制”,通过红蓝军的模拟对抗来保持危机感。在任正非看来,要确保下一个倒下的不是华为,首先自己要知道如何打败华为。此等谋略恐怕只有在优秀的军事家身上才能看得到。

在任正非这个战略家眼中华为的下一个战略高地是什么?问题在2016年底华为举行的一场规模庞大的誓师大会上有了答案。任正非认为华为错过了语音时代、数据时代,绝不能再错过“图像时代”这一战略高地。大会之后,2000名华为高级研发人员和专家被派遣至海外投入到这场高地抢夺战中。任正非为何做出这样一个战略判断并迅速付诸于行动?在经过长时间的行业研究和思考之后我愈发佩服他的远见。

“看见”与“看懂”两手抓

摄像头之于机器就好比眼睛之于人类,前者是后者感知世界的重要器官。摄像头赋予机器识别图像的能力,解决的是“看见”的问题,而人工智能是机器的大脑,负责的是计算和处理图像的能力,解决的是“看懂”的问题。就好比眼睛让人类“看见”世界,人脑通过视觉神经接收到视网膜传来的信息,让人类“看懂”世界。

在我看来任正非所谓“图像时代”应该包含“看见”和“看懂”两个部分。他曾在一封邮件中说:“我们要做的平台是要能支撑传送未来的图像,需要解决视频类的算法问题。”我对这句话的解读为华为未来不仅要掌握生产、承载、传输未来图像(VR、AR图像)的能力,还要具备对这类图像的分析处理能力,后者比前者要复杂的多,换句话说“看懂”比“看见”的问题更难解决。

2016年5月份美国俄亥俄州一名特斯拉ModelS在自动驾驶模式开启状态下径直撞向一辆正在横穿马路的大货车,导致车主当场死亡。几个月之后的调查结果显示,特斯拉ModelS紧急刹车功能失效的原因是前向摄像头误将大货车的车体当做蓝天白云背景的一部分,随后因为这个误判又导致车辆搭载的长距离超声波传感器出现误判。简单来说,车辆前向摄像头“看见”了障碍物却没有“看懂”,最终导致事故发生。这个事例足以说明图像识别和处理技术的重要性。

当然,华为是不会涉足汽车产业的,任正非也明确表示华为做图像技术并不是要研发电视机等图像产品。显然华为致力于图像技术一方面可以将成果应用与现有业务和产品,比如智能手机。另一方面也有抢占产业上游位置掌握市场主导权和话语权的战略目的。

华为要想在图像技术方面取得领先,竞争对手不只是苹果这样的智能终端厂商,同时也包括谷歌、百度这样的互联网巨头。百度的人工智能机器人小度就曾在国内一档节目中展示了优于人类的图像识别和计算能力,在模拟的场景中成功帮助警方抓到“劫匪”,这个过程就是从“看见”到“看懂”的过程。在图像识别处理领域,机器的能力已经超越人类,这个趋势不可阻挡。华为能做的就是“看见”和“看懂”两手抓。

“入口”和“出口”两头占

过去业内有观点认为互联网的本质就是“流量生意”,更激进的说法是流量是一切生意的本质。雷军也曾宣称小米的本质就是一种新的流量经营方式。而提到流量就不可避免地提到“入口”,因为任何流量都必须有流动的入口,因为这个原因,“入口论”被许多企业奉为圭臬。

图像的入口是什么?毫无疑问是能够承载传输图像的终端,也就是任正非所说能够支撑传送未来图像的平台。包括华为、苹果以及ARM这样的芯片巨头投身图像处理技术领域,目的并不只是单纯为了提高产品的拍照和色彩还原能力,而是赶在下一代图像内容爆发之前率先具备承载、传输、处理未来图像的平台和能力。这也同时意味着率先抢占了未来图像内容的入口。

反过来看,摄像头是图像内容的生产工具,大量的图像和视频内容由摄像头拍摄,而后通过互联网分发至全世界的终端使用者。任正非在华为与徕卡签订战略协议时说:“未来将有90%以上的流量来自图像和视频。”相信在经历过2016年直播产业的爆发之后,没有人会觉得这句话过于偏激。从本质上来说,数以千万计的主播做的事无非是通过摄像头的图像识别和处理能力将自己的图像和视频内容分发出去。

从这个层面来看,摄像头又是图像内容的出口。智能手机在全世界范围的普及让每个人都成了图像内容的生产者,这对华为、苹果这样的终端巨头来说是一个巨大的“流量生意”,要想做好这笔生意就必须具备图像处理能力,将图像内容的“入口”和“出口”都占据。

由“平面”过渡至“空间”

凯文·凯利在《失控》一书中借一段福音感慨时代的快速变革,他说“新的到来,旧的逝去。”对于图像处理技术来说,平面拍摄时代正在逝去,属于空间拍摄的时代正在到来。这得益于AR、VR技术的发展,尽管此类代表着未来的内容仍然未能全面爆发,但这一趋势已经不可否认。

我曾在一篇有关直播产业的文章中说,直播是媒介在移动互联网时代一次不可避免的形态变化,信息承载量更大,更为直观的视频直播取代文字图片成为主流媒介是情理之中的事。的确,尽管文字不会死去,但它正逐渐对用户失去吸引力,取而代之的是图像(图片和影像)。作为媒介形态的一种,图像技术的发展一定会无限逼近于真实的信息再现。同样,VR技术的本质就是对真实场景高度还原,直到能够对用户带来视觉上的欺骗。

不过VR这一被视为未来图像的技术却始终未能全面爆发,原因在我看来并非是VR设备不够优秀,而是VR内容的生产者太少。仅有的VR设备用户也只是被动的VR内容接收者,而不能同时作为生产者。而智能手机的用户既是图像内容的接收者同时也是生产者,这是图像内容在移动互联网时代井喷的原因。假如将VR镜头应用到智能手机上,VR内容的生产就不再是个问题,每个人将既能通过手机观看VR图像,同时也能拍摄VR图像。

这并不是个不切实际的设想,许多智能设备厂商已经尝试将VR镜头应用于终端产品上。在VR领域有所布局的微软、索尼、HTC,包括华为,未来都有可能推出搭载VR摄像头的智能手机产品。有理由相信VR镜头未来会像双摄像头一样成为智能终端设备的标配。那时,平面拍摄的时代将彻底终结,而空间拍摄的时代将正式到来。

我想这就是华为与徕卡共同设立麦克斯·别雷克创新实验室致力于VR、AR技术研发的战略出发点所在。不妨试想一下未来的某一天当你打开一个直播间,看到不是一个平面的视频影像而是一个基于三维空间的、立体的VR视频直播,那时想必你将会对任正非所谓“图像时代”有一个切身的认知。

任正非说华为缺少的不是能力,而是战略意识。“绝不能再错过图像时代”的战略既定,剩下的一切交给能力。