陈建文:没有完美的大数据,现实世界都是小数据
在国内AI领域的印象中,陈建文是一位创业者兼学者,他担任电子科技大学视觉智能研究中心主任。然而,这个学者的身份并非严肃型,而是跳脱型、开放型,这主要体现在他深思熟虑且多口径表达上。
在一次国内AI创新峰会上,我第一次见到了陈建文,当时作为主办方特邀嘉宾,他不时地提出令人震惊的观点。这次,在2017CJ会议上,我们再次相遇,因此有了以下对话。经过一周零散整理,文章终于成形:
人工智能技术拥有61年的历史和复兴的希望,这种持续的复兴很大程度上依赖于关键技术的不断升级与突破。这些关键技术包括感知技术、深度卷积神经网络、大数据以及模式识别等。但对于浸淫AI领域十多年的陈建文而言,事实并非如此。他似乎有着自己独到的判断。
“人工智能之所以能长盛不衰,是因为它是未来的趋势,是科技发展的大势所趋,无人能抗拒。”就像我们70年代80年代看过的科幻片,如《阿凡达》、《星际迷航》、《骇客帝国》,未来场景基本一致,大同小异。除了这一原因外,还有一点,那就是人类对未来的向往正是这种向往推动了技术进步。
想象一下,将来机器人与你交谈陪伴你做各种事情——今天看到的一切都描绘了一幅令人向往的情景。在一个四川举行的人工智能学术会议中,一位参会者说:“我们以前读比尔盖茨,他讲述未来,就像科幻片,但今天看来很多已经实现。”
因此,从我看来,每个时间点都会有不同的技术出现,每个时间点的成就都不一样。“模式识别”、“机器学习”,这些其实都是随着计算能力增长和算法突破逐步出现和实现的事物。例如神经网络已被用于解决各种问题,如机器视觉和语音识别,这些问题传统基于规则编程难以解决。
对于直播和交互来说,我们发现虚拟世界与现实界限之间的一个趣现象,比如日本动画《哆啦A梦》最终结局什么?主角某天大梦初醒,发现头上插了东西。而剧中的康夫、小静等人物其实是在虚拟世界里的虚拟角色,他们可以飞翔,可以打开任意门穿梭到另一个地方。这跟我们看到的魔法(如《骇客帝国》)或《盗梦空间》/_阿凡达_所描绘的情景,有本质区别吗?
“所以我认为,在将来的100年里,虽然所有研究员、工程师、博士资本都追求这个方向,但无论如何达到目标,都需要算法去解决。我建议,你应该反过来思考直播的问题。”
举例来说,如果我在上海,你在南京,只要一直播线,我就能看到你站在旁边。这就是视频直播;如果是VR直播呢?你会感觉到我就在你旁边,但这又是一个截然不同的形态;全息直播呢,又将呈现另一番情景。
因此,对于视频直播技巧,它也是虚拟现实阶段性的表现形式之一。在广义范围内,所有AR/VR都属于人工智能范畴,它们核心技术也都是AI技术。虚拟现实完成的是AI视觉应用场景及用户接口,也就是为什么Facebook扎克伯格认为VR应用还需至少十年以上才能进入普通人的生活但仍重兵押宝这个领域,“2015年讲直播视频、2016年讲VR,将来可能还讲更多”。即按键一按,我出现在你的房间里,并且就在你的旁边,然后聊天结束后,说‘哥们,我回上海了’,再按一下,就回来了。而传输的是我的影像,不一定是我自己,而可能只是一份呈现在你那里的影像而已”。
回到30年前,当人们尚未考虑到智能家居或智能音箱时,现在情况显著不同。当我们还是小孩子的时候,我们无法想象家里会有汽车,而如今我们的儿女出生后家庭通常就会拥有一辆或几辆车!同样地,即使目前智慧居住产品尚未普及,但它们必将成为家庭不可或缺的一部分。
从算法环境等因素考虑 智慧居住设备及声音控制系统皆为接口设备,其未来形态可能并不仅限于当前所熟知之形式。“想象一下,只需站立便可出现标准全息女性,她跟随指挥,与您交流,那便构成了智慧居住环境。”
至于市场上的众多流行声控产品,如亚马逊Echo, 谷歌Google Home, 苹果HomePod, 小米的小爱同学, 阿里巴巴天猫精灵X1等,由陈建文所见,它们代表了一场针对传统声音输出设备及住宅概念理念的大变革。他提醒商业化赋予其强大的工具属性:“只要方向正确,就不怕道路遥远。”尽管如此,他也意识到中国智慧家居行业尚需形成产业链,以避免最后只有巨头公司能够应对市场整合需求:“哪个公司能以声音为入口整合家居内部所有内容,便是未来。”
总结而言,对于AI更倾向于其工具性功能,比如帮助盲人看见路,或快速找到物品。此类AR/VR亦应当具备更多工具属性而非单纯玩具用途。在家庭背景下的智慧家居及声音控制系统,其核心必须保持工具性,而非外观造型。“智慧家居及声音控制行业背景及其应用非常广泛”,他认为商业化过程需要时间形成完整产业链,为此提供支持,并期待未来它不会受到固定的形态束缚,因为理想状态下,它应该无固定形态存在—它可能只是墙面上的按钮或者甚至是一个机器人/虚拟助手。”