前百度首席科学家吴恩达,离开了供职三年的百度,开启属于自己的“人工智能新篇章”。吴对百度,只剩下感激。
离开亦是开始
他的离开,已经有人众说纷纭,有说是不适应百度的企业文化回到硅谷工作的,也有说找到一个值得深耕的领域计划专注研究的。对于百度而言,或许这真的是一个损失,毕竟一家技术至上的企业就要失去最高的主心骨,但也可以认为百度已经悟“够”了科学家的技术,更想在商业方面做出推进,但吴可能并不是最适合。而技术层面的东西,让那三年里迅速膨胀的1500干将的团队,再去慢慢挖掘。
刚被挖掘的AR
其实百度已经在AI方面尝到了一些甜头,例如AI之下最重要的一个分支:AR增强现实。在AI技术还未全然展示它的手脚时,AR在某些行业上初露端倪。例如营销,百度地图在16年国庆期间推出的AR捉生肖,让Pokemon Go阴影下的国人,零门槛地体验到了AR+LBS游戏的乐趣。后续阿里、苏宁等都纷纷跟随,它可谓是引领了16年下半年的AR+LBS大军。据百度内部人士透露:AR捉生肖获得了很好的营销效果。
而其实在百度的心中,AR能做的实在是太多了。据官网的概述,AR包含了多媒体、三维建模、实时视频显示及控制、多传感器融合、实时跟踪及注册、场景融合等新技术与新手段,提供了一般情况下不同于人类可感知的信息。这是感知信息的一个新的方式!也是吴恩达立下的种种Flag。
可借鉴的AR生态
现在吴恩达走了,挥一挥衣袖,不带走一片云彩,只留下略显懵逼的大家。下面就按着吴老师的思路,重新捋一下百度AR的技术战略,我想会适合所有AR方面的工程师和创业者。
触发机制
这是大多数人心中认识最多的AR模样。但吴老师把这个阶段的AR阐释为一种触发机制,就像扫描二维码访问主页,这里的二维码就是一种触发机制。同理,AR识别图像特征,也可以出发某种反应,比如最初的AR识图出现动画模型,或者出现翻译等等……
核心技术:图像处理
主要形式:2D图像AR、3D物体AR、手部AR、脸部AR、LBS-AR等丰富的触发机制
应用前景:AR早教,AR营销
三维感知
这是目前很多创业公司,不论成熟与否,都在寻找解决方案的部分。Hololens和Magic Leap的Demo正是因为在三维感知领域做了一些事情,才更为人所知。另外,三维感知对于硬件的要求很高,涉及到系统集成的问题,而且外界光照等环境干扰,让三维数据的感知比二维的识别难了不止一个量级。当下急需解决的可能是三维数据的获取问题,以及如何提高跟踪速度,抗遮挡、快速重定位和抗运动模糊。
核心技术:三维感数据感知与处理
主要形式: 2D/3D物体跟踪,SLAM/VO,大规模三维重建等
应用前景:科幻电影版的工作场景,无屏时代
渲染引擎
这一部分对于AR来说,改善的是用户体验。毕竟尝鲜只是风口,是不会推动一个领域的发展的。举个简单的例子,为什么愿意去电影院看电影?因为体验不同。看直接拍的视频,无法和欣赏通过后期处理的大片相媲美。百度希望自主研发一款跨平台的渲染引擎,引擎算法侧重于虚拟物体和现实环境的融合。
核心技术:未知,可能是计算机图形学渲染和图形处理技术。
人机交互
这一点是在AR显示和内容都成熟后,不能不面对的问题。其实已经有很多公司在专注于此了,比如手势识别模块,语音模块的研究团队,相信无论未来AR端如何变化,这些模块终有用武之地。如何让识别效果达到更好,准确度更高,是很多团队都在关注的事情。
核心技术:语音识别,手势识别,交互跟踪
百度希望借助以上四种技术,将营销、LBS生活服务、娱乐、教育和游戏等涉及AR的领域体验变得更好。
上图是百度的AR产品与服务战略,它希望为用户提供解决方案的同时,可以肩负内容定制的使命,包括线上线下的分发,甚至开发者生态的构建。
总结
希望上述的“Flag”,可以在不久的将来被完全实现,可以看到更多的案例,不仅来自于百度,还来自于你。
来源:AR酱
发表于2025-09-26 17:34:00
发表于2025-09-26 16:00:00
发表于2025-09-25 15:29:00
发表于2025-09-24 17:07:00
发表于2025-09-23 14:58:00
发表于2025-09-22 17:18:00
发表于2025-09-22 17:11:00
发表于2025-09-19 11:37:00
发表于2025-09-19 10:38:00
发表于2025-09-18 14:50:00
京ICP备11027698号 CopyRight 2010-2015 All Rights Reserved