CTO赵勇深度解析格灵深瞳的核心技术

2015年3月26日 16:48 阅读 1700
大家好,我是赵勇,我是格灵深瞳的联合创始人,也是CTO。有很多朋友对格灵深瞳以及我们的技术非常感兴趣,我来给大家介绍一下格灵深瞳是怎样的公司,我们的产品是什么。



格灵深瞳是一家计算机视觉公司,我们给用户提供的产品是完整的计算机视觉解决方案。我们的解决方案给用户提供视觉分析(例如人、环境和汽车的行为分析)的结果,并且基于这些结果给各行各业的用户提供服务。目前,我们的业务范围包括安全、业务规范检测、消费者行为分析、智能汽车以及智慧城市。在不远的未来,我们还会提供通用的视觉分析产品,供各个行业在我们的视觉分析结果的基础上进行二次开发,给他们关注的应用服务。

格灵深瞳的技术核心是基于三维深度视觉信号处理技术的视觉传感器网络。没错,我们的产品是以网络形式出现的。在我们的网络中,每一个传感器不仅仅可以识别自己视野里的目标,还可以和网络中联通的其他传感器一起协同工作,在网络规模下发挥更大的作用。

我们的产品不是传感器元件本身。我们不是微软Kinect,不是PrimeSense,也不是Asus Xtion。事实上,传感器公司是我们的合作伙伴。我们的传感器网络中适配的也不仅仅是一款三维传感器。因为不同的传感器能力和适用条件不同,有时候我们也需要把多种传感器集成在一个外壳下。目前,格灵深瞳正在和几乎全世界所有的三维传感器公司合作,把这种伟大的技术带到各种完全不同的应用领域。目前我们的产品线包括适用于微小空间的手势识别、适用于室内中等空间和室外大空间的行为识别,适用于汽车的全天候路况和驾驶安全识别,以及适用于道路检测的车辆和行人行为识别。

既然我们是软件公司,那我们和微软的Kinect,以及PrimeSense主导的OpenNI等人机交互技术有什么区别呢?上述两种技术解决的问题是在近距离空间里的人为了和面前的计算机之间进行主动交互的姿态识别问题。这样的技术是专门为了游戏机和电视遥控等客厅场景设计的。而格灵深瞳面对的客户场景更大,人更多,人们的行为不是为了配合交互而且更加复杂,因此往往要处理人与人之间的重叠遮挡问题。格灵深瞳在人体动作分析方面的技术是专门针对这种现实场景的挑战而设计的。

计算机视觉技术是一项复杂且仍在发展成熟中的技术。我们常说,我们的使命是让计算机看懂这个世界。在格灵深瞳创立的两年时间里,我们更加清晰的看到这项技术在各行各业中的巨大价值。格灵深瞳的目标是帮助我们的客户看懂他们的应用场景,并赋予他们深度理解他们自己领域里问题的能力。智能化的安防监控仅仅是格灵深瞳产品的一个很好的应用。在我们的帮助下,银行不仅仅可以用少数人力对超大型(数以万计)摄像头网络进行切实有效的监控,还可以清晰的了解银行内部很多操作流程的规范化程度。而这仅仅是一个范例。在百货商场,格灵深瞳帮助实体零售客户深刻地了解顾客的体验和需求,帮助他们更好的服务他们的顾客。未来,我们,以及基于我们通用产品的开发者们,会把这种能力带到更多行业,让更多的用户受益。

相比传统的两维视觉技术,深度视觉帮助我们在很多新的领域里实现了更强大、精确、稳定的视觉理解功能和性能。深度视觉还帮助我们大大降低了应用深度神经网络学习技术的成本,使得我们可以在成本更低的硬件平台上,高频的使用深度学习技术。在我们目前的产品中,我们不仅仅在一个小小的外壳下,集成了深度和色彩图像传感器、动作传感单元(IMU),还集成了一颗196核的处理单元。整个传感器只需要一根网线就可以驱动,并连接到后台的传感器网络中参与协同工作。

最后,我要透露格灵深瞳下一个产品目标:智能道路和智能汽车。目前,我们正在为了实现这个新的目标废寝忘食地工作。对人工智能感兴趣的伙伴们,期待你们加入格灵深瞳,或者等着我们的好消息吧!



更多精彩内容,欢迎关注微信公众平台“格灵深瞳”。

格灵深瞳是一家行业领先的人工智能上市公司,提供面向智慧金融、城市管理、商业零售、轨交运维、体育健康、元宇宙等领域的人工智能产品及解决方案。