90后清华博士为AI“杀毒”,砌起安全墙
他创办的北京瑞莱智慧科技有限公司要做第三代人工智能,为AI安全发展保驾护航。瑞莱智慧是RealAI的音译,由清华大学人工智能研究院官方发起设立,清华大学人工智能研究院院长张钹院士和清华大学人工智能研究院基础理论研究中心主任朱军共同担纲首席科学家。参与承担科技部、工信部、公安部、发改委等发起的多个国家级重大项目建设任务。
田天说,AI归根到底还是一项有用的技术,但算法、数据、应用层面的安全可控问题有待突破,不能简单停留在功能层面的或修修补补。AI产业要真正做到顶天立地,得先立地,也就是加强基础层领域的技术研究,这就好比打好地基,是整个产业发展的最坚实基础。
他擅长理性规划,制定目标和路径后逐步推进。但在创办这家企业前,他并不知道自己究竟是否适合创业。“但一旦开始做起来,很多问题就一定要去解决掉,包括公司的战略制定、管理、产品研发、销售推进。”田天说,自己的创业信心越来越足,对市场和第三代人工智能的判断越来越清晰。
1991年,田天出生于西安一个教师家庭。上小学时接触到计算机便萌生了兴趣,那时父母上课要用到电子课件,他觉得有意思,也开始自学PPT。从头建立一个网站、制作一个flash动画,对他来说是非常有成就感的事,甚至把自学经验总结出来发表,得到500多元稿费。
对计算机的兴趣越来越浓厚,他开始学编程,不断跟进计算机知识。2009年,18岁的田天凭借高中物理竞赛全国金奖保送进入清华大学计算机系,之后免试就读清华大学计算科学与技术专业,在这里,他完成了硕士和博士学业,主要研究方向是贝叶斯机器的理论、模型和应用领域。
“整个行业得到了很大的促进,热度升温了很多。带来的直接变化就是更多的人进入到这个领域,很多人开始尝试它在不同方向的产业化。”深度学习在技术、数据挖掘、机器翻译、自然语言处理等领域取得成果,“最开始大家觉得人工智能能力非常强,能够解决很多问题。”
但人工智能在越来越多的关键领域落地,特别是金融、能源、医疗等高价值领域的应用与财产安全、人身安全甚至社会安全紧密相关,对人工智能的安全、可靠、可控要求越来越高,一旦出现不可控,带来的损失是巨大的。
传统AI技术局限凸显,第三代人工智能的理念出现了。早在2016年,张钹院士就曾提出发展“第三代人工智能”的理念,利用知识、数据、算法和算力4个要素, 建立新的可解释和鲁棒的AI理论与方法,发展安全、可信、可靠和可扩展的AI技术。
2018年,清华大学设立人工智能研究院,张钹担任新研究院院长,聘请图灵奖得主姚期智院士作为学术委员会主任。2019年,清华大学宣布成立人工智能研究院基础理论研究中心,以期建立第三代人工智能基础理论和方法体系,清华大学计算机系长聘教授朱军被聘为研究中心主任。
博士阶段,田天师从朱军,他所从事的也是与第三代人工智能相关的研究,包括机器学习算法与众包知识的整合,提高AI在有噪声的数据和标注情况下的训练和预测表现。2018年拿到博士学位后,田天没有去互联网大厂,而是把读研期间一直想做的事做了:办一家公司,把手里的技术落地。
“做这件事的想法和决心在读研期间是一直都有的。”田天说,当年瑞莱智慧最初的创始团队都是“清华同一个团队的”,“大家在一起配合了很长时间,非常有默契。”创业也是一拍即合,走出清华校门,寻找办公场地。公司成立后,他白天忙于业务和管理,晚上钻研技术路线和产品方向。“第三代人工智能能够应用的领域非常广,所以对于我们来说,反倒要去筛选,到底哪一块更需要我们的能力和产品,哪一块能让我们在市场产生相应优势。”落地场景的选择并非完全一帆风顺。
早期一些慕名而来的客户对田天团队提出AI需求,团队接到需求后研发再交付客户。但他们很快发现,这些主动上门的需求中,有时候客户搞不清楚现在AI到底能把问题解决到什么程度。有些需求听上去更像科幻,更多时候,客户所积累的数据并非是解决问题所需的数据,甚至没有数据。
“当时期望高就高在我们想做出来的是一个真正可靠、可解释的系统。”需求本身没有问题,但很快被现实打败。当真正下手时发现,人工服务积累下来的旅游数据距离AI可用还有很大距离。从游客的角度,“他的需求到底在什么地方、他为什么提出这个需求等等,并没有得到很好的记录。”
在数据不足情况下,模型输出效果并不理想。要么继续积累更多数据,要么通过前期研发把算法做到能实现智慧旅游的程度,但后者又需要高额投入,而客户的预期是用相对合理的成本实现能力强大的AI。经过一段时间尝试后,他们觉得这样的项目现阶段并不合适公司的技术方向。
在电网领域,AI图像识别系统可用于电网智能监控,判断高压线周围有无危险品。但如果为了恶意破坏基础设施,在危险品上加装花纹等特殊对抗样本,“AI图像识别算法就没有办法认出危险品了,那就有可能导致危险品出现又无法检测到,甚至一些地方起火了也检测不到,图像识别算法完全被消除。”
如果通过搭载的攻击算法对系统进行模拟攻击,然后评估系统表现,综合给出安全性评分,并指出安全漏洞在哪,用户再通过搭载的防御方案就可以针对性地加固提升。田天说,这套人工智能安全平台类似于杀毒软件,发现安全隐患的同时进行安全防御。
田天说,这种AI防火墙和传统网络安全防护墙类似,不同的是防护对象是算法,它可以提供对抗样本攻击、深度伪造攻击等算法攻击的检测,除了应用在人脸识别领域,对目标检测、图像分类、自动驾驶系统也能防御部署。
“在金融领域我们做建模、风控等,虽然做的是金融模型,但这个模型底层都是基于隐私计算平台来搭建的。”相比传统不考虑隐私的建模方式,基于隐私计算平台的金融模型可以确保所有明文数据在原始的存储方不出库,保证密文计算效果。
根据场景选择技术,在这个90后的带领下,瑞莱智慧在政务、⾦融、能源、制造、互联⽹等领域落地,提供⼈脸识别系统安全、自动驾驶系统安全、深度合成和伪造检测、隐私保护计算、AI攻防靶场等产品和方案。在业务路径选择上,田天说,原本最早定位于“AI基础设施”,在市场里摸索后目标市场更细化了,他们把目光锁定在“更安全的AI基础设施+更智能的上层应用”。“在这些领域,目前相对来说能够提供类似能力的厂商比较稀缺。作为一家技术公司,我们在里面可以取得更高的话语权。”
田天是个典型理工科特质的创业者,擅长理性规划,制定目标和路径后逐步推进。他觉得90后创业者是更敢想、更愿意突破的一群人。他们选择颠覆性的创业方向,特别是硬科技创业需要把握核心技术不断迭代,保持技术前沿性。
但要经营好一家企业,基础的素质和能力是相通的,比如领导力、韧性、学习力等。田天说,在创办这家企业前,他并不知道自己究竟是否适合创业,很多事情也不了解,大到销售商务、财务法务工作本就在学校时接触不多,小到办公室选址、装修也需要花时间思考。
从当初六七个人的小团队发展到如今规模近200人,核心成员均来自清华大学、北京大学、中科院等。他带领的团队参与承担了科技部、工信部、公安部、发改委等部委发起的多个国家级重大项目建设任务,包括科技创新2030-新一代人工智能重大项目中“安全大脑新一代人工智能创新开放平台”的建设、工信部揭榜项目新一代人工智能产业创新重点任务、人工智能关键技术源头创新专项等。
他认为国内AI产业偏应用,基于成熟的算法做微调,提供解决方案。“但第三代人工智能是理论上的突破,需要很多人研究AI底层,国内相关领域人才没有那么多。”这是将第三代人工智能推向舞台中央的一个大挑战。
在商业化之前,田天团队里的研究⼈员已经坐了多年冷板凳。技术产业的发展趋势,前期会经历高峰期,紧接着会有低谷期,后期会进入一个平稳发展阶段。这几年,他的切身感受是人们对人工智能的态度越来越冷静、理性。