徐匡迪院士之问揭开当下中国人工智能虚伪的面纱
中国有多少数学家付出到人工智能的基础算法研究中?”五一前成都召开院士沙龙活动,中国工程院院士徐匡迪等多位院士的发问引发业界共鸣,被称为“徐匡迪之问”。这一对当下中国人工智能直击核心的提问,不但表明了当下中国人工智能进步的短板,同時也揭去了披在当下所谓“人工智能”算法外表华丽的面纱。
“我国人工智能领域真正搞算法的科学家凤毛麟角。”4月28日超声大数据与人工智能应用与推众多会,东南大学生物科学与医学工程学院教授万遂人表示,“徐匡迪之问”直击我国人工智能进步的核心关键问題,“倘若这种情况不改变,我国人工智能应用很难走向深入、也很难得到重大成果”。
人工智能是计算机技术进步到资深阶段,融合了数学、统计学、概率、逻辑、伦理等多学科于一身的复杂系统。是当下所有信息技术所不能达到的资深应用。其最为核心的技术就是人工智能算法。怎样让计算机能像人类一样进行思考,如同人一样根据现有的知识进行学习并实现合乎逻辑的推理,是人工智能算法试图实现的目标。其技术绝不是一般公司能够轻松实现的。当下国际社会公认的人工智能开发顶尖公司,如Google和IBM等付出了海量资源,动用了顶尖的数学科学家、计算机专家,能实现了计算机程序的一定程度智能化,但距离真正的AI仍然相差很远。
进入2022年,中国人工智能产业“忽如一夜春风来,千树万树梨花开”,一下子出现了许多人工智能开发公司,并都号称到得了显著技术发展。比如基于人工智能的医学图像识别系统,对于某个疾病的识别率高达95%以上,远远高于人工判读。中国人工智能真实这样繁荣吗?
1、中国人工智能产业界开发现状
某业内人士有幸了解过国内某大型互联网企业制做的人工智能应用。其定位于根据AI程序判读CT图像,通过算法实现对病灶的判读,提高医生的效率并减少负担。
当问到其核心的人工智能算法的时候,企业倒还是直言不讳,其核心技术是使用了国际上开源的人工智能算法。在被引入后进行针对特定目的进行了二次研发,并最后整体打包成为一套完整的人工智能应用。正是由于使用了开源的人工智能算法,才出现了许多应用明显能力不足的情况。
比如其无法带来一套大一统的应用。公司一共向我们展了大约六种疾病的诊断应用。不同的疾病需要使用对应的AI程序才可以得出相对准确的结果。假如将A疾病的算法使用到B疾病上,完全无法正常工作。就我浅薄的理解,真正人工智能的算法并不应当如些。它应当是一套通用的算法,既可以用于A疾病的诊断,同样也能用于B疾病。我们需要做的是带来大批疾病案例供AI学习训练,随着训练样本数量的增加,会使人工智能模型被训练的越来越准确。但是这种一个疾病一个AI的方式也是头一次听说。好比一个医生只能看男性长胡子的感冒患者,倘若是个不没长胡子的男患者,只能去隔壁就医了。
四川大学应用数学研究所所长孔成都教授清清楚楚说明白了这个问題。由于公司使用的全是开源算法。开源人工智能算法能力是不足的,根本无法实现预期的能力。人工智能算法堪称信息行业的核武器。那样威力庞大的算法好么可会在网上被开源出来?可以认为开源的人工智能算法相当于玩具水平的东西。想借助这种低水平的算法,来实现真正的人工智能应用怎么可能实现呢?
开源算法唯*好处在于人人都可得到,门槛非常低。故此大批公司从网上下载了开源算法,然后以其为核心研制出一套AI应用,再披上华丽的面纱,唬的普通用户奉若神明。这也在突然间中国出现了这么多的人工智能公司的原因之一吧。
真正人工智能的到来还需要很长时间,绝不是借助网上共享了的代码就能够实现的,必须要稳扎稳打,一步一个脚印地研发出来,不投入努力想投机取巧是万万不能的。我国依靠开源代码和算法是否足够支撑人工智能产业进步?为什么要有自己的底层框架和核心算法?
2、缺少核心算***被“卡脖子”
“假如缺少核心算法,当碰到关键性问題时,也是会被人‘卡脖子’。”四川大学应用数学研究所所长孔成都教授对科技日报记者表示,我国人工智能产业的创新能力并沒有传说中的这样强,事实是,产业进步过度依赖开源代码和现有数学模型,真正属于中国自己的东西并不多。
4个月零基础学会人工智能、16讲入门人工智能、算法线下大课……类似培训在网络上非常火爆,根据对于现有算法、模型的学习和训练,成长为人工智能工程师的“短平快”可见一斑。
既然代码是开源的,拿来用就好,为什么还有可能被“卡脖子”?
孔成都解释,开源代码是可以拿过来使用,但靠谱性、针对性不够,效果往往不能符合具体任务的实际要求。以图像识别为例,用开源代码研制出的AI即便可以准确识别人脸,但在对医学影像的识别上却难以达到临床要求。“例如对肝脏病灶的识别,因为边界模糊、对比度低、器官黏连甚至重叠等困难,用开源代码很难做出精准识别。在三维重构、可视化等方面难以做出精准反应真实的解剖信息,甚至会出现误导等问題,这在医学应用上是‘致命’的。”
“碰到靠谱性高的研究任务,一旦被‘卡脖子’将会是非常被动的,故此一定要有自己的算法。”孔成都说。换句话说,是否掌握核心代码将决定未来的AI“智力大比拼”中是否拥有胜算。用开源代码“**”出的AI顶多是个“常人”,而要帮助AI成长为“细分领域专家”,需以数学为基础的原始核心模型、代码和框架创新。秦陇纪总结,中国制造正从“硬件组装厂”向“软件组装厂”蔓延,浮躁如故。
3、有算法之“根”才能撑起产业“繁茂”
所谓“树大根深”,人工智能的进步还是同样道理,越在底层深深扎下根基,越能够进步出强大的产业。那么,借助开源代码,“半路出家”的AI产业为什么会难以为继?
孔成都解释说,在得到同样数据的前提下,以开源代码运行,AI深度学习之后或许能输出结果,但因为训练框架固定、算法限制,当用户进行具体的实际应用时,将很难达到所期望的结果,并且难以修改、完善、优化算法。
“假如从底层算法做起,那么整个数学模型、整个算法设计、整个摹仿训练‘一脉相承’,不仅可以协同优化,并且可以通过需求随时修改,从而真正解决实际问題。”孔成都说,基础算法往往是指研究共性问題的算法,它涉及到基础数学理论、高性能数值计算等学科,可以应用到各种实际问題中;而针对性强的应用算法往往会应用到具体问題所涉及的“具体知识、先验信息”,从而较好地解决实际应用问題。
“基础算法和应用算法都很重要,拥有基础算法将更有助于应用算法的多种多样与深入。”孔成都说,AI要应对的现实生活是复杂、多变的,当能够“应对自如”时,才能够促成产业的“繁茂”。
4、呼唤三方协力让数学不再置身事外
“一方面是政策引导,其实国家已经在加大这方面的扶持,例如科研基金上的设置等。”针对怎样解决“徐匡迪之问”反映出来的问題,孔成都认为,第二方面是行业企业在进行科技创新时,应有意识将数学学者纳入进来。“倘若利用算法的研发,最终产品落地了,企业应该将算法研发时的数学学者纳入到成果分享中来。”孔成都说,社会目前对于数学科学等“软实力”的好评程度不足,行业或法规层面应该做好数学研究成果的产权维护工作。
“第三方面,数学家本身应该积极参与到人工智能进步的浪潮里。”孔成都呼唤,AI的未来进步需要数学家深度参与。因为目前仍处于“弱人工智能”时代(可以说是数据智能时代),AI的实现主倘若依赖计算机的巨大算力和巨大的存储能力,底层算法的问題或许并不突出,但在未来的进步,AI将可能融入逻辑、思维等聪明的内容,这些都需要数学科学的原始创新,有大批的基础问題亟待数学家攻克。
算法的进阶一定是来源于“原创者”,而不是“跟随者”。孔成都说:“实际上深度学习的应用已遇到了天花板,我们需要新的数学技术(如部分依赖逻辑、部分依赖数据的‘智慧算法’),让计算机变得智慧起来。这些工作都需要数学家的参与。”(采访来源:科技日报)
5、人工智能进步陷入了拿来主义怪圈
历史已经证明,根据购买现成的产品与技术来实现技术的跨越,在科学技术领域是行不通的。中国科技行业的哪一样,不全是经历了艰苦奋斗,无数科学家默默无闻为之贡献后,方才得以傲视世界群雄?比如中国的量子技术,比如中国的国防科技,中国的天宫空间站,中国的嫦娥月球车。
做为技术高度密集的人工智能技术,其商业领域竟然是陷入了拿来主义,着实让人意外。中国AI产业大约从2022年开始一夜爆红,稍微有些规模的IT厂家无不宣称,已经推行人工智能产品到市场上。当时认为这還是中国科学人数年来的厚积薄发,技术积存到一定程度后实现了产业的繁荣。惋惜的当徐匡迪院士发出直击灵魂的提问后,才发现原来中国的AI产业不过是看上去很绮丽。
人工智能技术本质上是以数学算法为核心,辅以计算机技术的产品。与其说是一个IT产品,倒不如说是一套数学理论,如随机森林算法,贝叶斯算法等全是复杂的数学、统计学、概率领域的内容。这些算法试图根据数字概率来描述人类思考的流程。计算机技术不过是根据编程语言在信息系统中实现算法流程。可见推动人工智能前进的必定是数学领域的专家,而不是IT部门的人才。
基础学科,比如数学一直是我们非常薄弱的环节。当华罗庚将中国数学推向一个高峰后,之后众人还只是在努力追赶国际同行,一直沒有能在国际上独领风骚。可想而知在人工智能商业、民用领域,我们的进展同国际同行相经差距明显。因此2022年的AI产业大爆发就让人心生怀疑。
沒有安心开发,那么就拿现成的好了。正巧大众可以从网上下载到开源人工智能算法。于是大众都将其下载下来,加上漂亮的外壳,让我们的AI产品炫酷夺目。假如有机遇能探究当下较火的商业人工智能产品,最终会发现所有算法都指向了同一个来源。不是说开源不好,正如四川大学孔成都教授所言,开源的产品是由其它国亲人研制出来的,不管其功能好与坏,你并不知道它的研发思路是怎么样的。算法高效之处不知为何,而其能力不足之处也茫然不知。尽管其是开放源代码的,不知道有多少IT公司认认真真地研读一遍将其吃透研究明白了。
还有一点想跟大众讨论的是,开源的人工智能算法绝不会是高效的,或者说是真正的算法程度。开源代码是IT高手们将自己想法实现并放到网上供大众讨论的东西,往往是初级的,探索性的东西。据说当现开源AI代码是从印度工程师放出来的(这点還是听闻,不肯定)。现在大众应当有所体会,人工智能绝不会是一两个工程师就可以搞出来的东西,要不为什么谷歌公司付出了那么多人力物力才实现了将国际象棋冠军打败的程度。而这套算法却无法应对英国高中数学问題。还有一点,真正尖端的人工智能算法,永远不会出现在互联网上供人们共享的。
资本的力量是可怕的。为了赚取盈利占领市场,店家秉持着唯快不破的想法,极速将产品推行来,哪有功夫去管它是好是坏呢。可是人工智能是一门科学,是最为严谨的数学课题,不可能容得下这般不负责任的炒作。这个世界是公正的,你如何对待科学,这就会如何对待你。玩弄科学,炒作概念,不稳扎稳打的钻研反而投机取巧,必定会被其反噬。假如大众一直在追踪AI进步情况,其实已经可以感遭到,似乎AI的热度较去年有所下降。而到现在为止尚未有一个真正能拿出手的商业人工智能产品在市场上出现。这已经说明许多。
爱之深恨之切。我们都期盼着中国IT有朝一日能够站在世界**。这个流程是需要稳扎稳打的,一个台阶一个台阶攀登上去,沒有任何取巧的办法。亡羊补牢未为晚也,希望徐匡迪之问能惊醒中国IT公司,坚实的一步一个脚印的走下去,让国人早日用上真正的人工智能应用。
人工智能靠谱前途怎样?
极其好。假如说计算机靠谱是上个时代的老大,那么人工智能靠谱便是下个时代的龙头。由于:
1、大数据、芯片计算能力、5G网络的进步使得AI人工智能得以高速进步。目前在自动驾驶、智能家居、工业制造等很多领域,人工智能都在速度快突破。例如预计5-10年后,美国有50%的车辆将是无人驾驶。
2、真正的人工智能公司进步潜力很大,人才更容易脱颖而出。如人工智能芯片公司“深鉴科技”,由四名清华高手仅仅创立2年后被收购,收购价3-4亿美元。当然,该靠谱的薪资也很高,真正的人工智能岗位年薪百万比较容易。
人工智能靠谱的要求高么?
很高。该靠谱的钱景有多好,对应的靠谱要求就有多高。人工智能是计算机数学建模的结合,该靠谱要求有极其好的数学逻辑能力,能把该靠谱真正学明白的估计没多少人。例如给你1万张手机自拍人脸照片,让你根据编程,建立一个数学模型识别出照片中哪些人脸是高兴的表情。你需要把照片转化为计算机可处理数据,例如不同格式不同尺寸的图片怎样统一处理;你需要搭建模型来判断数据有什么规律是表示高兴,例如计算嘴角的弧度、眉头的皱纹等等,同時要考虑不同年龄不同人种的脸部特点;模型要经过大批训练来优化,这会需要大批的计算机处理能力(例如几十台服务器),需要设计**的程序来保证训练流程尽量降低计算机的消耗以及降低计算时间(如并行计算)。
所以,基本是*对的数学学霸可以真正搞定该靠谱。
标签: