"); //-->
中国电子首席科学家
中电金信研究院院长 况文川
自2022年8月19日发布以来,源启已经走上了她第三年的征途。今天,源启已经成为公司战略的支点,中电金信正致力于用“源启底座”“源启+咨询”“源启+应用重构”三位一体的方式来赋能千行百业数智化转型发展。经过4万多名同事的持续付出和共同奋斗,源启经历了两次大的升级和持续的迭代发布,形成了基础运行支撑平台、数字构建平台、数据资产平台和行业AI平台四大产品组以及70多个子产品,并已经在上百项重大工程中投入使用,打造了金融、能源行业和大型企业集团的一系列标杆案例,并开始走向海外,在新型数字基础设施领域建立了基本的竞争地位。2024年5月,源启入选国务院国有资产监督管理委员会十大“国有企业数字技术成果”,成为“最轻”大国重器。
十年树木,百年树人。今天的源启还仍然是一个蹒跚学步的孩童,我们在回顾源启的些许成绩时,更为重要的,是要看到源启发展过程中有待改进之处,及其面临的诸多机遇和挑战。面对不断演进的技术架构、工程实践和商业创新,面对深度定制化的市场和日新月异的竞争格局,面对迅速展开的行业推广、日益膨胀的项目规模与漫长的项目周期,面对中电金信承担的行业和产业重任,我们在核心技术形成、技术领域延展、产品版本管理、“前店后厂”实践、研发与项目协同、技术领导者思维与行为、技术力量组织、研发管理等诸多领域均仍需自强不息。
中电金信的技术体系也正在变革和发展的道路上持续努力。在众多的努力之中,如何夯实底层基础软硬件设施能力打造第一道护城河、如何支撑应用项目群的工程现代化达成阶段性战略目标、如何融入开源创新空间同步技术世界发展的脉搏以及如何跟上人工智能新一轮浪潮不掉队?这四个问题是既定技术路线之上,摆在中电金信和源启面前的四大战略性问题。
今天,我和大家讨论其中第四个话题。我们如何看待AI的第三次浪潮?在这个浪潮之中,我们身在何处?我们该往什么方向努力,让源启增持AI的能力?这是一个深度数字化的世界,也是一个将表层认知、社交媒体热点和数据智能精准传导结合起来,快速播种知识焦虑、事业焦虑和职业焦虑的世界。如果要我基于自己的切身体会评价人工智能对当前工作生活的改变,我肯定会谈到电子设备每日推荐的信息、无人机、人工智能截图翻译、新能源车驾驶体验,以及“GPT”们生成式的内容搜索。这些新事物正在挑战甚至改造现有的工作和生活方式。所以,我们有必要讨论和思考一下人工智能技术对我们所处行业及源启的改变。
01新一轮人工智能浪潮
自2022年末ChatGPT推出以来,人工智能再次引发了全社会的关注,人工智能的研发、投资和应用进程大大加速。自1955年“Artificial Intelligence”(人工智能)这一概念被正式提出以来,我们已经历过两次人工智能浪潮,当前正处于第三次浪潮的第二阶段。这个漫长的发展过程,体现了人类对科技创新的美好期待和不断追求,也说明科技创新存在着巨大的不确定性和风险。
在1956年到1974年的人工智能第一次浪潮中,人们探索了当代人工智能的几乎所有理论方向和语言、图像、机器人应用,但因为算力、数据、理论支撑等不足而陷入低谷。1982年到1990年,专家系统带来了人工智能的短暂复兴,中间也经历了日本第五代计算机工程和美国战略计算计划的启动和失败,那时候的科研计划提出的很多目标,今天也未能完全实现。二十世纪90年代末至今的第三次浪潮曲折而漫长:1997年“深蓝”战胜国际象棋冠军卡斯帕罗夫,但此时的“深蓝”也标志着符号主义人工智能达到了它的天然上限,朝此方向发展的人工智能很难进入大规模的实用应用中;多层神经网络在各个领域取得突破,却一直不温不火,直至2009年ImageNet数据集的建成和2012年AlexNet神经网络算法的提出才改变了这一局面,2016年AlphaGo战胜世界围棋冠军李世石标志着深度学习网络的巨大成功。第三次人工智能浪潮的第二阶段,生成式人工智能(Generative Artificial Intelligence)兴起,2017年Google发布的Transformer恰如火种,5年后终于通过OpenAI的ChatGPT爆发出来。一年多以后,ChatGPT的用户数已经增长到了2亿以上,企业、社会开始广泛投资于大模型、GPU等智能算力以及AIGC平台和应用领域,人们又一次开始讨论通往AGI(通用人工智能)的可能途径。
在这一阶段的人工智能热潮中,我们可以感受到四个方面的产业趋势。
■ 综合算力成为基础设施。深度神经网络学习加速了处理器的多样化和计算架构的多样化,大模型涌现能力的出现证实了“大力出奇迹”的路径可行,进而催生了对巨型算力和大规模算力集群的需求。一方面,我们可以看到GPU、DPU等xPU厂商在加速发展其芯片技术;另一方面,可以看到全球主要的云厂商、运营商以及一些地方政府都在大力投入大型智算集群,国内有CCF(中国计算机学会)分布式架构相关会议,国际上有CNCF(云原生计算基金会)的相关会议,80%以上的话题都在围绕智能算力调度展开。算力基础设施正在迅速向多场景多任务发展。
■ 应用开发创新范式改变。如同深度神经网络的验证成功,很大程度上有赖于李飞飞构建的ImageNet图片数据集;大模型的出现,则很大程度上依托于巨大的训练数据集和大规模的算力。在大模型之上,还可通过各种工程实现提供各种AI基础能力,再赋能于上层的各类应用。当我们还在探讨基于代码的编程模式如何向数据驱动的编程模式演化的时候,开发模式已经从“代码操控数据”发展到“代码+数据+模型+算力”的融合新阶段,如人民大学的文继荣教授所说:模型的能力每增长一个百分点,则会在上层解锁一批应用,如何选择模型,如何拼装模型,如何运用数据来增强模型的能力,继而赋能应用,以及如何选择合适的算力,都对应用开发提出了更高的要求。
■ 不断加速的开放协同创新。且不论运用其他公司开发的大模型开展数据标注和模型训练这些有争议的操作,人工智能的繁荣发展在很大程度上依赖于科研论文、研发成果的公开发表以及开源项目的推动。此次大模型的兴起正是源于2017年Google发表的Attention Is All You Need这篇著名的论文,而在大模型基础上形成的RAG(检索增强生成)来自2020年Facebook的论文,2023年的论文Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models对Agent(智能体)的理论依据进行了总结,Agent的多数开源项目都是在2023年后形成的。尽管大模型现在还有开源和闭源路线之争,但以上诸多事实都提示我们,AIGC(人工智能生成内容)的研究发展节奏明显快于以往任何一个时期,而且,在很大程度上依托于全社会、全世界的知识共享。从这一意义上,开放的创新思路和对全球AI浪潮的紧密观察,对公司来讲,具有战略意义。
■ 从国家到企业的体系化竞争。因为人工智能在国家战略、企业发展、人类社会发展中的重要性和可能性,AI在各国政策层面和众多企业的战略层面均受到了高度重视,各国都在制定国家层面的AI战略计划,在企业方面则常有“All in AI”这类口号提出。从另一个角度看,今天客户接受AIGC解决方案的时候,他要的不仅仅是一个行业“大模型”,他需要的是上层的应用,对行业的Know How,中间用于训练的数据,以及底层的算力基础设施——他需要的是一个可以端到端交付的整体解决方案。
02应用牵动,场景为王
眼下,关于生成式AI的未来发展,还存在诸多争议。国际国内有很多专家和企业家认为未来的IT将全部转向生成式,全面推崇Scaling Law(大力出奇迹),并声称看到了一个崭新的万亿美元市场;而部分专家或企业则质疑AGI通用人工智能尚不存在,或者说Transformer路线并不能导向真正意义上的人类智能,也有人在不断警告2024年下半年人工智能市场将会遇冷。我们确实注意到,这一年多来,大模型的进步速度相对公众的预期正在放缓,至少从OpenAI GPT-5迟迟未能发布上,可以感觉到这一点(近来,关于最新发布的OpenAI o1,也存在很多解读、讨论和争议)。在存有诸多不确定性时,我们更应该关注的是AI技术给实际应用场景所带来的改变,也就是大模型等AI技术实际上怎么落地。与此同时,我们始终要看到,新技术对应用的渗透是渐进的,同时也是坚定不移的,作为一家技术企业,只有摈弃自我聚焦和固步自封,保持对新技术的迅速反应、对外部趋势的敏捷感知,才能避免被科技洪流淘汰。
以大模型、AIGC为代表的这一轮人工智能浪潮,显然还处于初创阶段。但是,20年来,人工智能对应用的渗透程度已经到了一个新的层次,在商业平台、金融服务、医疗保健、互联网服务、政府公共服务、制造业、交通、物流等领域大量实际投入使用,包括数据分析、风险防控、自动化交易、个性化推荐、医疗影像分析、药物研发、优化治疗过程、预测性维护、生产流程优化、安全或质量监控、自动化控制、物流优化、自动驾驶、智能交通管理、无人机飞行等。以我们服务的银行业为例,人工智能支撑了智能客服、生物识别、信用评估、欺诈检测、客户细分、个性化推荐、个性化交互、流程自动化、大数据分析、智能决策、交易执行、智能投顾、合规监测和打击金融犯罪等功能,涉及机器学习、深度学习、自然语言处理、语音处理、计算机视觉、知识图谱、决策树和随机森林、RPA(机器人流程自动化)等技术,可以说银行业是投资于人工智能技术最多的行业之一。
五六年前,我们就接受并强调一个观点:AI将作为基础设施在各个场景赋能应用,生成式人工智能的兴起,让这个趋势进一步加速。而要让人工智能成为基础设施,从宏观角度,需要确定业务需求和目标、开展技术评估和选型、设计数据架构和API、确定架构层次和公共能力、形成数据和模型管理策略、改造或新建上层应用,并确定相关的合规和伦理标准。从架构层次角度,AI-Infra(AI基础设施)包括计算、存储资源和高速网络设施、操作系统和虚拟化、AI算法框架、安全、监控管理工具所构成的智能算力基础层,以及模型训练调整、部署和运行管理、调用服务、工具链集成等功能和各类大小模型所形成的MaaS(Model as a Service,模型即服务)能力层,以及支撑RAG、Agent、思维链、上下文管理、情感分析、知识注入、逻辑推理引擎等可复用技术功能和诸如智能问答、文档生成、自动审核这类可复用业务功能的公共能力组件层。
以上技术元件林林总总,在实际操作中,一套平台相对容易码起来,而在实际应用中缺很难将它真正用起来——因为人工智能本质上是一种通用技术,它离应用还有较大的距离,所以长久以来有句话说“人工智能本身很难成为一个产品”。银行业使用AI技术已经有十年以上的积累,如我们上面所说,该行业使用了大模型以前大部分的AI技术,而且AI技术已渗透到了业务的多个领域,银行业于人工智能技术属“深度”应用行业。而当今的大模型和生成式AI技术,还没有在金融行业找到一个全新的,可以产生“涌现”、令人“惊艳”的应用创新领域,大多是在以往人工智能应用的基础上进行优化或扩展。这种创新是渐进的、试验性的,其间也会面临各种彷徨和质疑。然而,也往往是这种润物无声的改变,会在某一个时点突然厚积薄发,让一些没有做好准备的玩家猝不及防,这也算是创新所面临的两难窘境。
对于中电金信来说,在当前生成式AI的时代,会积极把握住应用场景端的创新,并充分应用我们在应用解决方案和行业定制化服务领域的优势,将通用的技术通过行业Know How转化为客户价值。
03从服务行业到自我提升
“医者不能自医”,这句话源自拉丁语“Medicus non sui ipsi mederi potest”,意思是医生不能给自己治病,其原因是医生在处理自己的病情时可能会受到个人情感、偏见和缺乏客观性的影响,导致无法做出最合理的医疗决策,而不是医生在医疗自己的时候不具备医疗知识和技能。在数字化转型方面却不尽相同:在数字化时代,我们很难相信一家自身数字化程度很低的公司,能够为行业客户提供高价值、高效率的数字化转型解决方案,并且能够长期持续高效率地经营;在智能化时代,则更是如此。
十多年来,在我们服务于金融等行业数字化转型的时候,我们也在不断改进的经营实践基础上形成了从机会到收款的OTC(Opportunity to Cash)运营管理体系,以及共享服务体系、人力资源管理体系、营销管理体系、项目管理体系及技术管理体系等数十个智慧化系统。今天,4万多人的中电金信遍布境内外数十个城市的办公以及数百个城市的业务和项目运营,正在通过这些系统实现着高速流畅的协同运转。
进入智算时代,我们除了加快行业AI平台、行业大模型的研发以及应用智能化的研发创新以外,更需要采用AI技术来赋能和改造我们的内部经营流程和研发生产流程。在智算时代的开发范式中,自场景以及自场景所积累的自身大数据,对提升公司整体AI技术能力和模型能力,也是最直接、最有效、最可控的。
结合上述思考,我们启动了“源启AI+”行动,行动包括三个部分:源启数字底座的智能化、“源启+应用”的智能化、“智慧中电金信”。其目标是实现中电金信产品和服务的全线智能化升级,为行业数智化提供整体解决方案,同时将“数字中电金信”升级到“智慧中电金信”,进一步提升运营效率和员工体验,为将公司打造成一家具有国际影响力的大型软件企业,在运营支撑上打下更坚实的基础。
04个人的机遇和技能的更新
生成式人工智能正在引领一场社会和个人生产力的革命,不仅显著提升了行业群体智能的规模化水平,同时还带来了个人生产力的极大提升。作为专业人士,我们不需要讨论“人工智能是否替代人类”“未来不再需要程序员了”这类哗众取宠的流量话题,但作为一个个体,我们也面临着双重的任务和机遇:一方面需要深化对AI领域的专业知识与技能的认识,服务于我们的产品和服务,改变我们的生产和服务流程;另一方面则是利用生成式AI技术优化我们的职场工作效率、提升我们自己的生活水准。
在第一个方面,我们应不断追踪并掌握AI领域的最新发展,包括先进的模型、算法及其工程应用,并通过技术实践、研究以及参与开源项目和社区来不断提升自己的专业水平,更重要的是,要在自己从事的专业领域里紧密观察、学习和思考,让人工智能技术产生真正的应用效果。在第二个方面,在提升工作效率和生活水准的实践中,我们可以在知识探索、市场信息搜集、文档编写、图文视频创作、日程规划、生活助手、个性化交互、休闲娱乐、健康医护、旅行规划、财务管理等领域广泛地尝试AI技术的应用,做一个AI达人,广泛体验AI技术带来的效率革命和体验革新。这些工具不仅能够优化我们的工作流程,更能释放我们的创造力,让我们在快节奏的工作生活中行云流水,游刃有余。
正如2007年iPhone的问世标志着移动计算时代的来临,如今的生成式人工智能技术也正在预示着一个新时代的开启,它会在未来的5到10年,渐进而深刻地重塑社会结构和计算产业的布局。“纸上得来终觉浅,绝知此事要躬行。”面对这样的变革,我们不仅需要翘首以盼,更需要积极投身于这场变革之中,以开拓者、驾驭者的姿态来融入这场变革。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。