最近,国家数据局的负责人在一场重要的新闻发布会上,详细介绍了我国人工智能和数据发展的最新进展和显著成就。信息量很大,亮点纷呈,简单概括就是:我们国家的人工智能,正跑在全球前列,发展速度飞快,应用的深度和广度都在爆炸式增长,而这一切的根基,是我们对“数据”这个关键要素的重视和建设。更重要的是,这些技术进步正实实在在地改变着亿万普通人的生活。
一、实力领先:专利全球六成,应用规模飙升
专利大户:说到硬实力,我们的人工智能专利数量已经占据了全球总量的60%!这意味着在人工智能技术的核心研发和创新上,中国是当之无愧的领头羊之一。不仅在专利上领先,在像人形机器人、各种智能终端设备这些看得见摸得着的领域,我们也持续取得新的突破。
应用大爆发:人工智能不再是实验室里的概念,它正以前所未有的速度融入我们的日常生活和工作。一个特别能说明问题的指标是“Token”消耗量。什么是Token?你可以把它想象成人工智能处理文字信息时最小的“砖块”,就像我们上网用的“流量”一样。2024年初,全国每天处理的Token大约是1000亿个。这个数字听起来已经很大了,但到了今年6月底,这个数字像坐火箭一样冲到了30万亿个!短短一年半时间,增长了300多倍!这背后是无数次的智能对话、文本分析、内容生成,真实反映了AI应用的热度和普及程度。
二、数据:人工智能的“澎湃血液”
为什么人工智能能发展这么快,用得这么广?专家打了个形象的比喻:算力(计算机的处理能力)是支撑AI的“骨骼”,算法(解决问题的步骤和逻辑)是它的“神经”,而数据,就是滋养AI的“血液”。没有充足、高质量的“血液”,AI这棵大树就无法茁壮成长。
高质量数据是关键“营养”:数据不是越多越好,高质量的数据集才是关键。比如在医疗健康领域,如果用大量经过医生仔细标注的医学影像(像X光片、CT扫描图)来训练AI模型,就能让AI诊断疾病的准确率提高15%以上!这直接关系到病人的健康和医生的效率。
我们建了庞大的“数据粮仓”:为了给AI提供充足优质的“血液”,国家投入巨大力量建设高质量的数据集。到今年6月底,全国已经建成了超过3.5万个这样的高质量数据集。它们总共有多少数据呢?答案是超过400PB。PB是个很大的存储单位,1PB大约能存5亿张普通清晰度的照片。400PB相当于能存下20万亿张照片!这个数据量有多大?它相当于中国国家图书馆所有数字馆藏总和的140倍!想象一下,国家图书馆里浩如烟海的书籍、资料都数字化了,而我们为AI准备的数据量,是它的140倍还多!
数据交易市场火热:AI模型的训练和学习需要大量的数据,这直接催生了对数据的买卖需求。到今年6月底,全国各地这些高质量数据集的累计交易金额已经接近40亿元人民币。在各地的数据交易平台上,可供交易的高质量数据总量也达到了246PB(相当于约12.3万亿张照片的存储量)。这说明数据作为一种有价值的“资产”,市场正在快速形成和壮大。
三、打好基础:制度护航,市场培育
我国能取得这样的成绩,一个非常重要的原因是我们非常早、也非常重视“数据”的作用。我们是世界上第一个明确把“数据”当作和土地、劳动力、资本、技术一样重要的“生产要素”的国家。为了管好、用好数据,国家出台了一系列政策和措施:
制度“组合拳”:国家数据局成立后,系统地推动数据要素的市场化改革,打出了一套政策“组合拳”。去年就推出了21项政策,重点包括如何更好地开发利用公共数据资源(比如政府掌握的数据)。今年计划还要推出10多项新制度,其中最重要的就是解决“数据产权”这个核心问题——明确数据归谁所有、怎么用、收益怎么分。
建设数据“高速公路”:数据要流动起来才有价值。从去年开始,国家就在布局建设全国一体化的数据基础设施,可以理解为数据流通的“高速公路网”。目前已经在包括北京、上海、广州、深圳、杭州等25个城市建成了节点(相当于高速出入口)。同时,为16个省(区、市)搭建好了数据流通的基本架构。到今年7月底,这些节点已经全部联通起来了!预计到今年底,“出入口”城市将扩大到50个左右,覆盖全国80%的省(区、市)。这将为数据在全国范围内大规模、高效地流动提供坚实的硬件基础。在“十四五”期间(2021-2025年),这个网络已经吸引了超过2000家各类机构参与,包括数据交易所、数据开发商、数据使用者等。
优化数据“交易市场”:有了“路”,还要有繁荣的“市场”。国家数据局积极推动各地数据交易场所的合理布局和整合,努力让数据产品“一地上架,全国互认”。现在在北京、上海、浙江等地已经实现了这一点。同时,大力推动“数据要素×”行动,鼓励各行各业都来利用数据创新。效果很明显:仅仅今年第二季度(4月到6月),主要的数据交易平台就新增了超过2600家想要买卖数据的企业或机构。围绕数据的服务产业也在蓬勃发展,出现了很多专门做数据标注、数据清洗、数据交易服务的公司,一些传统的服务机构如律师事务所、会计师事务所,也纷纷成立专业团队来开展数据相关的业务。
四、惠及百姓:数字服务改变生活
人工智能和数据技术的快速发展,最终是为了让人们的生活更美好、更便捷。“十四五”以来,数字智能技术已经深刻改变了我们的生活方式、生产方式,甚至政府管理社会的方式。
网民大国:我国拥有世界上最庞大的网民群体,总数达到11.23亿人,互联网普及率高达79.7%。在各方共同努力下,“用得上、用得起、用得好”的数字服务正在惠及越来越多的人。
智慧医疗更贴心:
全国互联网医院每年提供线上服务超过1亿人次,足不出户就能看医生越来越方便。
看病买药不用带实体卡了,全国医保电子码用户已超过12亿人。
在外地生病也不用担心报销难了,跨省异地就医直接结算已经惠及5.6亿人次。
数字教育更公平:建成了全球规模最大、资源最丰富的国家智慧教育平台。大家熟悉的“慕课”(大型在线开放课程),我们建设数量和应用规模都是世界第一。真正做到了“全网好课,尽在掌中”,让优质教育资源突破地域限制。
数字社保更便捷:全国有10.7亿人领取使用了电子社保卡,覆盖了全国超过75%的人口。在长三角、成渝等区域的城市群里,社保卡正逐步实现“一卡通”,在一个地方办的卡,在区域内其他城市也能方便地使用相关服务。
数字养老更温暖:针对老年人使用智能设备的困难,推出了互联网应用适老化改造、“一键呼入人工客服”等贴心服务。全国统一的养老服务信息平台也已上线,让养老服务的需求和供给能够更高效地对接。
展望未来:数据高地赋能,普惠民生
国家数据局负责人刘烈宏强调,我国人工智能的飞跃发展,与我们高度重视并系统推进数据工作密不可分。下一步,国家将:
1.体系化建设高质量数据:继续系统性地推进高质量数据集的建设工作,特别是在具身智能(更贴近人的智能体)、低空经济(无人机相关产业)、生物制造等前沿和重点领域,加快打造具有国际竞争力的“数据高地”。
2.深挖数据要素价值:更充分地发挥数据要素的“放大、叠加、倍增”作用,让它能撬动更大的经济和社会价值。
3.持续增进人民福祉:始终把让老百姓生活得更好作为工作的出发点和落脚点,着力推动公共服务、百姓数字生活、社会治理的数字化转型和智能化升级,让每个人都能更公平、更便捷地享受到数字时代的发展红利,收获更多实实在在的数字社会建设成果。
总而言之,中国的人工智能,正乘着数据要素市场化改革的东风,在扎实的专利基础、爆发式的应用增长和完善的制度保障下,昂首阔步地向前迈进,并将持续为经济发展注入新动能,为百姓生活增添新便利,为国家竞争塑造新优势。



