数据,是人工智能的核心要素之一。在成都市政府新闻办近日举行的“成都市人工智能产业高质量发展”新闻发布会上介绍,“智慧蓉城建设”加速数据资源汇聚,全市六批次46家市级单位授权交付公共数据5.7亿条。
海量的数据是人工智能发展的重要支持,同时,大数据的安全问题不可忽视。首个入驻天府绛溪实验室的前沿研究中心——先进计算前沿研究中心为此加快了科研步伐。
该中心副主任吴怀谷告诉记者,团队研发了一张特殊的卡片,借助其隐私保护功能,可以让数据训练的过程更加安全,推动更多关键的隐私数据参与大模型训练当中。同时,在数据要素增值方面,该中心也正在与成都市有关部门及企业进行合作,推动成果尽快落地。
▲天府绛溪实验室 资料图
国内首创:将强隐私保护和人工智能训练相结合
先进计算前沿研究中心,是智能协同计算技术国家级重点实验室的重要组成部分,主要研究方向为泛在智能计算体系。吴怀谷介绍,在大模型训练的过程中,数据安全一直是不少市场主体担忧的问题。企业将高密度的海量数据交给云中心进行训练,其中的隐私数据有没有被滥用?如果企业之间需要进行联合训练,那么数据作为核心资产又该如何保护?这些问题都将对最终的训练效果产生影响。
“如果有这些担忧,可能企业就不敢把一些关键数据拿出来,这时通常需要修改应用或者设备配置。”他介绍,这种传统方法成本很高,实用性也不好。
那么,有没有一种经济有效的应对方法?吴怀谷介绍,中心团队研发了一种芯片级的可信互联的卡,进行数据训练时,可将这张卡片插入机器,模型应用和原有的配置都不需要变动,就能构建一个数据可用不可见的隐私环境,只有用户方指定的机器才能解密这个机器进行计算,保证数据安全。
吴怀谷表示,这种将强隐私保护和人工智能训练相结合的技术,是国内首创,目前已经在航天领域得到应用,成功构建了多方联合开展工作的隐私环境。接下来准备进一步推广,正在与长虹集团等进行洽谈,帮助其与上下游企业建立联合研发环境。
▲智能协同计算技术国家级重点实验室
开展数据要素增值行动,激发数字经济新活力
除了让数据更安全,吴怀谷的另一个研究重点是如何让数据更有价值。他介绍,数据作为新型生产要素,已快速融入生产、消费、流通等各环节,成为推动经济社会高质量发展的关键动力。但是目前,业界存在数据供给质量不高、应用潜力释放不够等问题。在各行各业中释放数据要素价值,已经成为社会各界的期盼。
去年底,国家数据局等17个部门联合印发了《“数据要素×”三年行动计划(2024—2026年)》,旨在充分发挥数据要素乘数效应,赋能经济社会发展。在吴怀谷看来,“数据要素×”行动就是要通过推动数据在多场景的应用,提高资源配置效率,培育发展新动能,实现对经济发展的倍增效应。
他介绍,在“数据要素×”方面,先进计算前沿研究中心目前已经有了不同层级和类别的多个合作对象。在公共数据要素方面,中心与成都数据集团,以及武侯区、温江区等区级国有平台公司进行合作,进行智慧城市的公共数据要素增值;在企业数据要素方面,中心与长虹集团开展合作,结合企业的“智改数转”,让长虹集团及其上下游企业实现数据要素的增值。
“数据要素是一种新质生产力,同一套数据要素,因为认知的区别,或者观察角度的不同,在实际应用中的效果都是不一样的。”吴怀谷认为,开展数据要素增值行动,能够提高其利用率和价值加成,激发数字经济发展新活力。
|