jjzjj

锘崴科技王爽:隐私计算迎“东数西算”发展大机遇

mGina_ 2024-05-10 原文

本期导读

国内隐私计算领军企业锘崴科技创始人、董事长王爽教授认为,“东数西算”工程不仅实现能源与算力的优化配置,也为数据要素的优化配置提供了基础设施。

锘崴科技创始人、董事长 王爽

“东数西算”工程正式全面启动,我国数字经济基础设施将迎重大升级优化,芯片、通信、软件、绿色能源等产业链领域被普遍视为受益行业。而更不容忽视的是算力基础设施对数据要素相关产业的带动作用,其中促进数据要素流通与共享的相关技术,特别是近年来热度颇高的隐私计算又将迎来新一波发展机遇。

国内隐私计算领军企业锘崴科技创始人、董事长王爽教授认为,“东数西算”工程不仅实现能源与算力的优化配置,也为数据要素的优化配置提供了基础设施——更大范围内的数据可以通过高效通信网络和算力枢纽实现共享和计算,而不只局限于各家企业分别使用“西部”的算力来处理自己的数据。

他指出,信任是实现数据要素流通与共享的前提基础与核心关切,“东数西算”工程这样国家级的底层基础设施提供了毋庸置疑的信用背书和资源供给。同时,国家级实力还代表了坚实的技术保障,通过隐私计算创新实现了数据的“可用不可见、可信可分配”。隐私计算将提升“东数西算”工程在数据要素流通中的作用,而“东数西算”工程的超大集群规模也将给未来隐私计算的发展和应用提供广阔舞台。

算法优化与数据一体化

隐私计算通过技术实现数据“可用不可见”,让来自不同行业和企业的数据流通共享,从而发掘更大数据价值,成为数据要素流通的理想“技术解”。对于隐私计算在“东数西算”或“算力枢纽”中的角色探讨其实并非“将来时”,而一直是“进行时”。

2021年5月,国家发展改革委会同有关部门印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,在提及促进数据有序流通时就明确:“建设数据共享、数据开放、政企数据融合应用等数据流通共性设施平台,建立健全数据流通管理体制机制。试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境,提高数据流通效率。”

随后,国家发展改革委高技术司相关负责人在答记者问时表示,国家枢纽节点建设的总体思路包括网络、能源、算力、数据和应用的一体化,其中数据一体化就对应了上述隐私计算相关的具体技术。

同年6月,国家信息中心大数据发展部的多位专家也撰文表示,实现一体化推动政企算力资源和数据资源融合发展是加快构建全国一体化大数据中心协同创新体系的战略价值之一,通过多方安全计算、联邦学习、隐私计算、数据沙箱等技术手段构建数据资源可信流通环境,推动实现数据“可用不可见”“可用不可拥”的新型合作机制,打造以“政-政”数据共享、“政-企”数据开放、“企-企”数据流通等为代表的数据供应链,实现全国数据资源流通“一盘棋”局面。

如其所言,“一体化”与“一盘棋”格局有助于推动我国数据共享基本面从以政务数据共享为主向企业数据共享的下沉延伸。《我国数据开放共享报告2021》显示,政务数据共享和公共数据开放仍是我国数据开放共享的主要方式。企业间数据共享存在隐蔽、不透明等特点,亟待规范发展。

由此可见,尽管“东数西算”工程直观展现出的是算力资源的优化配置,但内在是与数据要素流通的“一体化”协同。从功效来看,如果说网络、能源、算力等有限资源通过优化配置可以变得更加“高效”,那么数据经过流通共享后发挥的“乘数效应”和衍生价值则具有无限想象空间,这反过来恰好佐证了隐私保护计算在其中的巨大需求空间。

隐私保护计算全方位助力

隐私保护计算不是一项全新发明的前沿技术,而是一系列已有技术形成的综合解决方案,其总目标是实现数据“可用不可见”。在“东数西算”工程的大框架下,隐私保护计算的不同技术路径可以从不同方面提供支持。

最显著的场景是“算”。算力来自于芯片,但芯片不仅能提供算力,还能提供可信执行环境(TEE),也就是在CPU芯片等硬件内部建立隔离的安全环境供计算执行,外部攻击者无法从TEE中窃取数据。

“东数西算”工程包含8地算力枢纽、10个国家数据中心集群,据报道相关投入将达每年数千亿规模。芯片作为算力的核心硬件,显然也给TEE的需求留出了足够的想象空间。另外受国际贸易格局影响,不少国内企业对Intel、AMD等国外厂商芯片有所忌惮,因此还将推动我国信创产业发展,一批瞄准国产芯片TEE的研发企业也将获得额外机会。

TEE的基本理念是把数据计算限于硬件环境内,而对于有多个数据拥有者需要把各自数据拿出来协同计算的情况,隐私保护计算则可以通过软件算法来实现,如采用基于密码学的多方安全计算(MPC)和同态加密(HE)把数据加密后计算,也可得到计算结果。

但加密计算需要付出代价,相比明文计算,密文计算对性能的要求较高,一般认为密文计算的效率只有明文计算的1%或更低。不过,这一问题在国家级的算力面前可以得到完美解决,强大的算力可以极大提高密文计算效率。从这一点来看,隐私计算与国家算力枢纽还是相辅相成的关系。

隐私计算的另一大重要技术路径是联邦学习,也就是在人工智能模型训练中采用“数据不动模型动”的基本理念,数据留在拥有者本地无需流出,让模型“找到”数据,这样既避免数据泄露,也训练了算法。联邦学习规避了大量数据传输,可以说是在人工智能场景中为“东数西算”工程节省了大量通信与存储资源,与工程注重能耗和减碳的理念相契合。

对此王爽教授解释道,联邦学习把分散的“小数据”提供给机器学习模型,庞杂的数据无需再以中心化方式从各本地机构复制到中心“数据湖”,再由每个使用者复制到各自本地用于模型训练。由于是模型在各机构间移动,模型自身就能“汲取”越来越多的数据集而变得更大更强,更无需考虑数据存储的相关要求和成本。

可信可行可期

值得一提的是,虽然“东数西算”工程还处于启动阶段,但隐私计算与大数据平台和超大算力的结合却早有先例。

2019年,成都市公共数据运营服务平台成立,成为全国最早的隐私计算大规模应用平台之一。该平台利用了可信执行环境、联邦学习、多方安全计算等技术,同时还依托国家超算成都中心的超算算力破解隐私保护计算的执行效率瓶颈,成为“超算+隐私保护计算”的创新实践。

据成都市大数据集团总经理顾勤介绍,该平台已对接数据提供单位38个,接入政务类数据464类,上线数据服务产品98个,支持应用场景40余个(基于信息主体授权)。

王爽教授表示,过去几年里的许多案例都不断证明了隐私计算的可行性、落地前景和商业价值。全国一体化大数据中心协同创新体系和“东数西算”工程为我国数字经济发展构筑了坚实底座,也有望让隐私计算更快更好地赋能更多地区和更多行业,发掘更大数据价值。锘崴科技将凭借业内领先的技术和服务实力,积极投入资源,为相关体系和工程建设提供底层技术支持。

锘崴科技的隐私计算体系基于「隐私保护计算+区块链」的核心能力保证数据共享全链路隐私安全,通过首创的安全联邦学习技术实现,其由多方安全计算、同态加密以及可信计算环境等底层技术构成

 

有关锘崴科技王爽:隐私计算迎“东数西算”发展大机遇的更多相关文章

  1. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  2. 计算机毕业设计ssm+vue基本微信小程序的小学生兴趣延时班预约小程序 - 2

    项目介绍随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱小学生兴趣延时班预约小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行小学生兴趣延时班预约小程序的设计与开发的数据信息管理,特开发了小程序的设计与开发的管理系统。小学生兴趣延时班预约小程序的设计与开发的开发利用现有的成熟技术参考,以源代码为模板,分析功能调整与小学生兴趣延时班预约小程序的设计与开发的实际需求相结合,讨论了小学生兴趣延时班预约小程序的设计与开发的使用。开发环境开发说明:前端使用微信微信小程序开发工具:后端使用ssm:VU

  3. ruby - 如何计算 Liquid 中的变量 +1 - 2

    我对如何计算通过{%assignvar=0%}赋值的变量加一完全感到困惑。这应该是最简单的任务。到目前为止,这是我尝试过的:{%assignamount=0%}{%forvariantinproduct.variants%}{%assignamount=amount+1%}{%endfor%}Amount:{{amount}}结果总是0。也许我忽略了一些明显的东西。也许有更好的方法。我想要存档的只是获取运行的迭代次数。 最佳答案 因为{{incrementamount}}将输出您的变量值并且不会影响{%assign%}定义的变量,我

  4. ruby - 使用 Ruby,计算 n x m 数组的每一列中有多少个 true 的简单方法是什么? - 2

    给定一个nxmbool数组:[[true,true,false],[false,true,true],[false,true,true]]有什么简单的方法可以返回“该列中有多少个true?”结果应该是[1,3,2] 最佳答案 使用转置得到一个数组,其中每个子数组代表一列,然后将每一列映射到其中的true数:arr.transpose.map{|subarr|subarr.count(true)}这是一个带有inject的版本,应该在1.8.6上运行,没有任何依赖:arr.transpose.map{|subarr|subarr.in

  5. arrays - 计算数组中的匹配元素 - 2

    给定两个大小相等的数组,如何找到不考虑位置的匹配元素的数量?例如:[0,0,5]和[0,5,5]将返回2的匹配项,因为有一个0和一个5共同;[1,0,0,3]和[0,0,1,4]将返回3的匹配项,因为0有两场,1有一场;[1,2,2,3]和[1,2,3,4]将返回3的匹配项。我尝试了很多想法,但它们都变得相当粗糙和令人费解。我猜想有一些不错的Ruby习惯用法,或者可能是一个正则表达式,可以很好地回答这个解决方案。 最佳答案 您可以使用count完成它:a.count{|e|index=b.index(e)andb.delete_at

  6. ruby-on-rails - 如何计算 Ruby/Rails 中 JSON 对象的数量 - 2

    Ruby中如何“一般地”计算以下格式(有根、无根)的JSON对象的数量?一般来说,我的意思是元素可能不同(例如“标题”被称为其他东西)。没有根:{[{"title":"Post1","body":"Hello!"},{"title":"Post2","body":"Goodbye!"}]}根包裹:{"posts":[{"title":"Post1","body":"Hello!"},{"title":"Post2","body":"Goodbye!"}]} 最佳答案 首先,withoutroot代码不是有效的json格式。它将没有包

  7. ruby - 如何计算自 Ruby 中给定日期以来的周数? - 2

    目标我正在尝试计算自给定日期以来周的距离,而无需跳过任何步骤。我更喜欢用普通的Ruby来做,但ActiveSupport无疑是一个可以接受的选择。我的代码我写了以下内容,这似乎可行,但对我来说似乎还有很长的路要走。require'date'DAYS_IN_WEEK=7.0defweeks_sincedate_stringdate=Date.parsedate_stringdays=Date.today-dateweeks=days/DAYS_IN_WEEKweeks.round2endweeks_since'2015-06-15'#=>32.57ActiveSupport的#weeks

  8. 最新版人脸识别小程序 图片识别 生成二维码签到 地图上选点进行位置签到 计算签到距离 课程会议活动打卡日常考勤 上课签到打卡考勤口令签到 - 2

    技术选型1,前端小程序原生MINA框架cssJavaScriptWxml2,管理后台云开发Cms内容管理系统web网页3,数据后台小程序云开发云函数云开发数据库(基于MongoDB)云存储4,人脸识别算法基于百度智能云实现人脸识别一,用户端效果图预览老规矩我们先来看效果图,如果效果图符合你的需求,就继续往下看,如果不符合你的需求,可以跳过。1-1,登录注册页可以看到登录页有注册入口,注册页如下我们的注册,需要管理员审核,审核通过后才可以正常登录使用小程序1-2,个人中心页登录成功以后,我们会进入个人中心页我们在个人中心页可以注册人脸,因为我们做人脸识别签到,需要先注册人脸才可以进行人脸比对,进

  9. ruby - 如何计算两个字符串共有的字符数? - 2

    如何计算两个字符串之间的字符交集?例如(假设我们有一个名为String.intersection的方法):"abc".intersection("ab")=2"hello".intersection("hallo")=4好的,男孩女孩们,感谢你们的大量反馈。更多示例:"aaa".intersection("a")=1"foo".intersection("bar")=0"abc".intersection("bc")=2"abc".intersection("ac")=2"abba".intersection("aa")=2一些补充说明:维基百科定义intersection如下:Int

  10. python - 如何计算文件中唯一字符的数量? - 2

    给定一个包含各种语言字符的UTF-8文件,我如何计算它包含的唯一字符的数量,同时排除选定数量的符号(例如:“!”、“@”、"#",".")从这个算起? 最佳答案 这是一个bash解决方案。:)bash$perl-CSD-ne'BEGIN{$s{$_}++forsplit//,q(!@#.)}$s{$_}++||$c++forsplit//;END{print"$c\n"}'*.utf8 关于python-如何计算文件中唯一字符的数量?,我们在StackOverflow上找到一个类似的问题

随机推荐