jjzjj

2022,我与启智

thomas-yanxin 2023-03-28 原文

我总习惯写故事.

我不太喜欢华而不实的骈文, 相反更喜欢清风拂面. 因此总会有人说, "一开始读, 太平淡、没什么意思. 但要是进去了, 就出不来了."

已经很久不正经写东西, 最近几年, 写的最多的估计是课程报告. 时常翻开看看自己的"锤子便签", 总发现里面还是会有两三个以往写的句子, 现在看偶尔会觉得不像是自己能写得出来的.

因此还是要记录. 记忆总会弥散, 不靠谱.

源于观察、始于巧合.

是一个什么样的契机?

机会来找我? 还是我去找机会?

陈丹青说, 活在这个世界你得是个机会主义者.

自然他这句话是带贬的, 我自不会承认我是机会主义者. 但广泛地接触以及开放地尝试是我愿意的.

我用过很多的平台, 托管平台诸如Github、Gitee等, 深度学习的实训平台诸如AI Studio等. Github确实是开源的创新, 我自己的很多项目都有在Github托管, 但碍于环境的问题, 登录、浏览时常受限; Gitee做了大部分的追随和部分创新, 但本质还是跟着Github的脚步. AIStudio为深度学习爱好者提供了模型训练的算力平台, 最近还上线了模型部署的功能, 很好. 但其单兵作战的环境实际上很难满足如今复杂系统软件的生产环境, 并且由于需要维护飞桨生态而做了深度学习环境的限制, 似乎显得不够开放.

我一直在寻找一个既能充分满足上述各平台不足、又能满足我个人的部分需求的创新平台. 直到我看到了OpenI, 尤其是深入了解其运行逻辑、环境逻辑、社区逻辑之后, 会惊呼:"这才是真正的创新! 什么天才能将开发链条耦合得如此紧凑贴切?"

我逐渐开始在OpenI启智社区的环境中开始进行我的工作. 从一开始的将之前我在Github托管的项目迁移进OpenI, 到后来我开始做一些自己工作, 创建ColugoMum组织、依托OpenI开放和包容的环境进行一系列的科学实验和工程落地…

在使用过程中深入了解平台, 在沟通中了解团队.

而我也不禁对这背后的团队感到好奇.

虽然"人人都是产品经理"在业界广为流传, 但是否人人都可以以用户和产品经理的互换角度去看待产品、以及用户和产品之间是否有合理畅通的沟通渠道则需要打个问号. 人人都是产品经理, 正确. 在使用产品的过程中, 人人都可以对产品进行评价和吐槽, 但这些"善意的评价"和"可爱的吐槽"是否有效回环到产品团队是需要思考的.

而平台建立的科学、有效、合理的反馈机制则深刻体现了为何需要开源.

社区用户可以通过小白训练营进行使用体验的反馈. 任何对平台使用过程中的反馈均可以在此处进行. 而官方团队则会根据平台的发展需求对这些反馈进行评估和回复. 这就建立了直接的用户和产品团队的沟通机制, 并且相对于"调研问卷"性质的被动型反馈, 对于用户来说, 这种主动性反馈实际上能够更加真实地反映产品发展现状和用户接受情况.

平台最初的高速发展时期, 用户适当允许平台部分内容做得不够完美. 但用户和产品团队在合力将产品打磨地更好.

这或许是开源的魅力所在. 开放、包容、真实.

一场略有影响力的Battle

我曾经在社群里针对PaddlePaddle和MindSpore跟社群的其他同学有过一场辩论[1].

由于平台是多元的、开放的, 因此对于深度学习环境并不做严格限制, Pytorch、TensorFlow、PaddlePaddle、MindSpore等各类深度学习框架在平台上百花齐放、百家争鸣. 而平台也提供了多源异构的算力支撑, 如GPU系列的T4、V100、A100, 国产NPU系列的Ascend 910等. 而NPU系列暂时只支持MindSpore和TensorFlow两种框架. 我认为国产深度学习框架和国产AI加速卡应当也营造出百家争鸣之盛举, 因此提出是否可以在NPU环境提供PaddlePaddle镜像以及其他国产深度学习框架镜像. 社群的其他同学有不同意见, 觉得那样会影响MindSpore的生态. 我们进行了坦诚开放的"Battle". 而后逐步演变成"国产深度学习框架之争".

Battle结束后, 我以为此事就此过去. 令我吃惊和意料之外的是, 社区的运营同学(即ZeiZei姐)随即询问我是否可以将这场辩论对外发布. 我本以为, 大多数的社区是不太会愿意将此等"不太和谐"的"Battle"对外发布的, 道理大家自然都懂. 而OpenI却愿意将此以官方的身份对外发布, 我不禁对社区开放、包容的态度有了更加深层次的体会. 而从官方的回应中我也了解到其实平台是站在更高的角度去看待国产深度学习框架之争, 是为了更好地推动国产开源环境和整体的、全局的AI生态.

开放、包容、真实和全局视野, 是我对于平台新的概念.

我愈发地认同平台体现出来的价值观, 并希望自己也能深入地参与平台的发展.

我是组织的人馁!

欧小鹏的出生其实来源于一些社群观察. 早期的时候社群总会被广告袭击. ZeiZei为此还求问知乎. 后别无他法每天都很辛苦地鉴别社群里隐藏的广告方. 我觉得这样太累, 对于一个科技向的社群来说也不够高端, 要是有个机器人, 此类情况应该会好转一些, 要是能融入一些智能化的元素活跃群聊就更好了. 后来在调研了市场上的一些相关内容之后就动手做了.

我总学不会收敛和低调.

我记得第一版做出来是大半夜. 刚满足了部分刚需功能我就迫不及待和ZeiZei分享, 然后在体验官群里和社区的老师们分享. 当然那时候欧小鹏浑身是bug, 基础设施和功能远不及现在. 但好的是, 起码开了个头, 能用.

一开始我没有想好欧小鹏的发展, 也没有想它要发展得如何、能发展得怎样, 只觉得先能满足社区的一些硬需求, 如加群、欢迎语等等.

在欧小鹏建设的初期, 我吸纳了社区平台发展的经验, 开放了源码让大家可以通过Issue进行沟通, 另外建立了一个交流群方面用户连接. 那个时候欧小鹏还没有名字, 名字的来源其实是大家一起想的(一开始ZeiZei提及叫"偶大鹏"hhhh). "欧小鹏", 谐音Open, 希望能秉持OpenI体现的开源、开放、包容的价值观, 并将这种价值观传递下去.

我曾经管理过非常多的社群, 也亲眼看着许多社群从活跃到死亡. 下半年AIGC正火, 我认为其运用在社群场景中, 应该会缓解一些"死群"的现象, 即使有打扰社群的风险, 但最起码不会让社群死. 不死群是社群维护的第一原则.

那段时间国外的Stable Diffusion、DallE、国内以ERNIE-VILG为代表的文生图爆火. 众多开发者都开源出了很多能够推动模型和用户连接得更紧密的工具、平台和方法, 教程也是一箩筐. 但我仍旧认为, 模型与用户(尤其是普通用户、非技术用户)之间的距离还是太远; 模型的评价体系依旧在广告方, 而非用户本身身. 而微信是一个天然的用户聚集区(无论是开发者用户还是普通用户), 并且还是一个讨论的天然场所, 这两份天然, 满足了我的设想. 我将文心的文生图能力接入进欧小鹏, 虽然交互方式一直被诟病, 但却是引爆了一阵子社群. 而后逐步接入鹏城·盘古、浪潮源1.0、文心ERNIE等大模型, 各大模型基于欧小鹏对外提供服务, 一时间描绘出大模型百花齐放的"假象".

某天夜里的社群, 余老师体验欧小鹏:

"余老师这么晚还没睡呢哈?"

"睡不着! 我跟欧小鹏玩会."

(原来欧小鹏也可以有打发时间、助眠的功能hhh)

通过以欧小鹏和OpenI平台为核心点, 我逐渐和各种大模型提供方广泛接触并建立了"似有若无"的合作关系. 某天和鹏城·盘古对话模型团队的王老师聊欧小鹏的对话场景, 王老师说:

"我们一起把欧小鹏养大!"

听到王老师的话, 我久不能静: 写下欧小鹏第一行代码的时候, 我远不会想到它能有现在的发展.

当然, 养孩子嘛, 总会遇到一些困难. 有一段时间欧小鹏的爆火功能——文生图下线了, 原因是ERNIE-VILG的服务较之前有了一些区别, 逐步过渡到付费行为. 作为一个铁铁的白嫖党(开玩笑)又怎么愿意付费呢? 后来文生图服务暂停了一段时间, 自己也在此期间尝试了很多的替代方案但都因为各种原因一一落败. 那段时间其实很沮丧.

"该不会就要这么下线了吧?"

服务停了, 还是相对爆火的服务, 自会有人寻问原因.

某天和ZeiZei聊天, 她问及原因, 我一五一十告知, 言语中也夹杂着一些沮丧.

但ZeiZei姐却很爽快地说:

"有困难, 找组织啊!"

我其实是一脸懵的. 我不会想到我之于平台来说是一个有组织的人. 我也未曾想过欧小鹏的发展能让平台参与进来.

而后平台是真的参与进来了, 没过多久欧小鹏的文生图能力恢复.

我是有组织的人成了我继续下去的又一层动力.

逐渐地, 在欧小鹏自身发展以及和用户交流的过程中, 欧小鹏有了更加深刻和宽广的计划: 在服务社群的同时, 它更是大模型和用户间最直接的连接方. 把模型的评价体系交还给用户成了欧小鹏的愿景.

奇绩创坛的同学通过OpenI看到了这一想法的苗头, 发邮件来与我沟通, 希望在这一特殊的时间节点一起探索该方向的未来发展和商业落地. 我们进行了很有趣的交流, 也学习到了很多商业化思维, 产生了一些更有趣的想法.

未来欧小鹏还会依托启智社区继续发展, 希望在发展的过程中能秉持开源、包容、真实的理念, 为大模型的应用落地做一些自己的贡献.

怎么介绍自己?

ColugoMum的创始人? LDU的联合创始人? 社区的资深体验官?

ColugoMum的创始人

ColugoMum聚焦智慧零售行业, 依托国产深度学习开源框架和国产AI加速器, 打造零售全场景链条的开源方案和开源组织, 推动我国实体零售向数字化、智能化方向转型发展[2].

目前ColugoMum在社区内已经开展了工程Demo、科学实验、数据集、使用教程等系列布局, 并将持续维护和创新, 力争实现ColugoMum降本增效、赋能零售的使命.

但是, ColugoMum的发展初期其实会受到自己技术视野、行业理解和开源理念的限制, 包括目前在社区里做的一些工作, 虽然花了很多功夫, 但是否能够真正落地依旧要打个问号. 而在此过程中, 因为OpenI的影响力, 也给我个人对于ColugoMum带来了一些新的启发. 深圳银歌云公司的王总因为在OpenI上看到ColugoMum的系列工作与我联系, 我们共同交流了包括技术、行业、商业等各个领域的很多想法, 并结下了深厚的友谊. 福建得胜科技的袁总因为看到了OpenI启智社区发布的关于ColugoMum的推送, 而后与我产生了一些合作……这些情况在OpenI社区屡见不鲜, 数不胜数.

在社区里, 众多优秀的开源项目也开拓了我的技术视野. ColugoMum由于前期的一些问题, 直到现在都一直缺乏一套完备的部署方案. 通过逛社区, 我很快将视角聚焦在CubeAI项目上. 虽然因为时间和精力原因一直没有实际尝试(最近正在尝试过程中!), 但却一直跟踪其发展和变化. 令我意想不到的是, 在2022 CCF 中国开源大会(2022 CCF ChinasOSC)"人工智能开源社区"论坛上, 中国联通国家工程研究中心的霍龙社博士也对ColugoMum项目表达了关注. 这是对我们莫名的肯定, 也是开源的魅力. 正如王怀民院士回答为什么要开源的问题:

  1. 它是一个学术传统, 更是一个文明现象, 是人类文明的常态;
  2. 它是商业模式的再创新, 构造了新的吸引力机制.

开源模式使得ColugoMum能够得到市场的关注和反馈, 也让我们有了更多坚持下去的动力.

LDU的联合创始人

LDU的创办其实来源于自己在学校的成长. 为了满足自己对于深度学习和工程应用的兴趣, 自己花了很长的时间去搜集各种学习资料、去搜寻和适应一个稳定的实训环境、寻找团队成员并仔细打磨自己的项目……这一个有一个的"很长时间"让我觉得我应该为其他同学做一些事情. 在和学弟(王鑫, 启梦之旅华东理工大学旅长)的一次闲聊下, 我向他表达了我的想法, 我们一拍即合, 立刻实施, 便创建了LDU组织[3].

Learning-Develop-Union(LDU)是一个专注于数据科学与 AI 领域团队孵化的开源组织, 致力于为大家提供一个良好的AI学习与应用环境, 依托Datawhale开源内容、开源学习和开源方案, 融合启智社区的算力和项目支持, 集学习、竞赛、创意孵化为一体, 为人才与项目的成长提供良好的生态环境, "聚一群人, 做自己所热爱的事情"是我们不变的愿景.

后来在组织的发展过程中也逐渐地向我们的希望迈进, 逐步有一些优秀项目(如:Sports_Game_tracker欧小鹏fitness_helper等)加入LDU组织, 组织成员的规模也愈发增长、一些外部合作也在逐步展开.

我们希望LDU能够帮助到高校(尤其是对AI感兴趣)的同学摆脱迷茫, 依托开源、 动手实践, 为社区开源人才培养贡献自己的力量, 也为推动国家人工智能人才和开源人才培养做出一份贡献.

社区资深体验官

我一直将体验官定义为社区内的至高荣誉, 甚至不仅局限在社区内. 国内的开源环境在变好、开源活动在日益活跃, 但国内大多数接触开源的人似乎视野依旧局限闭塞, 大家是不是仍旧认为开源就是代码开源? 社区是一个国内开源的先锋地, 作为社区的体验官, 在cover日常的社区QA、平台体验反馈等的同时, 我个人认为也需要做一些开源文化的引导和宣传工作. 相对于技术而言, 也许文化是根固的影响.

前面我一直在提及, 开放、包容和真实是开源的魅力. 而作为社区的体验官, 我们也应当传达我们在其中体验到的开源文化的魅力, 这也许是促使我写下上述这些字的原因.

写在最后

加入OpenI社区已经505天了. 我自然希望平台能越来越好, 更希望国内大的开源环境能越来越好. 如同开源这样开放、包容、尤其是真实的环境, 很少了. 愿大家能共同维护这份美好, 珍惜这份来之不易的美好.

愿大家保持开放、包容、真实.

愿OpenI能不忘初心, 开放、包容、真实, 扛起国内开源这面旗.

引用

[1]开发者们围绕Paddle和MindSpore在群里Battle, 官方回应来了
[2]OpenI开源项目推荐-ColugoMum | 基于国产深度学习框架PaddlePadddle开源的零售行业解决方案
[3]好兄弟不仅要一起上榜, 更要有远大的志向
[4]连续4周上榜的这位开发者, 活出了当代大学生该有的样子
[5]【首批体验官亮相, 惊呼王牌福利爱死了】积极的人像太阳, 走到哪里都是光

您的好友正在邀请您加入OpenI启智AI协作平台, 畅享充沛的普惠算力资源. 春节期间还可享受平台的8卡NPU资源大放送~
注册地址:https://openi.pcl.ac.cn/user/sign_up?sharedUser=thomas-yanxin
推荐人:thomas-yanxin

有关2022,我与启智的更多相关文章

  1. 映宇宙2022年营收63亿元:同比下降三成,毛利率提升4.3个百分点 - 2

    3月26日,映宇宙(HK:03700,即“映客”)发布截至2022年12月31日的2022年度业绩财务报告。财报显示,映宇宙2022年的总营收为63.19亿元,较2021年同期的91.76亿元下降31.1%。2022年,映宇宙的经营亏损为4698.7万元,2021年同期则为净利润4.57亿元;期内亏损(净亏损)为1.68亿元,2021年同期的净利润为4.33亿元;非国际财务报告准则经调整净利润为3.88亿元,2021年同期为4.82亿元,同比下降19.6%。 映宇宙在财报中表示,收入减少主要是由于行业竞争加剧,该集团对旗下产品采取更为谨慎的运营策略以应对市场变化。不过,映宇宙的毛利率则有所提升

  2. IDEA 2022 创建 Spring Boot 项目详解 - 2

    如何用IDEA2022创建并初始化一个SpringBoot项目?目录如何用IDEA2022创建并初始化一个SpringBoot项目?0. 环境说明1.  创建SpringBoot项目 2.编写初始化代码0. 环境说明IDEA2022.3.1JDK1.8SpringBoot1.  创建SpringBoot项目        打开IDEA,选择NewProject创建项目。        填写项目名称、项目构建方式、jdk版本,按需要修改项目文件路径等信息。        选择springboot版本以及需要的包,此处只选择了springweb。        此处需特别注意,若你使用的是jdk1

  3. 2022年10月23日周赛ZZULIOJ - 2

    文章目录问题B:芝华士威士忌和他的小猫咪们代码&注释问题C:愿我的弹雨能熄灭你们的痛苦代码注释问题D:猜糖果游戏代码注释问题E:有趣的次方代码注释问题F:这是一个简单题代码&注释问题G:打印矩阵代码注释问题H:scz的简单考验代码注释问题I:完美区间代码&注释问题J:是狂热的小迷妹一枚吖~代码&注释2022年10月23日周赛ZZULIOJ问题B:芝华士威士忌和他的小猫咪们时间限制:1Sec内存限制:128MB题目描述芝华士威士忌很喜欢带着他的猫咪们一块跑着玩。但是小猫咪们很懒,只有在离他y米以内才愿意和他一块跑。这天他在坐标为x的位置,他想和他的猫咪们一块跑着玩。有n个小猫咪,第i个小猫咪在坐

  4. 【华为OD机试真题 java、python、c++】荒地电站建设【2022 Q4 100分】(100%通过+复盘思路) - 2

    代码请进行一定修改后使用,本代码保证100%通过率,本题目提供了java、python、c++三种代码。复盘思路在文章的最后题目描述祖国西北部有一片大片荒地,其中零星的分布着一些湖泊,保护区,矿区;整体上常年光照良好,但是也有一些地区光照不太好。某电力公司希望在这里建设多个光伏电站,生产清洁能源对每平方公里的土地进行了发电评估,其中不能建设的区域发电量为0kw,可以发电的区域根据光照,地形等给出了每平方公里年发电量x千瓦。我们希望能够找到其中集中的矩形区域建设电站,能够获得良好的收益。输入描述第一行输入为调研的地区长,宽,以及准备建设的电站【长宽相等,为正方形】的边长最低要求的发电量之后每行为

  5. 玩客云刷机(2022-3-19亲测) - 2

    https://cloud.189.cn/t/BJbYreYbmUj2(访问码:djz6)(网盘2022-4-1更新)一、刷入armbian。1.1使用AmlBurnTool软件烧录首选底包至固件。烧录完成后断开玩客云电源备用。(靠近hdmi的那个口子。)1.2使用WIn32diskimager软件将emmc固件写入U盘。1.3写入成功后,先将U盘插入玩客云靠近网线接口端的USB口,再接入电源。玩客云通电后指示灯会先亮绿灯,再亮蓝灯,红蓝闪烁,最后蓝灯常亮。等到确定蓝灯常亮后,再拔掉U盘、电源。(最好蓝灯常亮后,启动一次玩客云,看看ssh是否正常。)1.4使用WIn32diskimager写入

  6. AiBote 2022 新研发的自动化框架,支持 Android 和 Windows 系统。速度非常快 - 2

    Ai-Bot基于流行的Node.js和JavaScript语言的一款新自动化框架,支持Windows和Android自动化。1、Windowsxpath元素定位算法支持支持Windows应用、.NET、WPF、Qt、Java和Electron客户端程序和ie、edgechrome浏览器2、Android支持原生APP和H5界面,元素定位速度是appium十倍,无线远程自动化操作多台安卓设备3、基于opencv图色算法,支持找图和多点找色,1080*2340全分辨率找图50MS以内4、内置免费OCR人工智能技术,无限制获取图片文字和找字功能。5、框架协议开源,除官方node.jsSDK外,用户可

  7. 考勤刷卡 最大和 简单 蓝桥杯省赛 2022 - 2

    问题描述小蓝负责一个公司的考勤系统,他每天都需要根据员工刷卡的情况来确定每个员工是否到岗。当员工刷卡时,会在后台留下一条记录,包括刷卡的时间和员工编号,只要在一天中员工刷过一次卡,就认为他到岗了。现在小蓝导出了一天中所有员工的刷卡记录,请将所有到岗员工的员工编号列出。输入格式输入的第一行包含一个正整数n,表示一天中所有员工的刷卡记录的条数。接下来n行,每行包含一条刷卡记录,每条刷卡记录的格式为:HH:MM:SSID其中HH:MM:SS表示刷卡时间,HH为一个0到23之间的两位十进制整数(可能含前导0)表示时,MM为一个0到59之间的两位十进制整数(可能含前导0)表示分,SS为一个0到59之间的

  8. 2022年山东省职业院校技能大赛高职组“信息安全管理与评估”赛项竞赛规程 - 2

    2022年山东省职业院校技能大赛高职组“信息安全管理与评估”赛项竞赛规程一、赛项名称赛项名称:信息安全管理与评估英文名称:InformationSecurityManagementandEvaluation赛项组别:高职组赛项归属:电子与信息大类二、竞赛目的(一)引领教学改革通过大赛引领专业教学改革,实现以赛促教、以赛促学、以赛促改的产教结合格局,提升专业培养服务社会和行业发展的能力,为国家信息安全行业培养选拔技术技能型人才。2022年信息安全管理与评估赛项延续历届赛项的竞赛内容,通过赛项检验参赛选手安全网络组建、按照等保要求加固网络系统、安全架构、渗透测试、攻防实战等技术能力,检验参赛队计划

  9. 2022年度 FinClip 扩展 SDK 推荐! - 2

    2022年,FinClip团队进行了24个产品迭代,为了丰富FinClip的平台能力,除了核心SDK之外,我们还为开发者们提供了扩展SDK,扩展SDK是一个依赖核心SDK的库,里面提供了核心SDK中所没有的各种小程序API。官方希望通过丰富的扩展SDK库可以帮助开发者减少开发工作,把更多的精力用到实现业务上。那本期,小编就为大家推荐扩展SDK库中8个功能稳定又实用的SDK!(更多详细内容请点击)以下分享以AndroidSDK文件为例,您可登录 资源下载中心下载AndroidSDK文件,扩展SDK也处于在所下载的压缩包中。1、WeChatSDK微信SDK的快捷接入,提供调起微信通过微信小程序获得

  10. 2022年C++面试题万余字汇总【面试官常问】 - 2

    2022年C++面试题【常问重点问题】`1、请你说说GET和POST的区别?``2、简述一下C++中的多态?``3、说一说进程有多少种状态,如何转换?``3、请你说说指针和引用的区别``4、简述一下虚函数的实现原理``5、说一说vector和list的区别,分别适用于什么场景?``6、什么是孤儿进程,什么是僵尸进程,如何解决僵尸进程``7、请你说说C++Lambda表达式用法及实现原理``8、请你说说innodb和myisam的区别``9、请你说说数据库的索引是什么结构,为什么不用哈希表?``10、虚析构函数有什么作用?``11、说一说常用的Linux命令?(常见)``12、简述一下堆和栈的区

随机推荐