jjzjj

深度复盘-重启 etcd 引发的异常

作者信息:唐聪、王超凡,腾讯云原生产品中心技术专家,负责腾讯云大规模TKE集群和etcd控制面稳定性、性能和成本优化工作。王子勇,腾讯云专家级工程师,腾讯云计算产品技术服务专家团队负责人。概况作为当前中国广泛使用的云视频会议产品,腾讯会议已服务超过3亿用户,能高并发支撑千万级用户同时开会。腾讯会议数百万核心服务都部署在腾讯云TKE上,通过全球多地域多集群部署实现高可用容灾。在去年用户使用最高峰期间,为了支撑更大规模的并发在线会议的人数,腾讯会议与TKE等各团队进行了一轮新的扩容。然而,在这过程中,一个简单的etcd进程重启操作却触发了一个的诡异的K8s故障(不影响用户开会,影响新一轮后台扩容效

深度复盘-重启 etcd 引发的异常

作者信息:唐聪、王超凡,腾讯云原生产品中心技术专家,负责腾讯云大规模TKE集群和etcd控制面稳定性、性能和成本优化工作。王子勇,腾讯云专家级工程师,腾讯云计算产品技术服务专家团队负责人。概况作为当前中国广泛使用的云视频会议产品,腾讯会议已服务超过3亿用户,能高并发支撑千万级用户同时开会。腾讯会议数百万核心服务都部署在腾讯云TKE上,通过全球多地域多集群部署实现高可用容灾。在去年用户使用最高峰期间,为了支撑更大规模的并发在线会议的人数,腾讯会议与TKE等各团队进行了一轮新的扩容。然而,在这过程中,一个简单的etcd进程重启操作却触发了一个的诡异的K8s故障(不影响用户开会,影响新一轮后台扩容效

轻量化安装 TKEStack:让已有 K8s 集群拥有企业级容器云平台的能力

关于我们更多关于云原生的案例和知识,可关注同名【腾讯云原生】公众号~福利:①公众号后台回复【手册】,可获得《腾讯云原生路线图手册》&《腾讯云原生最佳实践》~②公众号后台回复【系列】,可获得《15个系列100+篇超实用云原生原创干货合集》,包含Kubernetes降本增效、K8s性能优化实践、最佳实践等系列。③公众号后台回复【白皮书】,可获得《腾讯云容器安全白皮书》&《降本之源-云原生成本管理白皮书v1.0》④公众号后台回复【光速入门】,可获得腾讯云专家5万字精华教程,光速入门Prometheus和Grafana。作者王龙,腾讯云后台开发工程师,负责TKEStack的设计开发维护及混合云项目相关

轻量化安装 TKEStack:让已有 K8s 集群拥有企业级容器云平台的能力

关于我们更多关于云原生的案例和知识,可关注同名【腾讯云原生】公众号~福利:①公众号后台回复【手册】,可获得《腾讯云原生路线图手册》&《腾讯云原生最佳实践》~②公众号后台回复【系列】,可获得《15个系列100+篇超实用云原生原创干货合集》,包含Kubernetes降本增效、K8s性能优化实践、最佳实践等系列。③公众号后台回复【白皮书】,可获得《腾讯云容器安全白皮书》&《降本之源-云原生成本管理白皮书v1.0》④公众号后台回复【光速入门】,可获得腾讯云专家5万字精华教程,光速入门Prometheus和Grafana。作者王龙,腾讯云后台开发工程师,负责TKEStack的设计开发维护及混合云项目相关

TKE 超级节点,Serverless 落地的最佳形态

陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身

SuperEdge: 使用WebAssembly扩展边缘计算场景

作者SuperEdge开发者团队概要SuperEdge是一个开源的分布式边缘计算容器管理系统,用于管理多个云边区域中的计算资源和容器应用。在当前架构中,这些资源和应用能够作为一个Kubernetes原生的资源进行管理。然而在某些情况下,边缘设备通常需要一些更加轻量、性能更好的运行时。也需要减少以GB为单位的容器镜像,将容器的启动时间提升到到秒级甚至毫秒级,而基于虚拟机堆栈二进制指令格式的WebAssembly可以更好地处理这种情况。WasmEdge是一个轻量级、高性能和可扩展的WebAssembly运行时,适用于云原生、边缘和去中心化应用程序。它是当今发展最快的Wasm运行时,社区活跃度也相当

SuperEdge: 使用WebAssembly扩展边缘计算场景

作者SuperEdge开发者团队概要SuperEdge是一个开源的分布式边缘计算容器管理系统,用于管理多个云边区域中的计算资源和容器应用。在当前架构中,这些资源和应用能够作为一个Kubernetes原生的资源进行管理。然而在某些情况下,边缘设备通常需要一些更加轻量、性能更好的运行时。也需要减少以GB为单位的容器镜像,将容器的启动时间提升到到秒级甚至毫秒级,而基于虚拟机堆栈二进制指令格式的WebAssembly可以更好地处理这种情况。WasmEdge是一个轻量级、高性能和可扩展的WebAssembly运行时,适用于云原生、边缘和去中心化应用程序。它是当今发展最快的Wasm运行时,社区活跃度也相当

TKE 超级节点,Serverless 落地的最佳形态

陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身

TKE 超级节点,Serverless 落地的最佳形态

陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身

TKE qGPU 通过 CRD 管理集群 GPU 卡资源

作者刘旭,腾讯云高级工程师,专注容器云原生领域,有多年大规模Kubernetes集群管理经验,现负责腾讯云GPU容器的研发工作。背景目前TKE已提供基于qGPU的算力/显存强隔离的共享GPU调度隔离方案,但是部分用户反馈缺乏GPU资源的可观测性,例如无法获取单个GPU设备的剩余资源,不利于GPU资源的运维和管理。在这种背景下,我们希望提供一种方案,可以让用户在Kubernetes集群中直观的统计和查询GPU资源的使用情况。目标在目前TKE共享GPU调度方案的基础上,从以下几个方面增强GPU设备的可观测性:支持获取单个GPU设备的资源分配信息。支持获取单个GPU设备的健康状态。支持获取某个节点上
12