又拍云Tech Minds No.5首度入杭,私密分享干货满满

网络新闻 2021-07-09 10:40www.168986.cn长沙seo优化

近日,在技术圈里广受欢迎的又拍云Tech Minds第五期首次进入杭州。在西湖边上,又拍云、哔哩哔哩(B站)、盛大游戏、二更、19楼、小影、KK唱响、奥点云、边锋、蓝鲨TV、顺网、巨人星云、漫画岛等互联网企业的技术高管,饮茶赏景,就“高效运维路在何方”的主题展开了热烈的讨论。


B站运维破局之旅


无论做什么运维,最基本的职责都是保证业务能够稳定运行。以视频弹幕、UP主闻名的B站深受90后、00后的追捧,受众甚至开始从二次元人群拓展到三次元人群。随着在B站上追番、看弹幕的用户增多,特别在新番上线时访问压力的增大,给B站运维团队带来了巨大的挑战。


B站运维总监胡凯在Tech Minds 第五期上分享了B站运维团队的血泪成长史。胡凯具有丰富的运维经验,曾是猎豹移动的运维负责人,胡凯加入B站后面临着运维团队人手不足、故障多和运维系统跟不上这三个痛点。针对三个痛点和B站技术人员热爱开源、敢于尝试新技术的特性,胡凯采用的三种破冰方法,即解放劳动力、部署“一棒子监控”告警系统,同时大量引入开源系统。


“由于人手不足,所以事情得挑着做,把劳动力从繁杂的日常运维工作中释放出来。”胡凯介绍了B站的运维情况。B站自建CDN,视频存储已达到N个PB,运维压力非常大,“IT系统的权限一开始在开发手上,出问题了以后运维总得跟在开发后面查原因,不仅效率低,沟通也容易出问题。”胡凯采用Ansible+Jenkins搞定自动发布后,将运维团队从繁琐的重复劳动中解放出来,开发的服务器需求占比明显下降。


胡凯在众多需求中,先抓入口、大的需求。胡凯刚加入B站时,原始的监控不能满足快速增长的业务,要把监控细化,又不是一两天的事情。由于B站几乎所有的请求都要经过CDN,胡凯选择在入口处做监控,把5xx的错误提示都打到ELK,“无论是什么业务出问题了都会及时告警,让相关人员来处理,后续再细化。”


胡凯发现B站的运维系统跟不上业务的发展,加上B站的技术人员非常喜欢尝试新技术、开源项目,胡凯顺势而为,选择了先用开源项目解决目前的需求。B站使用过大量的开源组件,包括SheepDog和GlusterFS,其中最大的坑是SD卡+Ceph存储,“SD卡跪了导致系统也跪了,唯一的安慰是没有丢数据”,此外,Redis3.0、Codis、Twemproxy等开源系统也在B站得到了使用。由于Redis只吃单核,Codis现在没更新,Twemproxy的性能比较差,B站最后研发了BiliTW(已开源),不仅支持多核,还增加了一些易于运维的功能。


运维老司机的DevOps八荣八耻


互联网运维是一个融合网络、系统、开发、安全、应用架构、存储等多学科的综合性技术岗位,运维工作的特殊性也对运维工程师的软素质提出了高要求。从计算机老师、网管到售前技术支持、产品经理,再到出任又拍云运维总监,10余年浸淫于互联网运维之道,使得邵海杨对于运维的探索得心应手。


在本期Tech Minds上,邵海杨总结并分享了DevOps的八荣八耻、HerkuPaaS的12要素宣言和OpenStack IaaS的设计指导思想。


在谈到运维与开发问题时,邵海杨提到,不管是运维还是开发部门做主导,关键是要分清是否为人为事故。“当年,又拍云服务器一年内翻了3倍,节点数量翻了6倍,全靠自动化工具,不然完全应付不过来。”邵海杨分享道,“我们用一个U盘就完成了硬件监测、系统安装、远程管理等一系列工作,供应商的机器直接从生产线送到机房,都不需要送到公司。”


DevOps的八荣八耻


以可配置为荣,以硬编码为耻


以互备为荣,以单点为耻


以随时重启为荣,以不能迁移为耻


以整体交付为荣,以部分交付为耻


以无状态为荣,以有状态为耻


以标准化为荣,以特殊化为耻


以自动化工具为荣,以手动+人肉为耻


以无人值守为荣,以人工介入为耻


关于Tech Minds:



Tech Minds是又拍云主办的高端技术领导人私享会,已先后在深圳、广州、北京、上海成功举办,凭借私密的分享环境、高质量的对话嘉宾、前沿的行业和技术话题,又拍云Tech Minds已经成为技术圈子中非常受欢迎的“思想汇”活动。


关于又拍云


杭州又拍云科技有限公司(简称“又拍云”),成立于 2010 年,致力于为客户提供一站式的云加速服务,有效帮助用户加速从产品想法到产品上线速度,实现快速上云,让创业变得更简单。


核心业务:以场景化CDN为核心业务


产品:云分发、融合云存储、云处理、云安全、流量营销


行业解决方案:提供直播云、点播云、电商、游戏、移动App等场景化CDN解决方案


作为中国专业的云计算服务商,又拍云凭借多年的专业技术优势,在全球范围持续打造场景化 CDN,现已拥有 6 大数据中心,150 多个自建 CDN 节点,4000 多台服务器,1.5TB+保有带宽资源,日均请求超过 500 亿次,并吸引了超过 15 万付费用户的使用, 为客户持续提供稳定、可靠、安全的云服


Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by