×
搜索
热搜词
ITIL培训
ITIL认证
ITIL课程
DevOps认证
ITSS培训
新手福利
ITIL考证
干货下载
ITIL沙盘实战
ITIL聚会
专家直播
开源ITIL软件
登录
注册
登录ITIL培训更精彩
下次自动登录
忘记密码
立即注册
登录
其他帐号登录:
扫描二维码登录本站
用户组:游客
主题
帖子
威望
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
退出
最新热门
最新精华
最新回复
抢沙发啦
我的帖子
最新发表
最新回复
最新热门
最新精华
抢沙发啦
我的帖子
来自:
IT服务管理体系与数字化转型专栏
ITIL先锋
2020-12-3
新窗
用户手册-基本操作-iTop主界面
ITIL iTop主界面 下方图片展示了应用的主界面,它包含了iTop界面所有的标准元素:退出菜单在页面右上方,通过点击开/关图标,可以访问下 ...
2845
0
0
ITIL先锋
@
2020-12-3 15:05
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-3
新窗
错误预算在监管SLO中起到什么作用
本书的其他章节讨论了紧张局势之所以在产品研发小组和SRE 小组中产生,是因为他们基于不同的指标进行自己的绩效评估。产品研发的绩效是如何很大程度通 ...
1454
0
0
FYIRH
@
2020-12-3 14:24
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-3
新窗
一个评估风险容忍度的例子∶前端基础设施
基础设施服务运维的关键战略就是明确划分服务水平,从而使客户在构建系统时能够进行正确的风险和成本权衡。通过明确划定的服务水平,基础设施提供者其 ...
2015
0
0
FYIRH
@
2020-12-3 11:36
来自:
IT服务管理体系与数字化转型专栏
monicazhang
2020-12-3
新窗
图片
做好了这些,你就是一名稳定的SRE!
前言 2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫 ...
1711
0
0
monicazhang
@
2020-12-3 11:36
来自:
IT服务管理体系与数字化转型专栏
monicazhang
2020-12-3
新窗
图片
DevOps 和 SRE之间的不同点到底在哪?
DevOps 和 SRE 似乎是同一枚硬币的两个面。他们都旨在弥合开发团队和运维团队之间的鸿沟,都想要提高软件部署的效率和软件运行的可靠性。 在大 ...
1571
0
0
monicazhang
@
2020-12-3 11:12
来自:
IT服务管理体系与数字化转型专栏
monicazhang
2020-12-3
新窗
图片
如何成为最抢手的SRE!
前言SRE是什么?SRE(Site Reliability Engineering)即网站可靠性工程,提及SRE很多人会联想到运维工程师、系统工程师,其实不然,SRE本质上仍然是软 ...
1600
0
0
monicazhang
@
2020-12-3 11:00
来自:
IT服务管理体系与数字化转型专栏
monicazhang
2020-12-3
新窗
你想知道SRE同DevOps是如何关联的吗?
虽然站点可靠性工程师site reliability engineer(SRE)角色在近几年变得流行起来,但是很多人 —— 甚至是软件行业里的 —— 还不知道 SRE 是什么或 ...
1387
0
0
monicazhang
@
2020-12-3 10:33
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
火
如何评价基础设施服务的风险容忍度
构建和运维基础设施组件的要求在许多方面是不同于消费者服务的。一个根本的区别是,基础设施组件有多个客户,而他们通常有很多不同的需求。 Bigtab ...
1499
1
0
東東
@
2020-12-3 08:30
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
核算IT服务故障造成的成本
决定一项服务的合理可用性目标时,成本是很重要的考虑因素。 服务就能很好地体现出这种取舍,因为成功与失败直接通过赢利和亏损体现。在为每一项 ...
1524
0
0
FYIRH
@
2020-12-2 23:03
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
定义IT系统的可用性目标SLO
对于某个Google服务而言,服务的可用性目标通常取决于它提供的功能,以及这项服务在市场上是如何定位的。下面列出了要考虑的一些问题∶ ● 用户期望 ...
1513
0
0
FYIRH
@
2020-12-2 22:49
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
IT服务的可靠性风险容忍度的评估
如何辨别服务的风险容忍度?在一个正式的环境或安全关键的系统中,服务的风险容忍度通常是直接根据基本产品或服务的定义建立的。在 Google内部,服务风 ...
1585
0
0
FYIRH
@
2020-12-2 22:37
来自:
IT服务管理体系与数字化转型专栏
萨达
2020-12-2
新窗
图片
轻松解读SRE 运维体系!
可观测性系统 在任何有一定规模的企业内部,一旦推行起来整个SRE的运维模式,那么对于可观测性系统的建设将变得尤为重要,而在整个可观测性系统中 ...
1603
0
0
萨达
@
2020-12-2 17:03
来自:
IT服务管理体系与数字化转型专栏
salala
2020-12-2
新窗
图片
iTop用户手册-基本操作-连接到iTop
连接到iTop 目的:当过时的数据开始代表比活动的数据大得多时,改进搜索性能。 启用存档 默认情况下,任何类都不启用它。它只能在数据模型的根类 ...
2240
0
0
salala
@
2020-12-2 16:57
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
度量IT服务的稳定性风险
Google 标准做法是通过一个客观的指标来体现一个待优化的系统属性。通过设立这样一个目标,我们可客观地评价目前的系统表现以及追踪一段时间内的改进 ...
1483
0
0
FYIRH
@
2020-12-2 15:55
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-12-2
新窗
如何管理IT系统可靠性风险
你可能认为Google会试图构建一个百分之百可靠的服务。事实证明,超过一定值后,再提高可靠性对于一项服务(和它的用户)来说,结果可能会更差而不是更 ...
1364
0
0
FYIRH
@
2020-12-2 15:46
来自:
ITIL认证学习和流程落地实践专栏
匿名
2020-12-2
新窗
图片
总393期:李威老师《如何简单快速的度量您组织的Devops成熟度》12月2日20:00点开讲!
李威《如何简单快速的度量您组织的Devops成熟度》12月2日直播! 第393期ITIL认证专家微课堂主讲嘉宾:李威老师时 间:12月2日20:~21:00 主题 ...
1753
0
0
匿名
@
2020-12-2 14:51
来自:
ITIL认证学习和流程落地实践专栏
论坛小编
2020-12-1
新窗
图片
ITIL培训基地第392期网络讲堂—长河《2019 SRE 报告解读》视频回放
1、背景: 近15年来,SRE作为DevOps在运维视角的落地实践,对IT服务和业务系统的可靠性提供了强大的方法论和实践支持,众多互联网公司设立了专 ...
1713
0
0
论坛小编
@
2020-12-1 22:44
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
火
SRE的基本指导思想
本部分将描述 SRE日常工作背后的指导思想——工作模式、行为方式,以及平时运维工作中关注的重点等。 本部分的第一章(第3章)是最重要的一章。这 ...
1730
2
0
東東
@
2020-11-30 15:59
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
图片
莎士比亚搜索∶SRE负责的一个示范服务
为了更好地说明一个服务是怎样利用各种基础设施,以及是如何在 Google生产环境中部署的,我们在这里提供一个假想的莎士比亚搜索服务。这个服务的 ...
1631
0
0
FYIRH
@
2020-11-25 22:42
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
SRE的核心工作之一:需求预测和容量规划
需求预测和容量规划简单来说就是保障一个业务有足够的容量和冗余度去服务预测中的未来需求。这里并没有任何特别的概念,但是我们发现行业内有许多团队 ...
3011
0
0
FYIRH
@
2020-11-25 22:14
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
稳定性管理的重点:变更管理
SRE的经验告诉我们,大概 70% 的生产事故由某种部署的变更而触发。变更管理的最佳实践是使用自动化来完成以下几个项目 ∶ ● 采用渐进式发布机制。 ...
1840
0
0
FYIRH
@
2020-11-25 22:04
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
SRE日常工作:应急事件处理
可靠性是 MTTF(平均失败时间)和 MTTR(平均恢复时间)的函数(参见文献)。评价一个团队将系统恢复到正常情况的最有效指标,就是MTTR。 任何需要 ...
1333
0
0
FYIRH
@
2020-11-25 21:51
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
SRE的耳目:监控系统
监控系统是SRE 团队监控服务质量和可用性的一个主要手段。所以,监控系统的设计策略值得着重讨论。最普遍的和传统的报警策略是针对某个特定的情况或者 ...
1455
0
0
FYIRH
@
2020-11-25 21:43
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
在保障服务 SLO 的前提下最大化迭代速度
产品研发部门和SRE 之间可以通过消除组织架构冲突来构建良好的合作关系。在企业中,最主要的矛盾就是迭代创新的速度与产品稳定程度之间的矛盾。正如上 ...
1531
0
0
FYIRH
@
2020-11-25 20:18
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
SRE要确保长期关注研发工作
上文已经讨论过,Google将 SRE 团队的运维工作限制在50%以内。SRE 团队应该将剩余时间花在研发项目上。在实践中,SRE管理人员应该经常度量团队成员的 ...
1594
0
0
FYIRH
@
2020-11-25 20:10
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
我们要选择DevOps 还是 SRE ?
DevOps 这个名词是在2008年年末流行起来的,截止到本书写作时(2016年初),这个单词的具体意义仍在不断改变中。这个名词的核心思想是尽早将 IT 相关 ...
1313
0
0
FYIRH
@
2020-11-25 16:41
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
Google 的解决之道∶ SRE
SRE 这种模型是 Google尝试着从根本上避免产生这种矛盾的结果。SRE 团队通过雇佣软件工程师,创造软件系统来维护系统运行以替代传统模型中的人工操作 ...
1396
0
0
FYIRH
@
2020-11-25 16:32
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
谷歌SRE运维解密系统管理员模式
雇佣系统管理员(sysadmin)运维复杂的计算机系统,是行业内一直以来的普遍做法。这些系统管理员负责将现成的软件组件部署于生产环境中,对外提供某种 ...
1330
0
0
FYIRH
@
2020-11-25 16:23
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
谷歌SRE运维解密序言
软件工程有的时候和养孩子类似∶虽然生育的过程是痛苦和困难的,但是养育孩子成人的过程才是真正需要花费绝大部分精力的地方。但是,传统软件工程专业 ...
1487
0
0
FYIRH
@
2020-11-25 16:04
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
谷歌SRE运维解密前言
如果用一个词语来描述 Google 的历史,那就是不断地"扩大规模"(scaling up)。Google的成长经历,是计算机行业中数一数二的成功故事,标志着整个社会 ...
1426
0
0
FYIRH
@
2020-11-25 15:51
来自:
IT服务管理体系与数字化转型专栏
FYIRH
2020-11-25
新窗
谷歌SRE运维解密译者序
当我在 2016年年初听说本书的英文版即将面世时,第一时间就意识到这将是一本不可多得的经典之作。我作为 Google SRE 曾经的一员,看到本书中提到的那 ...
1497
0
0
FYIRH
@
2020-11-25 15:30
来自:
ITIL认证学习和流程落地实践专栏
姚明
2020-11-25
新窗
图片
长河《2019 SRE 报告解读》20年11月25日晚八点直播! 第392期专家课堂!
长河《2019 SRE 报告解读》 ITIL认证专家讲堂第392期 近15年来,SRE作为DevOps在运维视角的落地实践,对IT服务和业务系统的可靠性提供了强大 ...
1963
0
0
姚明
@
2020-11-25 11:42
来自:
ITIL认证学习和流程落地实践专栏
论坛小编
2020-11-25
新窗
图片
ITIL培训基地第391期网络讲堂—安杉讲师《ITIL4供应商管理实践分享》视频回放
第391期网络讲堂—安杉讲师《ITIL4供应商管理实践分享》 一、安杉讲师简介:安杉(水杉之镜)经历:16年IT从业经验,具有丰富的IT系统建设和服务管 ...
1959
0
0
论坛小编
@
2020-11-25 11:27
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-24
新窗
SRE落地实施的一些看法
对软件进行生命周期的整体性关注,这样做能够帮助Google成功地构建、部署、监控和运维世界上现存最大的软件系统。提高系统部署规模、改进可靠性和资源 ...
1285
0
0
admin
@
2020-11-24 19:52
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-24
新窗
图片
2019年SRE全球状态报告中文翻译版正式发布
本报告由长河、傅盛、姚凯、邓晓毅翻译,ITIL培训基地专家委员会发布 前言 2019年,Catchpoint连续第二年对SRE(站点可靠性工程师 ...
1513
0
0
admin
@
2020-11-24 11:53
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE如何实施数据处理流水线
读书笔记(SRE:Google运维解密):第25章 数据处理流水线 ...
1244
0
0
admin
@
2020-11-22 16:46
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE如何管理负载均衡
读书笔记(SRE:Google运维解密):第20章 数据中心内部的负载均衡系统 ...
1324
0
0
admin
@
2020-11-22 16:44
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
读书有感,SRE书籍摘录 3
22 处理连锁故障 [*]如果请求没有成功,以指数型延迟重试。 [*]为什么人们总是忘记增加一点点抖动因素呢? [*]连锁故障产生的原因和如何从设计上 ...
1055
0
0
admin
@
2020-11-22 16:44
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
读书有感,SRE书籍摘录 2
跟踪故障 [*]提高可靠性的唯一可靠的方法论是建立一个极限,同时不断跟踪改变。 测试可靠性 [*]如果你还没有亲自试过某件东西,那么就 ...
1065
0
0
admin
@
2020-11-22 16:43
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
读书有感,SRE书籍摘录 1
[*]SRE是DevOps在google的具体实践。 [*]一件事儿有可能发生就真的很有可能发生。P01是阿波罗8号上面的一个程序,一旦被人按下,就有可能造成数据 ...
1177
0
0
admin
@
2020-11-22 16:42
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE一定要学习开发技能?
SRE 其实是开发,之不过这个开发面对的业务需求是“如何保障公司业务的可靠性”。基于这个目标,DevOps 只是为了对整个环节可控的必要步骤而已,只有 ...
1207
0
0
admin
@
2020-11-22 16:39
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
对于提高系统可靠性来说,SRE到底意味着什么
DevOps和SRE似乎是同一枚硬币的两个面。他们都旨在弥合开发团队和运维团队之间的鸿沟,都想要提高软件部署的效率和软件运行的可靠性。在大多数公司中 ...
1049
0
0
admin
@
2020-11-22 16:37
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
在美团点评第21期技术沙龙的分享记录整理而成的SRE分享
SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。美团点 ...
1060
0
0
admin
@
2020-11-22 16:36
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
火
Linux之下支持SRE的几种关键技术
什么是 SRE(站点可靠性工程)? 站点可靠性工程(SRE)是 IT 运维的软件工程方案。SRE 团队使用软件作为工具,来管 ...
1582
1
0
東東
@
2020-11-30 17:03
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
我看SRE在中小型组织的运用
[ /jabbok/p/9627248.html]SRE思想[/url] 1 规模效应业务越庞大,服务器就越多,服 ...
1117
0
0
admin
@
2020-11-22 16:33
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE在优云的落地实践案例
王璞 运维环境的新变化 数人云是基于容器的轻量级PaaS平台落地企业客户时,客户很难理解一个平台背后隐含的东西,任何平台及工具都是与方法 ...
1106
0
0
admin
@
2020-11-22 16:30
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
众人所指,SRE的优势到底在哪里?
...
1178
0
0
admin
@
2020-11-22 16:25
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE应用到你的IT组织了吗?看看全球应用形势吧
[ /pc/zmt?id=2506302019&uid=c5942310b4e140a5791f435b620a9c82&sign=360_57c3bbd1&refer_scene=so_1] [/url] [TechWeb编译]一项新调 ...
1077
0
0
admin
@
2020-11-22 16:22
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
很长很长,我对运维解密SRE的笔记整理
梁铭图 读《SRE Google运维解密》是我首次比较系统地了解和学习Google内部SRE运作的指导思想、实践以及相关问题,最近又花了一些时间,仔细阅读了 ...
1245
0
0
admin
@
2020-11-22 16:10
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
大家都来学习SRE运维解密吗
这两年微服务和 DevOps 都很火,带着 SRE 也火起来了。如果这3个概念你都没听说过,那么真应该多关注些像大叔这样的 ...
1165
0
0
admin
@
2020-11-22 16:07
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
SRE学习、感想和联想
国庆长假,出门太堵,遂待在魔都,花了三天时间将《Google SRE》中文版翻了一遍,好书一本,不管是开发人员、运维人员还是架构师,都可以读一读,受益 ...
1300
0
0
admin
@
2020-11-22 16:06
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
谷歌SRE的主要工具介绍
作为一个运维老兵,也希望可以找到自己问题的答案,好在一书的上市,全面且细致的介绍了SRE工作,让我可以近距离的了解和思考未来。 ...
1378
0
0
admin
@
2020-11-22 16:04
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
一个SRE的转型道路,YY直播
运维人员是非常勤奋、爱学习的,具有非常广泛的技术视野和技能池。但在技术生态中为何总是处于一种较为弱势的、从属的、被动的地位? 我叫张观石, ...
1199
0
0
admin
@
2020-11-22 16:03
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
建立SLO和消除苦力,SRE与SLA
SRE是什么?它与DevOps有什么关系? 今年早些时候,我们([ /lizthegrey]Liz Fong-Jones[/url] 和 [ /sethvargo]Seth Vargo[/url])发布了一 ...
1571
0
0
admin
@
2020-11-22 16:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
火
哪些监控工具可以支持SRE实践?
在DevOps和SRE流行的今天,在开发可靠性或实施DevOps实践时,企业决策的核心是统计数据。而企业数据信息中最重要的一环就是线上业务的监控 ...
1530
2
0
東東
@
2020-11-30 17:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
你如何理解SRE这个新兴职位?
SRE本来也就是DevOps在运维领域的最佳实践,要说开发和运维偏哪个,感觉还是偏运维,这没毛病。 但是SRE和传统运维还是有很大区别的。 ...
1064
0
0
admin
@
2020-11-22 15:56
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
稳定性压倒一切-SRE的使命
无明 你是否也对站点可靠性工程师(SRE)这个角色存在很多疑问?本文介绍了 SRE 工程师的职责。 尽管站点可靠性工程 ...
1346
0
0
admin
@
2020-11-22 15:54
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-22
新窗
相比于DevOps,SRE需要哪些技能
最近有一位朋友和我聊职业发展方向问题,聊了不少 DevOps 和 SRE 话题。 我几年前刚接触这两个概念时也常常将之混淆,可惜当时没有人来解答我 ...
1249
0
0
admin
@
2020-11-22 15:51
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
去除谬见:对SRE的误解分析
近几年业界对 SRE 的关注越来越多,但是对于 SRE 的认知确实参差不齐,存在一些误区: 1、SRE 就是运维。只能说 SRE 包含与传统运维相近的因素, ...
1256
0
0
admin
@
2020-11-21 14:14
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
SRE到底需要哪些必要的工具?
写在前面最近花了一点时间阅读了《SRE Goolge运维解密》这本书,对于书的内容大家可以看看豆瓣上的介绍。总体而言,这本书是首次比较系统的披 ...
1192
0
0
admin
@
2020-11-21 14:12
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
神速的蚂蚁SRE团队
2020年初,新冠肺炎疫情爆发。春节后,企业要复产,百姓要复工,政府需尽快保障各项工作有序开展。如何精准防控,统筹疫情期间的各 ...
1187
0
0
admin
@
2020-11-21 14:10
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
支付宝的SRE实践之路
我在蚂蚁金服做SRE [ /profile/yydxstkvjmppk]华蒙[/url] " data-time="2020-03-19 11:42:05"> ...
1362
0
0
admin
@
2020-11-21 14:08
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
为高效 Ops 和 SRE 团队准备的 10 个开源 k8s 工具
店家小二 2018-12-17 1372浏览量 简介: 如果你正在 Kubernetes 上工作,你的 SRE 和 Ops 团队需要正确的工具来确保Kubernetes集群的高可用和在其 ...
1445
0
0
admin
@
2020-11-21 14:06
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
谷歌视角的DevOps vs SRE
SRE(Site Reliability Engineering)是最早由Google提出,又经由Google发展完善的一个崭新运维理念。如今SRE已成为一个涵盖运维理念、思路、组织架构 ...
1435
0
0
admin
@
2020-11-21 14:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
SRE职位给我们的启示
0、为什么诞生SRE? [*]原因一:企业成本的增长通用户的增长不成线性变化。但是随着系统的复杂度提升,组建越来越多,用户的流量压力 ...
1428
0
0
admin
@
2020-11-21 13:59
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
SRE报告(2019)的主要核心要点
2019 SRE 调查报告:事故处理是主要工作,SRE 压力山大 2019-04-02 15:38 来源:[ /?spm=smpc.content.content.1.16059380 ...
1306
0
0
admin
@
2020-11-21 13:56
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
谷歌SRE们如何运行生产环境
《[ /cpongo4/article/details/%5C]站点可靠性工程——谷歌是如何运行生产系统的[/url]》是一个开放的窗口,让大家可以看到谷歌在全世界范围内运行一 ...
1017
0
0
admin
@
2020-11-21 13:52
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
SRE和微服务架构如何适配
在过去的几年间,我们已经讨论过站点可靠性工程(Site Reliability Engineering,SRE)的角色,尤其这个群体如何从Google这种领域的公司得到发展,进 ...
1289
0
0
admin
@
2020-11-21 13:51
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
SRE的具体工作职责
SRE 是什么,不是什么 SRE,Site Reliability Engineering 的缩写。其中 site 是指 website,可以翻译为网站可靠性工程。这个工 ...
1358
0
0
admin
@
2020-11-21 13:45
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
火
SRE谷歌运维解密目录
粗略翻译一下目录:第一部分:介绍 [*]第 1 章:介绍 [*]第 2 章:Google 的生产环境 第二部分:原则 [*]第 3 章:拥抱风险 [*]第 4 章:SLO ...
1668
1
0
東東
@
2020-11-30 17:02
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-21
新窗
网站可靠性工程技术与管理(SRE)
分布式系统监控中的数据聚合 《SRE》这本书有两章讲监控分布式系统,分别是第 6 章《Monitoring Distributed Systems》和第 10 章《Practica ...
1181
0
0
admin
@
2020-11-21 13:41
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
中国SRE书友会群讨论话题分享(一)
话题1:Gartner 2019 年「基础设施和运维」十大趋势 1. “I&O变得比以往任何时候都更深入地参与到现代企业前所未有的领域。I&O领导者关 ...
1350
0
0
admin
@
2020-11-20 18:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
中国SRE书友会群讨论话题分享(二)
话题1:您认为的运维的定位/目标是什么? 1. 之前听过一位前辈说,他心目中的运维,是关注于基础设施可用度上,让应用的归应用,研发 ...
1474
0
0
admin
@
2020-11-20 18:00
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
谷歌SRE精髓思想浅析
Google SRE:起源 一、世界上第一个SRE专注于参与阿波罗登月计划的MIT教授Margaret Hamilton 二、Apollos计划中的SRE Apo ...
1606
0
0
admin
@
2020-11-20 16:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
图片
SRE基础知识学习脑图
感谢Liufeng绘制本脑图 谷歌SRE起源与基本概念 谷歌SRE的实践总结 SRE对企业和团队的价值
1368
0
0
admin
@
2020-11-20 15:55
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
SRE Foundation系统可靠性工程认证培训内容介绍
SRE介绍了通过自动化、工作方法和组织重组的混合措施来提高服务可靠性的一系列实践。雅菲奥朗作为国内首家SRE认证培训和考试官方授 ...
2264
0
0
admin
@
2020-11-20 14:52
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
附件
SRE 工作职责金字塔
传统行业运维模式 • 系统管理员 (Sysadmin) • 将现成的组件组装、部署为服务 • 响应事件与更新 • 随着服务规模增长,团 ...
1207
0
0
admin
@
2020-11-20 12:14
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
附件
谷歌运维解密翻译作者讲解SRE
• 生产线管理员 • Ensure user-visible uptime and service quality • Authority over production environment. • 跟网 ...
1153
0
0
admin
@
2020-11-20 12:11
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-20
新窗
图片
SRE基础讲义一览
1349
0
0
admin
@
2020-11-20 10:17
来自:
IT服务管理体系与数字化转型专栏
FDJSC
2020-11-19
新窗
火
iTop添加字段问题
我想在iTop上进行二次开发,添加一些字段,按照http://ITIL-foundation.cn/forum.php?mod=viewthread&tid=43336这个帖子一步一步来,但是在创建空白Da ...
10955
28
0
東東
@
2020-11-20 14:32
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
为什么我们的客户的体验是这样
P40 重点四:SRE的未来是遥远而光明的 当我们努力关闭今年的报告时,我们将供应作为最后一个数据点,而各公司则重 ...
1141
0
0
admin
@
2020-11-19 18:04
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
您的网站或应用在家中经历了更多或更少的事件吗?
P37重点四:SRE的未来是遥远而光明的您的网站或应用在家中经历了更多或更少的事件吗?“在家”期间的事件更少在“在家”中大致相同“在家”期间发生更 ...
1162
0
0
admin
@
2020-11-19 18:03
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
主动与被动式之间的差异(向被动式净赚2%)
P34 重点四:SRE的未来是遥远而光明的 考虑到要转移到一个完整的,分散的劳动力队伍中,我们希望再看看其他变更因素,以便为决策者提供输入点 ...
1199
0
0
admin
@
2020-11-19 18:02
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
通过观察能力转向预防措施,首先减少事故
P31 重点三:转向远程带来机遇与挑战 在2019年的SRE报告中,重点放在劳力和压力上。我们嘲笑可能会有一些预期的响应: ü 使用自动化减少工作量。 ...
1444
0
0
admin
@
2020-11-19 18:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
使用自动化可以自动解决的问题和事件占百分之几?
P28重点三:转向远程带来机遇与挑战 使用自动化可以自动解决的问题和事件占百分之几?自我修复问题的百分比受访者百分比 45%的人表示监控技术太耗时 ...
1249
0
0
admin
@
2020-11-19 18:01
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
SRE工作占劳动的百分之几?
P25 重点三:转向远程带来机遇与挑战 “我发现每天带我的孩子一起在家里是体验压力最大的部分。 一般而言,保持工作与生活的平衡可能很困难,但 ...
1384
0
0
admin
@
2020-11-19 18:00
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
火
IT运维转向远程带来机遇与挑战
P22 重点菜3 转向远程带来机遇与挑战 将新出现的或以前被忽略的挑战转变为战略差异化的机会。 着眼于士气,员工体验,工作/生活平衡以及员工 ...
1954
1
0
東東
@
2020-11-30 17:04
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
关键要点2:成本带来了沉重的操作负担
P20 关键要点2:成本带来了沉重的操作负担 一旦SRE工作并且价值被认可,就可以开始对其进行奖励了。为了获得支持,请将对话附加到某些类型的业 ...
1205
0
0
admin
@
2020-11-19 17:57
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
系列内容一览,SRE报告2020 10
P18 关键要点2:成本带来了沉重的操作负担 如果对火没有反应,那么我们可能会认为我们所做的一切都是积极主动的。与其孤立地讨论实现价值的 ...
1311
0
0
admin
@
2020-11-19 17:55
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
二零二零站点可靠性工程报告 9
P16 关键要点2:成本带来了沉重的操作负担 谁在您的组织中执行SRE活动? 我们拥有一支专门的SRE团队,与其他运营/管理团队分开46% DevOps ...
1053
0
0
admin
@
2020-11-19 17:49
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
SRE的状态调查报告 8 主要内容
P14 关键要点2:成本带来了沉重的操作负担 如果拥有系统的成本中有90%是在部署之后(即向右转移),那么为什么企业仍然采用主要为ops类型 ...
1117
0
0
admin
@
2020-11-19 17:48
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
SRE发展状况报告之7
P12 关键要点1:存在可观测性组件;可观察性不 服务级别上是否存在运行状况监控,以能够检测到中断或性能或绩效问题(在服务级别上)? ...
1162
0
0
admin
@
2020-11-19 17:46
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
全球SRE状态调查report 6
P10(仅图表,便采用以下格式呈现) 关键要点1:存在可观测性组件;可观察性不 关键 点 1:可观测性组件存在;可观测性不存在 SRE团队在多大程度 ...
1119
0
0
admin
@
2020-11-19 17:46
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
站点可靠性工程师report 5
P8关键要点1:存在可观测性组件;可观察性不 还值得讨论的是,第三方缺乏足够的关注或可视化。根据HTTP Archive的数据,有93%的页面至少包含一个第三 ...
1081
0
0
admin
@
2020-11-19 17:45
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
报告2020 SRE观点 4
P7 关键要点1:存在可观测性组件;可观察性不 如果可观察性的学术定义是“可以从对外部输出的了解中推断出系统的内部状态如何”,那么我们必须 ...
1284
0
0
admin
@
2020-11-19 17:44
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
理解这些SRE 报告的核心内容 3
P6 关键要点1:存在可观测性组件;可观察性不 确定您提供的服务在哪里收敛到典型的[数字化]体验消费点,然后从那里开始进行工作。问:“用户可 ...
1102
0
0
admin
@
2020-11-19 17:43
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
SRE report 主要观点 2
P6 关键要点1:存在可观测性组件;可观察性不 确定您提供的服务在哪里收敛到典型的[数字化]体验消费点,然后从那里开始进行工作。问:“用户可 ...
1189
0
0
admin
@
2020-11-19 17:42
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
SRE report 核心要点1
P4 介绍 从问题开始,“当您向软件工程师要求设计运营团队时会发生什么?”结果为:“ SRE团队负责其服务的可用性,延迟,性能或绩效,效率,变更 ...
1116
0
0
admin
@
2020-11-19 17:42
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
图片
火
SRE知识体系全图
SRE知识体系全图
2136
2
0
東東
@
2020-11-30 15:39
来自:
IT服务管理体系与数字化转型专栏
admin
2020-11-19
新窗
图片
SRE核心知识分享
1491
0
0
admin
@
2020-11-19 17:30
1 ...
14
15
16
17
18
19
20
21
22
... 204
/ 204 页
下一页
社区精华
ITIL培训基地,实战派!_快速进入
ITIL培训基地系列课程之:DOI DevOps Found ...
【热点】2024,大连ITIL Meetup成功举办!3 ...
ITIL培训基地干货下载中心
讲堂回放:476期 丁振兴 《开源运维工具使 ...
提升IT服务管理效率与质量是引入自动化工具 ...
最新回复
2024-11-9
ITIL 4 Foundation培训课程,《ITIL 4服务 ...
2024-11-9
ITIL 4 中级证书及大师级证书认证路径
2024-11-9
ITIL 4 中级培训课程 管理模块MP:指导、计 ...
2024-11-9
ITIL 4战略领导者认证课程:数字化和IT战略 ...
2024-11-9
ITIL 4 中级培训课程 管理模块:创造、交付 ...
2024-11-9
ITIL 4 中级培训课程 实践经理模块:监控、 ...
2024-11-9
ITIL 4 中级培训课程 管理模块MP:驱动干系 ...
2024-11-9
ITIL 4 中级培训课程 管理模块MP:高速IT( ...
ITIL培训
|
网站地图
粤ICP备17056641号
Powered by
ITIL
© 2001-2025
返回顶部