我们现在的运维工单管理系统不能进行数据统计和分析,有什么解决办法吗?

报表分析,决策无忧:报表统计分析与自动发现

1.网管软件中的报表为管理和决策提供了重要的依据,通过数据的整合和智能分析,将重要的监控指标结果直观的展现给用户,为网络运维管理系统提供完善的统计和分析报表
  2.网络管理系统提供各种类型的报表模板,可直接启动,进行订阅。支持自定义报表模板,各种类型,时间和模版权限
  3.历史数据进行分析,提供自定义时间,可多个设备和多个指标进行对比分析
  4.网强网络管理软件中智能巡检基于日常工作流程管理系统,以用户实际巡检情况出发,实现无人值守的定期巡检 
  5.网络管理系统可以支持按不同巡检内容和设备制定周期性的定点智能巡检,自定义添加检测点,构建巡检规则 
  6.网络管理系统以模板规范标准值为依据,根据预设的要求进行数据采集,进行自主学习和分析判断,进行定期巡检 
  7.网络管理系统以报表的形式直观反映巡检结果,系统会定期生成并主动发送运维人员
  8.网络管理系统支持对系统监控巡查的整体进行评价和备注说明,导出多种格式向领导汇报

不知道什么时候,阿里云的工单系统改版了,突然有一天提交工单,发现变样了,一瞬间还有点惊喜。

但是当我用了一段时间以后,才发现我错了,阿里云还是那个阿里云,改版只是为了他的极速工单包,然后并不是为了用户体验,并不是为了更好的解决客户的问题。

来看看阿里云怎么介绍他的“极速工单包”:

阿里云为您提供7×24小时的免费工单服务,解决您使用产品的售后问题,响应时间按问题优先级分别为:一般工单<120分钟,重要工单<90分钟。如果免费工单不能满足您的服务时效性诉求,您可以通过极速工单进行工单加急(收费),极速工单支持响应时间<10分钟。选购该服务后,可以在提交工单时选择是否使用极速工单。

基本上41元左右一个工单,至于值不值这个钱,看个人。

看下增值和收费标准对比:

下面来说说,使用阿里云改版工单以后的体验感受(只说免费版,收费版的极速工单没有体验过)。

1、提交工单的初始内容比原来少填了很多,这个体验很好,但是仅限于改版以后的第一次使用。

为什么这么说,因为你第一次提交的并不是真正的工单,只是相当于你在阿里云的帮助文档中查询你的问题描述。

然后阿里云机器人就根据你的描述,给你推一推没用的帮助文档,问你有没有帮助?最后你要点"无帮助",才算正式提交成功。

问题是我在一开始提交工单就是选的“创建工单”,而不是“智能在线”,我已经很明确了不需要智能机器人。

这就相当于我去面馆吃面,我给老板说来一份牛肉面,老板问你饿了吗?你要回答我饿了,不然老板不给你下面。

2、工单的响应周期明显比没改版之前慢了不少,毕竟人家也说了,想要快,给钱啊,不然就慢慢等吧。只要一般工单响应使用没超过120分钟,重要工单没超过90分钟,他都有理,随叫你没给钱呢?

反正给我的感觉就是,我是行业大佬,什么我说了算,哪怕是不是客户的原因导致的各种故障,只要不给钱你就慢慢等着吧。

你要搞工单增值服务,也要看工单性质吧,明明就非人为原因,还要我出钱让你让你快速处理。果然采购之前客户是上帝,买完以后有问题了客户就是孙子。

而且现在工单界面类似聊天窗口,总会给我一个错觉,在和对面聊天,不是很工单的感觉,聊天就聊天,你倒是回复快点啊。好比中午11点40,我给同事发了一个微信消息,“等下中午准备吃啥一起去呗”,然后下午一点,收到一条消息,“吃牛肉面,我已经吃过了,你自己去吧。”我:“xxxx”。

3、处理工单的售后工程师明显技术能力下降了不止一个档次,人家也说了,要高级工程师,给钱呗,不然就找几个刚来的陪你聊聊天呗。

很多时候我估计处理工单的售后工程师都不清楚自己产品的功能,回复也是各种官腔,各种模板粘贴敷衍了事。

下面来一起来看看,这免费的工单是有多专业:

这个是以前的工单,主要发现他们的API接口返回数据的时候,少了一个参数,于是想反馈一下,这个工单没什么,只是一个铺垫,来看看工单。

灵魂拷完:您的业务需要精确到毫秒来排查慢sql 吗?

然后喊我去他们的聆听平台反馈,我也去反馈了。

3月份我再次去测了一下API接口,依然没有这个参数。

然后“天真”的又跑去提了工单问了问:

看到上面这个回复,是不是似曾相识?

我不知道这个工程师,搞清楚问题在哪里么,我提供实例ID能解决什么问题,又不是我的实例问题,总喜欢让客户提供一些没屁用的信息,找不到问题的重点在哪里,一个接口返回数据少了一个字段而已,又不是我提个性需求,明明两个类似的产品一个可以,一个不可以,这很显然是漏了。

现在搞得只有我的实例API接口返回的少了一样。大厂流程再多,再繁琐,这么一个小bug,那么11月份反馈到现在4月份了,依然没有得到解决。

那么要么是,售后工程师没有根本就没有反馈;要么就是反馈了,他们觉得这个不是漏了,就是不返回精确字段。

阿里云的RocketMQ,改版以后控制台有个小bug(消息轨迹,页面内容超过窗口以后,不能滑动,导致页面以为的内容无法查看,但是缩小放大浏览器以后就正常了),这个bug刚改版使用我就发现,没想到过去大半年依然没有修复。

又让我提供一堆没什么用的信息,一个前端显示的bug,提供这些信息能有什么用,又不是消费生产消息有问题,还要给msgid。又喊我自己去反馈....

给我的感觉是这个工程师都没搞清楚问题是什么,处于蒙圈的状态。

阿里云的DBS出现了很多次无缘无故的故障。

过了一天直接给我来一句:无法增量备份,真的无力吐槽。

1月份反馈的回复,出现问题再找他们处理,会优化,然而...

根据他的描述,我问他改成非集群的地址行不行,他来句应该可以。

搞到现在,是他们在找问题,我在找解决方案,搞得他们买的我的产品。

然后又是一击灵魂拷问:polardb 本身就有备份, 您为什么要用 dbs 再做一次备份呢? 是业务上有什么需求吗? 

就差点直接的问:你为什么要买我们的这个产品?为什么?为什么?吃饱撑的吗?好比我去外面吃饭,老板拷问我,你家里没有锅吗?是饿了吗?跑我这里来吃什么饭?我:xxx,我家锅坏了,饭煮不熟行不行?

,拷问一下,你确定你这免费版的工单请的不是腾讯、华为云的卧底?

然而我在试了以后,果然正常了,这么简单就能解决的问题,拖了4天,然后我的备份就4天没有正常备份。

最后说一句,不要相信阿里云的产品有多牛逼,多稳定,因为之前就差点因为阿里云RDS自带的备份出现异常,导致没有备份数据可以恢复。

当时线上数据出现问题,准备恢复某一节点的时候,发现自带的备份有问题,没办法恢复,不过还好做了冗余备份,没造成什么损失。

作为个人用户使用腾讯云几个月了,中间也因为各种技术问题提交了几个工单(免费的),才感觉到阿里云售后和腾讯云售后差的不是一点半点。为什么今天来更新这个,因为今天又在腾讯云提交了一个工单,关于cos签名问题的,给我感觉太好了,半小时不到就找到的问题原因。当然我也看了相关文档,但是并不知道什么原因,如果是阿里云我都知道他们会怎么回复,把相关文档连接丢给你,然后就说你代码问题,然后就是各种粘贴复制的标准回复。

用了几个月腾讯云的感受:

1、首先就是响应速度,免费工单腾讯云基本几分钟就响应了,中间的交互也不会等待很久。

2、腾讯云售后技术工程师给我的感觉比较专业,对自己的产品很熟悉,没有那种问牛答马的情况。

3、很多问题基本一小时就给你解决了,不像阿里云一个简简单单问题,就是要拖拖拉拉两天还不一定找到问题。

4、阿里云的工单,我很少10分,偶尔会有一个,腾讯云工单基本都是10分。

阿里云的工单提醒改版以后一直都是一个坑,改版以后一段时间,都没找到哪里去设置默认的通知人,好不容易在工单页面找到修改通知人的信息,但是是没个工单都要设置一次,非常繁琐。

上个月在提交工单的时候,突然发现多了一个选项,“设置为默认”。

我个人的理解是,把这个通知人设置为 新创建的所有工单的默认的通知人。但是我错了,阿里的文字很难用常理去理解。

设置了几次,提交了几次工单,通知人还是账号信息。期间有几个工单,我还截图问题了下这个是没生效,还是时其他功能。

但是每次处理工单的技术都选择性过滤这个问题,最后只能单独提交一个这个问题的工单咨询一下,好家伙这次真正让我见识到了摸鱼界大佬。

11:35 技术:回复我已经收到我的问题。(我猜应该没看我的问题然后直接复制接粘贴或者是自动回复吧)

15:42 技术:回复我让我描述下问题。

15:43 我:回复工单。

17:20 技术:回复我问我是在做什么业务时候出现的问题

17:30 技术:下班。。“哈哈,又是忙碌而愉快的一天。”

第一次回复是他们承诺的响应时间<120分钟。

第一次和第二次回复间隔的4个小时,我就不相信,你有这么忙。

这7个小时,我不知道这个技术看过我提交的截图没,截图中几个黑体打字 写着 “工单提醒”我不知道阿里哪个产品还有工单提醒,哪个产品还叫工单,后面还有一行小字“请确认工单提醒的接收方式”。


· 国内领先的云计算增值服务提供商

运维服务体系建设的内容

结合目前的实际情况,统一制定运维管理制度和规范。制度体系内容要涵盖机房管理、网络管理、资产管理、主机和应用管理、存储和备份管理、技术服务管理、安全管理、文档管理以及人员管理等类别。

运维技术服务平台由运维事件响应中心、运维管理系统、运维知识库和运维辅助分析系统构成

运维流程管理系统的建立,可以使日常的运维工作有序化,职责角色清晰化,能够有效地提高解决问题的速度和质量,使运维部门内的相关支持信息更为畅通、透明、完整,实现知识的积累和管理,更好地进行量化管理和设定优化指标,进行持续地服务改进,最终提高整个运维工作的效率和质量。

运行维护知识库由知识库平台和知识库内容两部分组成。知识库平台包括知识检索、知识维护与管理等,可以通过纯Web方式向服务请求对象提供基于Web的查询服务和检索服务,以完全共享知识库中的知识,在提供Web服务时,还可通过响应中心平台来即时地响应用户请求的服务。

以日常监控平台、运维响应中心、运维流程管理系统为基础,通过统计分析,了解运维服务能力与服务质量的现状,并可以进行趋势分析,为运维管理决策提供支持。

针对目前信息系统IT资源现状以及对技术支持的需求,组成各类别维护人员的专家队伍,集中的开展运行维护工作。

为确保运行维护工作正常、有序、高效地进行,必须针对运行维护的管理流程和内容,制定相应的运行维护管理制度,实现各项工作的规范化管理。运维流程管理平台、运行维护知识库、运维辅助分析系统等的使用、维护的有关制度。


你好,我是做安全的,开发和运维方面都接触过一些。
运维刚开始的话,如果没有自动化部署的环境或者使用容器技术等,就要先能保证自己对主机的各种操作玩得6,首先确保业务的可用性嘛。
然后就是监控,监控的开源工具也很多比如管理,可以设置报警等等。
再之后就是故障恢复,你的当前规模应该还不用建一个日志分析系统,可以主动根据监控的报警信息或者主机上的错误日志来做故障恢复,以后业务规模大了还需要灾备和考虑安全方面的内容,比如多用用渗透测试的工具做漏扫、配置检测等等,推荐kali和lynis。现在处于创业的规模优先保证服务可用啦~
最终建立好 “标准-流程-自动化” 体系就既规范又省心了。

掘金企服隶属于掘金集团,是一家致力于为中小微企业“从创业到上市”全生命周期服务的互联网科技服务公司。掘金企服采用全自营服务模式,拥有北京市最大的工商服务自营团队。

建立符合通用要求及企业自身特点的IT运维服务目录

企业的运维服务目录大类要与IT运维服务目录标准一致,其中一级服务目录包括基础环境运维服务;硬件运维服务;软件运维服务;安全运维服务;运维管理服务及其它运维等六大类,二级包括如网络运维服务;主机运维服务;应用软件服务等十三小类。要求IT运维服务企业为甲方提供的运维服务目录要细化到二级,且要根据实际的提供的运维服务内容进一步细化。在IT运维服务目录中要详细介绍每种服务的具体服务内容、服务方式、运维过程中的交付成果、成果交付的频度等参数。甲方一般只需要参照IT运维服务企业提供的服务目录选择需要的运维服务项目即可,并按照选择IT运维服务项支付相应的服务费用。运维服务企业在与甲方签订的《IT运维服务协议》中要明确具体的IT运维服务项及每种服务的具体服务内容、服务方式、运维服务过程中的交付成果、成果交付的频度,服务人员能力要求,运维服务水平评价标准,备品备件的提供等方面,并有可量化,可评价等属性。

依照企业的IT运维服务目录和运维服务需要制定相应的管理制度

为给甲方提供规范、安全、可靠的运维服务,IT运维服务企业需制定一套科学、完整、详细、且与IT运维服务目录相匹配的运维服务管理制度。包括完善的管理组织结构,明确的岗位职责、人员素质能力要求、工作流程和管理制度等方面。如人员管理规范,资源管理和储备规范,事件响应规范,问题管理规范,监督管理规范,质量管理规范,信息安全管理规范,知识库(财富库)管理规范,服务台管理规范等。另外还包括在实施运维服务项目过程中所需的各类模板。如运维服务计划,监督管理计划,培训计划,服务报告,季度报告,事件报告单,问题处理单,满意度调查单等。

在实践中,IT运维服务企业以管理制度为保证、以运维服务计划为依据为甲方提供良好的运维服务保障。IT运维服务企业若要参加IT运维能力(ITSS)评估还需要参照《ITSS通用能力评估申请表》中要求提交的18个文件。

构建完善的运维服务体系还需从IT运维服务合同着手。IT运维服务企业要规范要求与甲方签订的运维服务合同,合同中不仅要规定服务的内容,合同价格,还应该依据运维服务目录和客户的运维服务要求,起草包括详细服务条款的《运维服务合同》附件。一般包括服务内容(服务项),服务方式,每项服务的服务质量要求的关键量化指标,服务质量报告的提交方式,提交的频度,服务评价基准等方面。合同是运维服务方为甲方提供合格运维服务的依据,所以运维服务企业要在甲方允许的范围内,尽量细化服务指标,至少应细化到服务目录中所展示的级别。

明确组织内成员的岗位职责

依据运维服务目录和运维服务项目要求制定完善的岗位职责制度,包括管理岗位和运维服务岗位两类。一般包括明确的岗位职责说明,清晰的岗位考核指标体系和对应的监督和考核机制。

为保证运维服务企业给甲方提供优质的运维服务,运维服务企业需要建立两级监督服务体系。第一级是项目级监督。项目经理对项目成员的工作进行监督,项目成员之间也可相互监督,保证运维服务工作顺利开展,出现问题时能按照问题的应急预案及时解决。第二级是组织级监督。组织级主要是公司高层主管领导和有关的管理部门,公司高层主管领导及有关的管理部门应该对运维服务项目的状态进行监督和控制。保证运维服务项目按照计划执行,同时在项目层和组织层的监督范围内。组织级的监控主要集中在服务台,服务台的工作主要包括日常的事件受理、派单、回访等,还包括满意度调查等。

服务台是运维服务的中央处理器,用以接收客户的事件报告并及时予以处理、回访,接收客户投诉等。IT运维服务企业要建立服务台,并有服务台管理机制。服务台接到的事件报告后,常规事件通过服务台直接解决,非常规事件或无法通过服务台解决的事件,服务台要按照相关制度派发工单,安排运维工程师到现场解决。服务台还应定期或不定期对客户就运维服务的满意度进行调查,并对调查数据进行分析统计,并通报有关部门和成员。

运维服务管理体系中包括策划、实施、监督、改进等环节。PDCA机制应覆盖到运维服务的各环节,各方面。如运维服务管理制度、服务流程、服务质量、服务能力、资源、技术等。

IT运维服务企业构建完善的IT运维服务体系,要从制度、流程、人员、技术、资源等方面入手,力争做到制度全面,流程规范、清晰,人员职责明确,技术成熟,资源能满足运维需要。若从ITSS评估的角度来看,目前大多数运维服务企业主要问题突出表现在流程不够规范,制度落实不到位,实际中以人治为主,法治为辅;人员岗位职责不详细;备品备件类资源储备不达标;缺乏有效的监督机制;缺少完整的实施记录;缺少改进机制;缺少内审等。建议企业从基础抓起,做好内部审核,构建完善的运维服务体系。

下载百度知道APP,抢鲜体验

使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

我要回帖

更多关于 数据库运维 的文章

 

随机推荐