郑州抖音代运营,郑州短视频落地陪跑,企业抖音宣传片,短视频广告片选朗创营销! 13683819778 联系我们 在线客服
从DeVoPS到AIOPS,Ali是如何实现智能操作和维护的
发布时间:2018-08-22 17:13:50 来源:郑州短视频


随着搜索业务的快速发展,搜索系统正朝着平台、操作和维护模式的转变,在人肉操作维护、脚本自动操作和维护的体验中,最终演变为DeVOPS。对于大数据和人工智能,传统的操作维护方法和解决方案已不能满足需求。

基于如何提高平台的效率和稳定性,减少资源,我们实现了在线服务优化大师HaKeEE和容量规划平台PARK。经过几年的沉淀,我们在四个方面做了更好的实践:分配的合理性。详细介绍了鹰眼和火炬的体系结构和实现。

1)HOKEYE底层分析项目:基于眨眼完成数据处理工作,重点对访问日志分析、全数据分析等。本项目侧重于底层数据分析,具有强大的眨眼数据处理能力,日常搜索平台FO所有HA3应用程序访问日志和完整的数据分析。

2)一个按钮诊断工程鹰眼经验:基于鹰眼闪烁的分析结果,更方便用户分析,如现场信息监控,包括字段类型合理性,字段值单调性监测,除了但不限于KMON无效报警,SMOK-CASE条目,发动机退化配置等。内存相关配置,推荐行数配置,以及切换时的最小服务线比。

HAKEKE经验项目定位为发动机诊断平台,它将为正常操作和维护人员的发动机优化和维护的经验积累到系统中,从而使每一个新的应用程序都能快速享受这样的宝贵经验,而不是通过反复的坑步,使每个用户都有一个,我们的目标是优化我们的引擎在一个类似于智能诊断专家的角色,这是我们继续奋斗的动力。鹰眼经验的数据处理流程如下:

对于HA3引擎,引擎字段被划分成倒置索引、属性和摘要索引。引擎的锁定策略允许您为这三种类型的索引设置锁或无锁内存。锁内存的好处是不言而喻的,加速访问和减少RT,但是想象一下,在100个字段中,如果只有50个在两个月内被访问,其他字段在索引中根本不被访问,造成巨大的浪费宝贵的内存。下面进行了分析和优化,并对头部应用进行了针对性的索引瘦身,下面是一个锁内存优化过程,总共节省了几百万元。

慢速查询数据来自于应用程序的访问日志、查询的数量和访问应用程序的数量,通常在数十甚至数十亿级别。从Blink的大数据分析中获得大量日志中的Topn慢速查询属于大数据分析的范畴。我们采用分治+散列+散列+小堆方法,即先解析查询格式,得到查询时间,然后取解析后的K-V数据MD5值,然后根据MD5值切片,计算每个切片中的Topn慢查询,最后得到最终结果。在所有的Topn.Topn中,为了分析Topn慢速查询,向用户提供个性化优化建议,从而帮助用户提高引擎查询性能,间接增加引擎容量。

我们通过健康评分来测量发动机的健康状况。用户可以通过健康评分清楚地了解他们的服务健康状况。诊断报告给出诊断时间,简要描述不合理的配置和细节、优化的好处、诊断逻辑和单击结果诊断后的结果页,如图所示,详情页由于空间而未列出。

随着应用的不断增多,平台所回答的问题数量也在不断增加,但在回答问题的过程中,不难发现大量的重复性问题,如增量停止、常见资源报警咨询等,这些问题都是固定的。HAKEYE结合KMN指示符和可定制的报警消息模板,并将诊断方法添加到报警文本中,智能地回答这些问题。用户在应答组中粘贴诊断文本,并在机器人上得到报警的原因。

鹰眼主要从智能诊断和优化的角度来提高效率和提高稳定性。火炬从能力治理的角度着眼于降低成本。随着搜索平台应用的增加,如以下问题,容易造成资源利用率低和机器资源浪费严重。

1)业务应用容器资源任意性,造成资源成本的严重浪费,需要基于集装箱成本最小化的明晰引导业务,应合理应用多少资源(包括CPU、内存和磁盘)或资源管理屏蔽用户。

2)业务变化在继续,没有人知道在线能力能承载多少(或多少QP)。当业务需要增加流量(例如各种促销)时,是否需要扩大规模如果扩展是扩展或增加单容器CPU规范当业务需要增加数据量时,拆卸或扩展单个容器的内存大小是否合适如此多的问题和疑问将成为商界的话题。

如下图所示,现有的容量评估资源是KMON数据,在线系统的状态被报告给KMON。能否直接分析KMON数据进行容量评估

实际的实验发现是不够的,因为在线路上有许多应用水位相对较低,拟合出高水位的能力不够客观,因此需要一个压力测量服务来真正地找出性能的容量,带压力。E测量下一个需要解决的问题是哪里去按压由于压力机生产线的高风险,报废机的有限机构找不到真正的底线,因此有必要克隆仿真,在实线上克隆一个实例,然后对压力机进行测试,使其准确、安全。下一步是通过算法分析找出资源分配的最低成本,通过以上几个核心支持,通过任务管理模块对每个任务进行管理,进行自动容量评估。

以上是我们的解决方案,下一步将给出总体架构,然后具体实现核心模块。

从底层到顶部,首先是访问层,为了访问平台,只需要提供平台下的每个应用程序的应用信息和集群信息(当前正在访问的Hi3和SP下的SP)。应用管理模块集成应用信息,然后任务管理模块将每个应用抽象为一个容量评估任务。

一个完整的能力评估任务的一般过程是先克隆一个病例,然后自动将克隆病例的压力测量到极限容量。压力数据和每日数据由数据工厂处理,以将格式化的数据传送到决策中心。决策中心首先计算压力数据和每日数据,然后对方法服务进行容量评估,然后判断收入。如果收入高,则结合所提出的算法容量优化进行克隆压力测试验证。通过保持结果,进行简单的容量评估(结合由压力测量的极限性能的简单容量评估)来验证故障,并完成容量评估并确定故障。在不浪费资源的情况下克隆和测试应用的资源。

顶部是应用层。考虑到火炬能力管理不仅为TISPUS定制,应用层还提供了大容量磁盘、容量评估、容量报告和其他平台访问和嵌入的收入磁盘,并且还提供了用于其他系统调用的容量API。

容量评估还依赖于搜索许多其他系浙江网站建设统,如MAAT、KMON、HAKEYE、DROGO、成本系统,以形成闭环。

克隆模拟被简单地理解为克隆应用上的一个应用实例,HA3的应用是克隆一条完整的线,SP是克隆一个单独的服务。随着HIPPO搜索的出现,资源被用作容器,并且随着Deops的发展,如苏伊士OPS和SCOON,可以快速克隆应用程序。下面是克隆控制模块的实现:

目前,克隆被分为浅克隆和深克隆。浅克隆直接拉索引主要应用通过阴影表进行HA3应用,消除了构建链接加速克隆。深克隆是克隆的需要离线构建的应用。

考虑到大多数KMN数据应用缺乏高水位的度量指标,而发动机的实际容量只能通过实际压力测量获得,所以需要压力测量服务,初步研究该公司的亚马逊压力ME。测量平台和Ali MOM压力测量平台,发现不能满足自动压力测量的需要,所以我们研制了一种分布式自适应计量服务,自适应地增加了WOKER的压力。

能力评估的目标是最小化资源成本,提高资源利用率,因此,有必要通过资源来量化资源,而成本也是搜索平台走向平台价值的重要维度。大量的实验分析发现,这个问题可以转化为约束规划问题,优化目标函数是价格公式(有内存CPU磁盘几个变量)的约束条件是提供容器规格和数量。容器必须满足最小QPS内存和磁盘需求。

TyPro搜索平台上的鹰眼诊断优化和焊炬容量管理大大降低了成本,提高了效率和稳定性,为AiOPS应用于其他在线系统建立了信心,因此下一步是鹰巢和火炬集成的AIOPS平台公司。因此,开放性和易用性是平台设计的两个主要问题。

运营维护指标库:对在线系统的日志、监控指标、事件和应用信息进行标准化和集成,以便于在实施策略过程中获取各种操作和维护指标。

操作和维护知识库:通过ES提供检索和计算功能,以沉淀日常问题中积累的问题集和经验,并有助于类似的在线问题的自动诊断和自愈。

操作和维护组件库:将克隆模拟压力测量和算法模型进行组件化,以便于用户灵活地选择策略实现算法,并易于克隆模拟和压力测量来验证优化重构。有效地终止。

操作维护策略库:用户通过画布拖拽UDP,快速实现自己的系统操作维护策略、操作维护索引数据库、操作维护知识库和操作维护组件库提供RIC各种数据和组件,使得操作和维护策略的实施足够简单。

基于上述的基础设施建设策略,可以在各种运行维护场景中生成数据,可以理解故障处理、智能答疑、容量管理和性能优化等各种场景的应用。我进行了。

本文是一个分享AIOPS实践的阿里搜索中国台湾技术丛书。搜索中国台湾已经从0年发展到1年,但离我们在世界上不难使用的搜索远非如此。未来的道路必然充满挑战,无论是从商业角度看SaaS的能力、搜索算法的生产力、云DevO。PS AOPS,或商务站建设,将遇到世界级的挑战等待我们挑战。

相关新闻
  • 抖音衣柜定制运营

    日期:2023-11-09 浏览次数:0

  • 抖音场景化短视频

    日期:2023-07-14 浏览次数:0

  • 短视频的氛围选择怎样才能享受短视频的快乐

    日期:2023-07-13 浏览次数:0

  • 短视频到底是什么,从新秀到热门再到成熟

    日期:2023-07-13 浏览次数:0

  • 抖音视频怎么有声音,让抖音视频有声音的方法

    日期:2023-04-28 浏览次数:0

  • 短视频导入商品库

    日期:2023-07-13 浏览次数:0

  • 凤阳抖音视频是怎样的,震撼人心的表现形式

    日期:2023-04-28 浏览次数:0

  • 简单概括抖音运营的重要性

    日期:2023-11-15 浏览次数:0

  • 抖音视频怎么上推荐,抖音视频怎样才能上推荐

    日期:2023-04-28 浏览次数:0

  • 抖音物流运营面试的流程和注意事项

    日期:2023-11-15 浏览次数:0

  • 抖音视频怎么取消水印,如何在抖音视频中去掉水印

    日期:2023-04-28 浏览次数:0

  • 抖音视频用什么拍,抖音视频拍摄神器推荐

    日期:2023-04-28 浏览次数:0

  • 抖音视频怎么去掉视频,如何去掉抖音视频中的片段

    日期:2023-04-28 浏览次数:0

  • 范丞丞的抖音视频是怎样的,范丞丞在抖音上发布新视频

    日期:2023-04-28 浏览次数:0

  • 如何做好企业抖音网站运营工作

    日期:2023-10-12 浏览次数:0

  • 抖音视频怎样重拍,重拍抖音视频的方法

    日期:2023-04-28 浏览次数:0

  • 了解抖音客服远程运营的工作内容和要求

    日期:2023-10-12 浏览次数:0

  • 抖音视频怎么加快点,如何让抖音视频更加流畅播放

    日期:2023-04-28 浏览次数:0

  • 抖音视频用什么拍高清,选择合适的拍摄设备

    日期:2023-04-28 浏览次数:0

  • 抖音视频游览顺序是什么,抖音视频游览顺序有哪些

    日期:2023-04-28 浏览次数:0

13683819778 

短视频

填写您的服务需求,获取项目报价。

* 请认真填写需求信息,我们会在24小时内与您取得联系。

河南朗创网络营销

电话:13683819778

微信:18530930310

地址:郑州市惠济区文化路英才街交叉口郑北商城2号楼

邮箱:271733875@qq.com

郑州抖音短视频代运营、郑州抖音短视频推广获客、郑州抖音信息流代运营 朗创营销 版权所有 Copyright 2014-2023 . All Rights Reserved