【编者按】为深入贯彻落实党的二十大精神,引导基金行业机构践行《证券期货业科技发展“十四五”规划》,共促基金行业数字化转型,按照中国证监会总体工作部署,于2022年11月开展“证券期货业数字化转型主题宣传月”活动。通过开展“证券期货业数字化转型主题宣传月”活动,搭建交流平台,展现数字化转型成果案例,激发金融科技创新活力,营造金融科技长效发展新生态。该篇为“证券期货业数字化转型主题宣传月”《我与金融科技的故事》征文之三。
固运维基座之本,提智能分析之效
——富国基金 张诚
加入富国基金八年,见证了运维保障组的监控系统,从最初单一的Nagios监控,到逐渐整合Zabbix、Splunk、Prometheus、Skywalking、APM等复合技术,在系统层面和应用层面的监控越来越完善。随之而来的则是性能和容量监控,它是运维的必经之路,是向更高层发展的基础。
经过几年的探索研究,我们形成了以监控为核心,数据为基础,业务为导向的性能容量分析体系,建立了跑批类系统趋势分析、波动预测模型,业务连续性关键节点监控和实时交易接口性能监控为核心的汇总机制。
总结一下性能监控的成长历程,个人认为一个良好的运维性能监控必须经历过如下几点:
1、系统的归纳整理能够清晰的梳理出公司各类系统分级,从7*24业务流程图中提炼出核心系统,关键任务节点。
2、数据的长期采集“一切用数据说话”合理利用工具定时收集相关数据,如zabbix的监控项作为收集器,收集跑批系统的记录每日交易量、批量耗时(含明细步骤)、存储空间统计;Splunk自定义指标仪表盘,监控实时交易系统的日均笔数、峰值笔数、单笔耗时、PV/UV;在前一步的基础上,自研关键任务看板,每日完成情况和时间点,并推送相关统计报表。
3、定期、多维度评估找出核心系统的核心指标数据,如日平均处理量、平均处理速度、清算节点平均耗时、存储预计消耗量、日均笔数、峰值笔数、单笔耗时、接口访问量;评估任务及时率和重清算风险。
4、从统计中得出反馈连点成线,初步得出目前系统的性能容量状态;从慢接口促进优化、从高峰提供压测基准、从增长率预测压力位;从异常指标进行问题分析;从平均完成时间反推业务流程的优化。
5、思考优化方向当形成标准的数据采集、分析和展现体系之后,可以向其他应用不断去复制这套方案,遵循一致的数据标准,最后数据的采集、分析、展现和告警标准化完成。可以在运维的故障定位、服务优化、架构改进、运维规划等各方面找到应用场景,思考优化方向。
通过以上步骤,配合相关的系统搭建和深入使用,增加核心技术组件的深度分析能力,从更底层发现问题,在更多维度的故障快速发现和快速处置能力;通过监控不断的正反馈循环,推动研发和厂商对接口升级、迁移、优化;提升生产运行的持续监测、高可用、双活、快速扩容能力;预测数据增长趋势,提前进行性能压测;跑批监控、实时监控、任务监控继续扩大范围,相得益彰形成更全面的统一的性能评估,最后数据的采集、分析、展现和告警标准化完成。
12:24 | 上交所与三大石油石化集团联合举办... |
12:22 | 复洁环保增资控股普霖科技 节能装... |
11:09 | 主业回暖副业成长 湘佳股份拟分派... |
11:03 | 光伏制造新标发布 金科环境助力光... |
10:42 | 平安养老险董事长甘为民:20年来公... |
10:39 | 今年前三季度小微企业享受税费减免... |
10:35 | 第三届上市公司可持续发展官高峰论... |
10:32 | 中国平安乡村振兴调研暨“百场助农... |
09:25 | 陆金所控股:任命朱培卿等担任董事 |
09:20 | 中国人保举办巨灾保险论坛暨巨灾风... |
00:05 | 东方电缆:海陆业务齐头并进频获大... |
00:05 | 多公司闲置土地被收储 持续盘活存... |
版权所有证券日报网
互联网新闻信息服务许可证 10120180014增值电信业务经营许可证B2-20181903
京公网安备 11010202007567号京ICP备17054264号
证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。
证券日报社电话:010-83251700网站电话:010-83251800 网站传真:010-83251801电子邮件:xmtzx@zqrb.net
扫一扫,即可下载
扫一扫,加关注
扫一扫,加关注