通过埋点实现的指标采集必须代码性能十分优越,否则会影响数据库的性能和稳定性。因此这些埋点的代码越简洁,做的事情越少越好。一个数据库产品要做好这一点确实是要花大力气的。
本文主要涉及业务SQL执行层面的优化,暂不涉及参数优化。若设置参数,首先确定执行层面哪个阶段(Map/Reduce/Join)任务执行时间较长,从而设置对应参数。 本文主要分为以下三个部分: 第一部分,会引入数据倾斜与数据膨胀问题; 第二部分,介绍当数据倾斜与数据膨胀发生时,如何排查与定位; 第三部分,会从系统层面给出常见优化思路。
Oracle的可观测性经过了三十年的发展,从简陋的指标到OWI以及time model的出现。并不是一蹴而就的,而是经过了很长时间的演进。直到12C出现了数年后,Oracle才利用以往三十年积累的各种可观测性能力,提出了自治数据库的概念。
“不需要运维的数据库”一定是数据库厂家追求的目标,但是要实现这个目标,以目前的技术水平来看,还十分困难
在数据安全领域有些时候也是很难搞清楚的。因为绝对的可用性是不存在的,现实世界中的数据库安全是投资与可用性之间的游戏。单一数据库存在单点故障,那么主备机同时故障的可能性就不存在了吗?当然存在,只是概率低了一点而已。
?做数据库替代,兼容性分析是其中的第一个步骤,很多用户这一步没有认真做,真正开始做数据库替代的时候就会遇到一个一个的坑,填起来相当累。
从最新的长期支持版本Oracle 23C上我们也可以看到一些数据库技术发展的趋势性的东西,融合功能,简化应用,为某些特定应用场景设计专用解决方案应该是现代数据库追求的一个十分重要的目标。
如今,在项目中需要使用消息队列时,Apache Kafka似乎是首选产品。然而,考虑到特定需求时,它并不总是最佳选择。
我们都在讨论分布式,特别是面试的时候,不管是招初级软件工程师还是高级,都会要求懂分布式,甚至要求用过。传得沸沸扬扬的分布式到底是什么东东,有什么优势?
数据可观测性,即组织充分了解其系统中数据的健康状况和质量的能力,已成为现代数据工程中最热门的技术之一。