百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

Oracle 分区表 范围分区、列表分区、HASH分区及组合分区

ztj100 2024-12-13 17:24 20 浏览 0 评论


普通表记录太大检索慢和delete 删除有瑕疵这两个缺点正好可以被分区表的分区消除和高效清理分区数据这两大特点给弥补了。

分区消除:对某表按月份建了范围分区,从1月到12月共12个分区,查询当前12月的记录,就不会去访问另外11个区,少做事了,这就是分区消除。

那高效分区清理:删除某分区的数据,如果直接delete,速度很慢,而且高水平位也不会释放,查询的块依然很多,这时可以直接 truncate 这个分区,速度非常快。

语法和知识点都不是问题,搜不到的是体系,是重点,是思想。

分区表的类型及原理

分区表的类型有范围分区、列表分区、HASH分区及组合分区4种,其中范围分区应用最为广泛,需要重点学习和掌握。而列表分区次之,在某些场合下也可以考虑使用组合分区(在Oracle 11g以前,组合分区的组合方式比较有限)。相对而言,HASH分区在应用中适用的场景并不广泛,使用的频率比较低。

分区表的建立方法

1.范围分区


① 范围分区的关键字为partition by range,即这三个关键字表示该分区为范围分区。

② values less than是范围分区特定的语法,用于指明具体的范围,比如partition p2 values less than(TO_DATE('2012-03-01','YYYY-MM-DD')),表示小于3月份的记录。

③ partition p1 到partition p_max表示总共建立了13个分区。

④ 最后还要注意partition p_max values less than(maxvalue)的部分,表示超出这些范围的记录全部落在这个分区中,免得出错。

⑤ 分区表中的分区可分别指定在不同的表空间里,如果不写即为都在同一默认表空间里。

列表分区

分区的字段不再是时间列,而是表示地区号的列。


① 列表分区的关键字为partition by list,即这三个关键字表示该分区为列表分区。

② 不同于之前范围分区的values less than,列表分区仅需values 即可确定范围。值得注意的是,partition p_592 values(592)并不是说明取值只能写一个,也可写为多个,比如partition p_union values(592,593,594)。

③ partition p_591 到partition p_other表示总共建立了10个分区。

④ 最后还要注意partition p_other values(DEFAULT)部分,表示不在刚才591到599范围的记录全部落在这个默认分区中,避免应用出错。

⑤ 分区表的分区可分别指定在不同的表空间里,如果不写即为都在同一默认表空间里。

散列分区


① 散列分区的关键字为partition by hash,出现这三个关键字即表示当前分区为散列分区。

② 散列分区与之前两种分区的明显差别在于:没有指定分区名,而仅仅是指定了分区个数,如PARTITIONS 12。

③ 散列分区的分区个数尽量设置为偶数个,比如本例中是12个,如果是11个或者13个就不妥了,具体原因和Oracle内部架构有关

④ 可以指定散列分区的分区表空间,比如STOREIN(ts1,ts2,ts3,ts4,t5,t6,t7,t8,t9,t10,t11,t12)表示分别存放在12个不同的表空间里,

组合分区

Oracle 11g前,主要支持 range-list 和range-hash这两种组合,在实际应用中最常用的组合是范围-列表(range-list)的组合




主要是增加了subpartition bylist(area_code)这个模块

① 组合分区是由主分区和从分区组成的,比如范围-列表分区,主分区是范围分区,而从分区是列表分区,从分区的关键字为subpartition。

② 为了避免在每个主分区中都写相同的从分区,可以考虑用模板的方式,如subpartition TEMPLATE关键字。

③ 只要涉及子分区模块,都需要有subpartition关键字。

④于表空间依然是可以指定,也可以不指定。

范围-列表、range-hash组合、range-range、list-range、list-hash和list-list

常用range-list分区,其他的适用场合相对比较少,使用频率较低

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: