> 文章列表 > 离散化的应用

离散化的应用

离散化的应用

前言:我们了解离散化的都知道,离散化的本质就是将几个差距很大的数映射成相差较小的数据,同时又保证了数据间的相对大小关系不会发生改变,离散化还是有些争议较大的问题的,比如去重问题等,下面我们就来深入学习下离散化。

 

目录

1.离散化思想及其模板介绍 

重复元素去重还是不去重,为什么?

如何算出元素离散化(映射)后的值是多少?

离散化的C++模板

2.题目应用练习(注意细节理解)

3.金句省身


1.离散化思想及其模板介绍 

重复元素去重还是不去重,为什么?

相信很多的小伙伴都会有这样的疑问,一个数组中相同的元素经过离散化之后是离散化成了相同的值还是直接把重复元素删除掉了。首先,我们有一个概念不能混淆,那就是在本质上,我们离散化的是元素所在的位置,而不是数组的元素本身,这可能不太好理解,但是我来举一个例子你们就明白了,

一般情况下我们需要用到离散化的题目,都具有下标范围比较大,而数据总量比较小的特征,像下面的结构一样:

像上面的这种情况,我们的本质就是要离散化每个有效数据元素的值所对应的下标(也就是其在数轴上的位置,因为他们太离散化,差距太大了,并且还存在负数的位置,不便于我们开数组存储),这种情况下,我们离散化的相当于是数组的下标,这种情况下是可以去重的,因为我们离散化之后的相同位置的操作还是对应同一个下标,我们可以让这对于同一个下标的两次操作保存在别处即可。

回到我们的问题,离散化到底是去重还是不去重,为什么?我们一般认为离散化是需要去重的,原理与哈希表类似,原因如下:

1.我们离散化的对象是数轴上的位置,而位置只能有一个,所以我们不可能离散化出两个相同的位置,要么这两个位置先出现的位置比后出现的位置大,要么是离散化成同一个位置,相当于还是一个位置,具体要根据实际题目具体分析;

2.离散化的目的就是为了让原来的相对离散的存储位置保存的数据,变为更加紧凑的存储位置,原来的数据不会改变,离散化的是数据保存的位置,离散化的是数据保存的位置,离散化的是数据保存的位置,这点很重要。我们需要尽可能的让空间变得更加的紧凑以便于我们开数组存储,所以,对于相同位置上的不同的操作,我们一般只留下一次该位置,至于两次操作,可以采用别的数据结构来存储,这样既达到了减小数组空间开辟的问题,也保留了两次相同位置上的不同的操作,岂不美哉?

3.去重是为了建立X与Y的一一映射,不去重则会导致一个X可以对应多个Y(可以不去重,每次查询X只返回特定的Y就行了,但是这样时间复杂度更慢,所以最好还是去重)。

如何算出元素离散化(映射)后的值是多少?

这里我们一般会有两种方式去寻找映射后的新值:二分查找和C++的lower_bound()函数

首先要先给出我们的背景,假设数组alls是已经离散化并且去重好的数组,里面保存着我们到待离散化的所有的相关的下标位置,

二分查找:

int find(int x)//x是我们的原来的下标,经过离散化之后变成了新的下标r,也就是相当于在alls数组的位置
{int l = 0, r = alls.size() - 1;while (l < r){int mid = l + r >> 1;if (alls[mid] >= x)r = mid;elsel = mid + 1;}return r + 1;//这里可以返回r,也可以返回r+1,两者的区别就是前者仍然是以0下标开头,后者变成了以1下标开头的数组,便于我们求解前缀和和差分等问题
}

对于二分还比较陌生的,可以去这里看看整数二分从入门到精通,

C++中的lower_bound()函数

lower_bound()函数的功能就是在有序的数列中查找某个元素的相对位置,这个位置正好是做离散化时元素初值对应的新值。

//C++lower_bound()函数法
int find(int x)//注意这里的alls要先去重才行哦
{return lower_bound(alls.begin(), alls.end(), x) - alls.begin() + 1;//加1的目的同上面的二分查找法}

有了上面的铺垫:我们可以总结出下面的模板了:

离散化的C++模板

vector<int> alls;//初始保存所有待离散化下标
sort(alls.begin(), alls.end());//将所有值排序
alls.erase(unique((alls.begin(), alls.end()), alls.end());//unique表示去重,erase表示将重复元素从alls中删除//二分查找法
int find(int x)//x是我们的原来的下标,经过离散化之后变成了新的下标r,也就是相当于在alls数组的位置
{int l = 0, r = alls.size() - 1;while (l < r){int mid = l + r >> 1;if (alls[mid] >= x)r = mid;elsel = mid + 1;}return r + 1;//这里可以返回r,也可以返回r+1,两者的区别就是前者仍然是以0下标开头,后者变成了以1下标开头的数组,便于我们求解前缀和和差分等问题
}
/*
//C++lower_bound()函数法
int find(int x)//注意这里的alls要先去重才行哦
{return lower_bound(alls.begin(), alls.end(), x) - alls.begin() + 1;//加1的目的同上面的二分查找法}
*/

怎么样,理解了之后很爽吧,迫不及待了吧,我懂,来,上题练练手吧

2.题目应用练习(注意细节理解)

 

 思路分析:这道题看似简单,但是有那么几个需要解释的点:

1.通过上面的分析我们已经知道,我们真正离散化的对象是x,而不是c,但是,当我们输入l和r时,如果x的值里面没有l和r,那不就找不到结果了?,所以,我们需要说明,这里我们待离散化的位置,需要加入我们插入的点,并且我们待查询的位置l和r也需要加入,可能有人要问了,这样离散化了位置下标之后,如何保证前缀和的计算是对的呢?我举个例子,我和你中间没有障碍,那我们相隔八十米和相隔100米是不是都能互相看见对方呢?这里的没有障碍就相当于没有提到的位置处元素大小都为0,而前缀和就是求一个区间内的所有元素的和,那如果这个区间内,某一段区间元素大小均为0,那么1删除这一段区间就不会对前缀和的求解造成影响,这点也请读者理解。

2.待查询的位置去重之后,我们该如何保证两次相同位置上的不同操作得以实现呢?这个问题前面我也有提到,我们可以新建一个变量用于存储我们每次的插入操作,比如pair<int,int>第一个键用来存储插入位置,第二个键用来存储插入元素大小,这样,我们根据第一个键就能找到离散化之后的位置,将其加上第二个键,就可以了。

3.关于前缀和的相关操作,这里建议返回使用二分查找的find函数方式将数组的开始下标切换为1,便于前缀和的计算,关于如何求前缀和的问题,因为比较简单,这里不再展开。

下面给出代码实现,加入注释以便于理解:

#include<bits/stdc++.h>
using namespace std;
const int N = 300010; //n次插入和m次查询相关数据量的上界
int n, m;
int a[N];//存储坐标插入的值
int s[N];//存储数组a的前缀和 
vector<int> alls;  //存储(所有与插入和查询有关的)坐标
vector<pair<int, int>> add, query; //存储插入和询问操作的数据//二分查找法
int find(int x) { //返回的是输入的坐标的离散化下标int l = 0, r = alls.size() - 1;while (l < r) {int mid = l + r >> 1;if (alls[mid] >= x) r = mid;else l = mid + 1;}return r + 1;
}
/*
//C++lower_bound()函数法
int find(int x)
{return lower_bound(alls.begin(), alls.end(), x) - alls.begin() + 1;
}
*/
int main() {scanf("%d%d", &n, &m);for (int i = 1; i <= n; i++) {int x, c;scanf("%d%d", &x, &c);add.push_back({ x, c });alls.push_back(x);}for (int i = 1; i <= m; i++) {int l, r;scanf("%d%d", &l, &r);query.push_back({ l, r });alls.push_back(l);alls.push_back(r);}//排序,去重sort(alls.begin(), alls.end());alls.erase(unique(alls.begin(), alls.end()), alls.end());//执行前n次插入操作for (auto item : add) {int x = find(item.first);a[x] += item.second;//x是已经离散化之后的下标,此操作相当于将原位置处的数据存入新的离散化后的下标中去}//前缀和for (int i = 1; i <= alls.size(); i++) s[i] = s[i - 1] + a[i];//处理后m次询问操作for (auto item : query) {int l = find(item.first);int r = find(item.second);printf("%d\\n", s[r] - s[l - 1]);//子区间前缀和计算公式}return 0;
}

3.金句省身

        你连几点睡都控制不了,还谈什么控制人生。那些能让你变好的事,最开始也许不容易,但只要坚持,就能成长。别老待在舒适区。越努力,越幸运,自律的程度,决定你人生的高度。当你有了梦想,与其着急爆发出来让世人皆知,不如默默地埋在心里,用每天的努力来为它灌溉,让它发芽结果,成为生命的一部分。