牛客竞赛字符串专题 NC237664 Typewriter（SAM + 树上倍增 + 二分 + 线段树优化dp）

文章列表

本题主要考察了如何用 SAM 求原串每个前缀对应的能与非后缀匹配的最长后缀，以及如何求 SAM 每个节点 right 集合的 min / max。很有价值的一道串串题。

牛客竞赛字符串专题 NC237664 Typewriter（SAM + 树上倍增 + 二分 + 线段树优化dp）

题意：

你有一台打字机，你需要用它打出一段只由小写字母构成的文本S。
设某个时刻，你已经打出来的文本为 T，你可以执行两种操作：

花费 p 块钱，将T后面添加一个字符 ch，得到 T = T + ch。
花费 q 块钱，将 T 的一个 子串 S 复制一份，添加到 T 的后面，得到 T = T + S。
问：为了得到 S，最少的花费是多少。

思路：

本题可以用 DP 解决，设 dp[i] 表示得到 S[1, i] 的最小代价。
考虑如何计算 dp[i]：

第一种操作带来的转移是：dp[i] ← dp[i - 1] + p。
第二种操作要求我们求最长的 S[1, i] 的后缀 S[i - x + 1, i]，使得他在 S[1, i - x] 中也出现过，带来的转移是：dp[i] ← min(dp[i - x, …, i - 1]) + q。

Q1：对于每个前缀 S[1, i]，如何预处理它最长的后缀 S[i - x+ 1, 1]，使得他在 S[1, i - x] 中也出现过呢?

我们可以结合在 NC237662 葫芦的考验之定位子串 这题中的思想进行思考：对于某一个前缀 S[1, i]，他的所有后缀均在它所在节点与根相连的后缀链接上。因此，我们可以不断在后缀链接上找，当链上某个节点 u 代表的长度范围在 len[fa[u]] + 1 ~ len[u] 的这类子串中，存在一个长度为 anslen 的子串（注意这里是存在即可），它结束位置的最小值 mned[u] < i - anslen + 1 退出查找（贪心的找最深的节点，因为节点越深越能包含更长的子串）。还没完，我们还需要在这个节点上二分子串长度，寻找该前缀的最长后缀。
显然上述查找节点的过程不能暴力地找，要使用树上倍增（dfs 预处理倍增表）。

Q2：第二步操作带来的状态转移需要求区间 min，怎么优化？

线段树优化 dp。

时间复杂度：

构建 SAM：O(n)
两个预处理、线段树优化 dp：O(nlogn)

代码：

#include<bits/stdc++.h>using namespace std;
const int N = 2e5 + 10, M = N << 1, mx = 20;
int ch[M][26], fa[M], len[M], np = 1, tot = 1;
vector<int> g[M];
//分别表示：节点代表子串最小结束位置，每个前缀对应的能与非后缀匹配的最长后缀
int mned[M], x[M];
char s[N];
int p, q;
int pa[M][mx];	//倍增表
struct node
{int l, r;long long mn;
} dp[N << 2];	//直接把线段树数组当做 dp 数组void extend(int c)
{int p = np; np = ++tot;len[np] = len[p] + 1, mned[np] = len[np] - 1;while (p && !ch[p][c]) {ch[p][c] = np;p = fa[p];}if (!p) {fa[np] = 1;}else {int q = ch[p][c];if (len[q] == len[p] + 1) fa[np] = q;else {int nq = ++tot;len[nq] = len[p] + 1;fa[nq] = fa[q], fa[q] = fa[np] = nq;while (p && ch[p][c] == q) {ch[p][c] = nq;p = fa[p];}memcpy(ch[nq], ch[q], sizeof ch[q]);}}
}void dfs(int u, int f)	//dfs 预处理树上倍增表
{pa[u][0] = f;for (int i = 1; i <= mx - 1; ++i) {pa[u][i] = pa[pa[u][i - 1]][i - 1];}for (auto son : g[u]) {dfs(son, u);mned[u] = min(mned[u], mned[son]);}
}void init()	//预处理 x 数组
{int p = 1;for (int i = 0; s[i]; ++i){p = ch[p][s[i] - 'a'];int tmp = p;for (int j = mx - 1; j >= 0; --j) {int ff = pa[tmp][j];int mnlen = len[fa[ff]] + 1;//倍增父节点不满足就一直跳，满足了立刻退出，找满足条件最深的节点if (mned[ff] >= i - mnlen + 1) {  tmp = ff;}}tmp = pa[tmp][0];	//再跳一格//首先不能是根，其次要满足条件，我们才在该节点二分答案if (p > 1 && mned[tmp] < i - (len[fa[tmp]] + 1) + 1){int l = len[fa[tmp]] + 1, r = len[tmp];while (l < r) {int mid = l + r + 1 >> 1;if (mned[tmp] < i - mid + 1) l = mid;else r = mid - 1;}x[i] = r;}else x[i] = 0;	//如果是根或者不满足条件，也就是不存在对应后缀，置为 0}
}void pushup(int u)
{dp[u].mn = min(dp[u << 1].mn, dp[u << 1 | 1].mn);
}void build(int u, int l, int r)
{dp[u] = { l, r };if (l == r) {dp[u].mn = 0;return;}int mid = l + r >> 1;build(u << 1, l, mid), build(u << 1 | 1, mid + 1, r);
}void modify(int u, int x, long long v)
{if (dp[u].l == x && dp[u].r == x) {dp[u].mn = v;return;}int mid = dp[u].l + dp[u].r >> 1;if (x <= mid) modify(u << 1, x, v);else modify(u << 1 | 1, x, v);pushup(u);
}long long ask(int u, int l, int r)
{if (l <= dp[u].l && r >= dp[u].r) {return dp[u].mn;}int mid = dp[u].l + dp[u].r >> 1;long long ans = 1e18;	//由于是 long long 这里要尽可能大，建议直接上 1e18if (l <= mid) ans = min(ans, ask(u << 1, l, r));if (r > mid) ans = min(ans, ask(u << 1 | 1, l, r));return ans;
}signed main()
{memset(mned, 0x3f, sizeof mned);	//这里很重要，首先要全初始化为 infmned[0] = 0;	//然后节点 0 要初始化为 0scanf("%s%d%d", s, &p, &q);int n = strlen(s);for (int i = 0; i < n; ++i) {extend(s[i] - 'a');}for (int i = 2; i <= tot; ++i) {g[fa[i]].emplace_back(i);}dfs(1, 0);	//dfs 预处理树上倍增表init();	//预处理 x 数组build(1, 1, n), modify(1, 1, p);for (int i = 2; i <= n; ++i) {modify(1, i, ask(1, i - 1, i - 1) + p);if (x[i - 1]) {	//只有对应后缀存在才进行转移！long long tmp = min(ask(1, i, i), ask(1, i - x[i - 1], i - 1) + q);modify(1, i, tmp);}}printf("%lld\\n", ask(1, n, n));return 0;
}

牛客竞赛字符串专题 NC237664 Typewriter（SAM + 树上倍增 + 二分 + 线段树优化dp）

题意：

思路：

时间复杂度：

代码：

公告

标签

牛客竞赛字符串专题 NC237664 Typewriter（SAM + 树上倍增 + 二分 + 线段树优化dp）

题意：

思路：

时间复杂度：

代码：

相关问题

公告

标签