素数筛介绍，C++实现

云烟 • 9分钟前 • 编程

欢迎大家来到IT世界,在知识的湖畔探索吧!

一、素数

在数学的奇妙世界里，素数是一个独特而又基础的概念。素数，也被称为质数，是指在大于 1 的自然数中，除了 1 和它自身外，不能被其他自然数整除的数。例如，2、3、5、7、11 等都是素数，而 4（能被 2 整除）、6（能被 2 和 3 整除）等则不是。

素数在数学领域中具有举足轻重的地位，是数论等众多数学分支的核心研究对象。在计算机科学领域，素数也有着广泛的应用，比如在密码学中，RSA 加密算法就依赖于大素数的性质来保证信息的安全；在哈希表的设计中，利用素数可以减少哈希冲突，提高哈希表的效率。正是因为素数在数学和计算机科学中的重要性，研究和实现高效的素数筛算法具有十分重要的意义。

二、基础素数筛法：埃拉托斯特尼筛法（埃氏筛）

2.1 基本原理

埃拉托斯特尼筛法（Sieve of Eratosthenes）是一种由希腊数学家埃拉托斯特尼提出的简单算法，用于找出一定范围内的所有素数。其核心原理是：要得到自然数 n 以内的全部素数，必须把不大于n−−√

的所有素数的倍数剔除，剩下的就是素数。

具体操作过程如下：

先创建一个布尔数组，长度为 n + 1，初始时将所有元素都标记为 true（表示假设它们都是素数）。

从 2 开始，因为 2 是最小的素数，将 2 的所有倍数（4, 6, 8, …）都标记为 false（因为它们不是素数，是合数）。

接着找到下一个未被标记为 false 的数，也就是 3，它是素数，再将 3 的所有倍数（6, 9, 12, …）标记为 false。

以此类推，不断重复这个过程，直到遍历到n−−√

。例如，当 n = 25 时，25−−√=5

，我们只需遍历到 5，就可以完成对 25 以内所有数的筛选。因为大于 5 的数的倍数，如 6 的倍数，已经在 2 和 3 的倍数筛选过程中被标记过了。

2.2 C++ 代码实现

下面是使用 C++ 实现埃拉托斯特尼筛法的代码：

#include

std::vector

sieveOfEratosthenes(int n) {

std::vector

isPrime(n + 1, true);

isPrime[0] = isPrime[1] = false; // 0和1不是素数

for (int i = 2; i * i <= n; ++i) {

if (isPrime[i]) {

// 将i的所有倍数标记为非素数

for (int j = i * i; j <= n; j += i) {

isPrime[j] = false;

}

std::vector

primes;

for (int i = 2; i <= n; ++i) {

if (isPrime[i]) {

primes.push_back(i);

}

return primes;

}

int main() {

int n = 100; // 这里以100为例，可以根据需要修改

std::vector

primes = sieveOfEratosthenes(n);

std::cout << “1到” << n << “之间的素数有：” << std::endl;

for (int prime : primes) {

std::cout << prime << ” “;

}

std::cout << std::endl;

return 0;

}

在这段代码中：

isPrime 数组用于标记每个数是否为素数，初始时假设所有数都是素数（除了 0 和 1）。

第一个内层循环 for (int j = i * i; j <= n; j += i) 从 i * i 开始标记，因为 i * 2 到 i * (i – 1) 这些数在之前较小的素数筛选时已经被标记过了，这样可以减少重复标记，提高效率。

最后遍历 isPrime 数组，将所有标记为 true 的数加入 primes 数组，这个数组就是我们要的素数集合。

2.3 复杂度分析

埃拉托斯特尼筛法的时间复杂度为O(n∗log(logn))

。从代码中可以看出，外层循环遍历到n−−√

，对于每个素数 i，内层循环要标记它的倍数，标记的次数大约是ni

。所以总的操作次数大约是∑n√i=2ni

，根据调和级数的性质，这个和近似于n∗log(logn)

。

优点是它的实现相对简单直观，对于中小规模的数据筛选效率较高，容易理解和掌握，适合在对时间复杂度要求不是特别严格的场景下使用，比如在一些简单的数学计算、教学示例中。缺点是当 n 非常大时，时间复杂度的增长速度还是比较明显，而且它会对一些合数进行重复标记，例如 12 会被 2 和 3 分别标记为合数，这在一定程度上浪费了计算资源，导致效率下降。

三、进阶优化：线性筛法（欧拉筛）

3.1 优化思路

虽然埃氏筛法已经有不错的效率，但它仍存在一些可以优化的地方。其主要问题在于，同一合数可能会被多个素数重复筛选，比如 6 会被 2 和 3 分别筛除，这无疑浪费了计算资源。线性筛法，也叫欧拉筛法，正是针对这个问题进行了优化。

线性筛法的核心思想是让每个合数只被它的最小质因子筛选一次。根据算术基本定理，任何一个合数都可以唯一地分解成若干个质因数的乘积，所以每个合数都有唯一的最小质因数。线性筛法利用这一点，在筛选过程中确保每个合数只被其最小质因数筛除，从而避免了重复筛选，将时间复杂度降低到了 O (n) 。

3.2 C++ 实现代码

下面是使用 C++ 实现线性筛法的代码：

#include

std::vector

linearSieve(int n) {

std::vector

isPrime(n + 1, true);

isPrime[0] = isPrime[1] = false;

std::vector

primes;

for (int i = 2; i <= n; ++i) {

if (isPrime[i]) {

primes.push_back(i);

}

for (int j = 0; j < primes.size() && i * primes[j] <= n; ++j) {

isPrime[i * primes[j]] = false;

if (i % primes[j] == 0) {

break;

}

return primes;

}

int main() {

int n = 100;

std::vector

primes = linearSieve(n);

std::cout << “1到” << n << “之间的素数有：” << std::endl;

for (int prime : primes) {

std::cout << prime << ” “;

}

std::cout << std::endl;

return 0;

}

在这段代码中：

isPrime 数组用于标记每个数是否为素数，初始时假设所有数都是素数（除了 0 和 1）。

primes 数组用于存储找到的素数。

关键的判断条件 if (i % primes[j] == 0) 是线性筛法的核心。当 i 能被 primes[j] 整除时，说明 primes[j] 是 i 的最小质因数，那么 i * primes[j + 1]（如果存在）这个合数的最小质因数就不是 primes[j + 1] 了，而是 primes[j]，所以此时应该停止循环，避免重复筛选。例如，当 i = 4，primes[j] = 2 时，4 能被 2 整除，此时如果不停止循环，后面 4 * 3 = 12 会被标记，而在 i = 6，primes[j] = 2 时，12 又会被标记一次，通过 break 可以避免这种重复。

3.3 复杂度剖析

线性筛法的时间复杂度为 O (n)。因为每个合数都只会被它的最小质因数筛除一次，所以整个筛选过程中，每个数都只被处理了一次，没有多余的重复操作，相比于埃氏筛法，大大提高了效率，尤其是在处理大规模数据时，优势更加明显。

四、实际应用场景

素数筛法在众多领域都有着不可或缺的应用，展现出了巨大的实用价值。

密码学领域：在现代密码学中，素数起着至关重要的作用。例如，RSA 加密算法是一种广泛应用的非对称加密算法，它的安全性基于大整数分解的困难性，而大整数通常由两个大素数相乘得到。通过素数筛法，我们可以高效地生成大素数，为 RSA 算法提供安全的密钥对。在 SSL/TLS 协议中，就使用了 RSA 算法来保障数据传输的安全，而素数筛法在生成密钥的过程中发挥了关键作用，确保了信息在互联网传输过程中的保密性和完整性。

数学研究领域：在数论研究中，素数是核心研究对象。素数筛法帮助数学家们快速获取一定范围内的素数，从而进行各种数学性质的研究。比如对素数分布规律的研究，通过埃氏筛法或线性筛法获取大量素数样本，进而分析素数在自然数中的分布特点，像著名的黎曼猜想就与素数分布密切相关，素数筛法为相关研究提供了基础数据支持。

算法竞赛领域：在各类算法竞赛中，经常会出现与素数相关的问题。例如，要求计算一定范围内素数的个数、找出特定区间内的素数等。此时，高效的素数筛法能大大提高解题效率，节省时间复杂度。在 ACM 国际大学生程序设计竞赛中，就有许多涉及素数的题目，选手们运用线性筛法等技巧，能够快速准确地解决问题，在有限的比赛时间内取得更好的成绩。

五、代码优化与注意事项

5.1 内存优化

在实现素数筛法时，无论是埃氏筛还是线性筛，都需要使用数组来存储标记信息。当需要筛选的范围非常大时，数组占用的内存空间会成为一个问题。例如，若要筛选 10 亿以内的素数，使用普通的布尔数组bool isPrime[]，将会占用大约 1GB 的内存空间。为了优化内存，可以考虑使用位运算来代替布尔数组。因为一个字节（8 位）可以存储 8 个布尔值的信息，所以可以使用unsigned char类型的数组来代替bool数组，这样可以将内存占用减少为原来的八分之一。具体实现时，可以通过位运算来设置和查询每个数的标记状态。例如：

#include

std::vector

sieveWithMemoryOptimization(int n) {

std::vector

isPrime((n + 7) / 8, 0); // 每个unsigned char可以存储8个标记

std::vector

primes;

auto getBit = [&isPrime](int i) {

return (isPrime[i / 8] >> (i % 8)) & 1;

};

auto setBit = [&isPrime](int i) {

isPrime[i / 8] |= 1 << (i % 8);

};

for (int i = 2; i <= n; ++i) {

if (!getBit(i)) {

primes.push_back(i);

for (int j = i * i; j <= n; j += i) {

setBit(j);

}

return primes;

}

在这段代码中，getBit函数用于获取某个位置的标记，setBit函数用于设置某个位置的标记。通过这种方式，大大减少了内存的使用，提高了算法在处理大数据时的内存效率。

5.2 边界条件处理

在实现素数筛法时，正确处理边界条件至关重要。首先，1 不是素数，这是一个基本的数学定义，在初始化标记数组时，需要将 1 对应的标记设置为非素数。在埃氏筛和线性筛的代码实现中，都明确将isPrime[1] = false。

其次，要注意数组越界问题。在筛选过程中，尤其是在标记倍数时，需要确保索引值在数组的有效范围内。以埃氏筛法为例，在标记i的倍数时，循环条件for (int j = i * i; j <= n; j += i)中，j的最大值为n，如果不小心写成j < n，则会导致遗漏n这个数的标记；另外，如果在计算倍数时发生溢出，也会导致数组越界错误。例如，当i和j都是较大的数时，i * j可能会超出int类型的范围，此时可以将j声明为long long类型来避免溢出问题。如下是一个简单的示例，展示了可能出现的数组越界情况及修正方法：

#include

std::vector

sieveWithBoundaryCheck(int n) {

std::vector

isPrime(n + 1, true);

isPrime[0] = isPrime[1] = false;

for (int i = 2; i * i <= n; ++i) {

if (isPrime[i]) {

// 正确写法，使用long long避免乘法溢出导致数组越界

for (long long j = static_cast

(i) * i; j <= n; j += i) {

if (j <= n) {

isPrime[j] = false;

}

std::vector

primes;

for (int i = 2; i <= n; ++i) {

if (isPrime[i]) {

primes.push_back(i);

}

return primes;

}

在上述代码中，将j声明为long long类型，并在标记时增加了j <= n的判断，以确保不会发生数组越界，保证了算法的正确性和稳定性。

c++算法开发语言密码学

发布于2025-03-03

著作权归作者所有

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/115200.html