findkeys(decode)安全实验

First Post:

2025-03-21

Last Update:

2025-05-22

安全项目 findkeys（decode）

项目要求

主要目的：解码消息并找到密钥 key1，key2，key3，key4 的值，以下操作均在 64 位架构下进行（x86 架构下会有不同结果也会附到后面）

1. 找到 key12

‘From：’从哪来？

提示中告诉我们先找 key1 key2：attack the keys in two independent parts. Try to break the first two keys first.

并且告诉我们如果 key1key2 正确得到的对应结果前面会出现 From: （If you get the first and second keys right, a message that starts with From: will appear. ）

根据建议，先找 key12 的值，先看 process_key12 和 extract_message12，前者是对我们即将传入的密钥值进行的操作，后者 extract_message12 通过读代码不难发现其实就是解密函数，而 data 就是密文

data 值如下

int data[] = {       //数据 密文
0x63636363, 0x63636363, 0x72464663, 0x6F6D6F72,
0x466D203A, 0x65693A72, 0x43646E20, 0x6F54540A,
0x5920453A, 0x54756F0A, 0x6F6F470A, 0x21643A6F,
0x594E2020, 0x206F776F, 0x79727574, 0x4563200A,
0x6F786F68, 0x6E696373, 0x6C206765, 0x796C656B,
0x2C336573, 0x7420346E, 0x20216F74, 0x726F5966,
0x7565636F, 0x20206120, 0x6C616763, 0x74206C6F,
0x20206F74, 0x74786565, 0x65617276, 0x32727463,
0x6E617920, 0x680A6474, 0x6F697661, 0x20646E69,
0x21687467, 0x63002065, 0x6C6C7861, 0x78742078,
0x6578206F, 0x72747878, 0x78636178, 0x00783174
};

    可以看出它是多个 8 位 16 进制数组合的数组，8 位十六进制刚好是 32 位，也就是 4 字节（int 类型）。
    想要得出具有有意义的内容，不难想到 16 进制转字符串，一个字符（char 类型）1 字节对应两个 16 进制数字，
    于是我们将去掉 0x 前缀和逗号的内容粘贴到转换网站里

6363636363636363724646636F6D6F72466D203A65693A7243646E206F54540A5920453A54756F0A6F6F47 0A21643A6F594E2020206F776F797275744563200A6F786F686E6963736C206765796C656B2C3365737420 346E20216F74726F59667565636F202061206C61676374206C6F20206F747478656565617276327274636E 617920680A64746F69766120646E6921687467630020656C6C7861787420786578206F7274787878636178 00783174

 然而通过后面的解码函数 extract_message12 的解码逻辑（指定方式的顺序读入 message 来生成明文）看，以上转换是无法得出正确的转换结果的
 ，因为其中含有无法正常阅读的符号

🤔 那么问题出现在哪里呢，我们以 0x72464663 举例，7 是最高位，3 是最低位，观察内存可以发现这串数在内存中的存储方式是 63 46 46 72（内存的单位是字节，两个 16 进制一组），这叫做小端顺序，即低位地址在地址的低位（地址是从低到高看，前低后高）

![image 1](./安全项目findkeys（decode）大一上安全实验.assets/image 1.png)

   所以 data 的读取方式应该是每组数以两个数为单位从后向前读，也就是 0x72 46 46 63，                     
   应该以 63 46 46 72 的顺序转换，所以自己写一个对应的解码程序, 以下是正确结果

![image 2](./安全项目findkeys（decode）大一上安全实验.assets/image 2.png)

转换代码如下（其实是 gpt 写的 😋）

#include <stdio.h>
#include <string.h>

void hex_to_string(int *data, size_t len, char *output) {
    size_t j = 0;
    for (size_t i = 0; i < len; i++) {
        // 按小端顺序处理 32 位数据中的每个字节
        unsigned char byte1 = (data[i] & 0xFF);
        unsigned char byte2 = ((data[i] >> 8) & 0xFF);
        unsigned char byte3 = ((data[i] >> 16) & 0xFF);
        unsigned char byte4 = ((data[i] >> 24) & 0xFF);
        
        // 存储每个字节到 output 字符串
        output[j++] = byte1;
        output[j++] = byte2;
        output[j++] = byte3;
        output[j++] = byte4;
    }
    output[j] = '\0';  // 添加字符串结束符
}

int main() {
    int data[] = {  // 数据 密文
        0x63636363, 0x63636363, 0x72464663, 0x6F6D6F72,
        0x466D203A, 0x65693A72, 0x43646E20, 0x6F54540A,
        0x5920453A, 0x54756F0A, 0x6F6F470A, 0x21643A6F,
        0x594E2020, 0x206F776F, 0x79727574, 0x4563200A,
        0x6F786F68, 0x6E696373, 0x6C206765, 0x796C656B,
        0x2C336573, 0x7420346E, 0x20216F74, 0x726F5966,
        0x7565636F, 0x20206120, 0x6C616763, 0x74206C6F,
        0x20206F74, 0x74786565, 0x65617276, 0x32727463,
        0x6E617920, 0x680A6474, 0x6F697661, 0x20646E69,
        0x21687467, 0x63002065, 0x6C6C7861, 0x78742078,
        0x6578206F, 0x72747878, 0x78636178, 0x00783174
    };
    
    size_t len = sizeof(data) / sizeof(data[0]);  // 密文数据的元素数量
    char output[len * 4 + 1];  // 存储转换后的字符串
    
    hex_to_string(data, len, output);
    printf("转换后的字符串:\n%s\n", output);
    
    return 0;
}

 除了自己敲代码转换之外 ，我们可以以一种简单方式直接找到转换后的结果

我们可以直接打断点在程序内调试在内存中查看&data 的值，内存中本来就是小端顺序所以内存右侧就是正确的转换结果

![image 3](./安全项目findkeys（decode）大一上安全实验.assets/image 3.png)

右侧就是 vs 自动帮我们转换的对应结果，截取放大如下

![image 4](./安全项目findkeys（decode）大一上安全实验.assets/image 4-1747885263882-8.png)

如何读出明文并找到 key 值 🤔

通过提示“如果你正确地获取了第一个和第二个键，将显示一条以 From：开头的消息”

而 extract_message1 函数经过观察就是对 data 进行转换的解密函数，它的运行需要两个参数

start（起点）和 stride（步长），而这两个参数又是通过 dummy 变量赋值的

解码函数代码如下

 
 
char* extract_message1(int start, int stride) {
	int i, j, k;
	int done = 0;
	for (i = 0, j = start + 1; !done; j++) {         
		for (k = 1; k < stride; k++, j++, i++) {

			if (*(((char*)data) + j) == '\0') {  
				done = 1;
				break;
			}

			message[i] = *(((char*)data) + j);
		}
	}
	message[i] = '\0';
	return message;
}

  观察这个函数逻辑，message 是我们最后要得到的明文（以下简称 msg），start+1 就是 data 开始读入 msg 的位置（data 强换了 char*类型，一次只能访问一个字符），通过读循环可知 stride 的值影响内层循环的结束，内层循环（stride-1）次之后，j 加加 stride-1 次，msg 也按顺序读了 stride-1 个字符，但是内层结束后 done 为 0 继续循环，此时外层循环又给 j++，进入内层又开始 j++，而外层循环进行 j++的时候我们没有进行 msg 的读入操作，所以会跳过 data 里的一个字符在进行读入，以此类推直到遇到结束符号。

 这里插入一下上述代码的转换功能实现的细节：字符是以 ascll 码对应的值存储的，而在输出字符时会自动转换成字符输出，所以上述代码看似是读取数字，其实在 printf 之后会自动转换成字符串

 了解 extract_message1 函数逻辑后，我们想要它正常运作起来，根据“如果你正确地获取了第一个和第二个键， 将显示一条以 From： 开头的消息”的提示，再结合这个解密函数的逻辑是从一定处开始读 stride-1 个字符然后跳一个字符再读 stride-1 个字符这样循环 可以试出 start = 9，（注意数组的起点是 0）stride = 3，这样从第二个 F 读起，每读两个跳一个，发现刚好能凑出 From ：

![image 5](./安全项目findkeys（decode）大一上安全实验.assets/image 5.png)

于是我们想要让 start = 9，stride = 3，而这两个值又是通过变量 dummy 赋值的，所以我们需要观察 dummy 对 start，stride 的转换代码

1 2	`start = (int)((((char)&dummy))); stride = (int)((((char)&dummy) + 1));`

start： &dummy 为整数 dummy 的地址

现在强转成 char*类型从 4 字节转换成指 1 字节值的地址并且会是低位地址然后解引用得到的是低位地址的值，最后强转为 int 类型因为是 char 值升 int 所以值不会产生丢失等变化所以 start 就是 dummy 的值的前一字节比如 dummy 是 11 22 33 44 ，start = 11.所以要想 start = 9，dummy 最低位字节应该是 09

stride：先将强转后地址加 ‘1’再解引用，这里涉及到指针的加法运算

指针加法时，指针的步长是与指针所指向的数据类型的大小，强转 char*型后步长变为 1 字节，所以 stride 是 dummy 的第二个字节，要想让 stide 为 3，dummy 的第二个字节就要为 03，

所以整型变量 dummy 应该是 09 03 xx xx，才能让解码函数正常运行，我们让 dummy 为 09 03 00 00，

也就是十六进制下的 309，通过十六进制转十进制可以得到 dummy 为 3*256+9 = 777

现在我们找到了 dummy 的值然而 dummy 被初始化为 1，达不到我们的目的，蓦然回首，项目提示中有这句话

In breaking the first two keys, realize that the function must be somehow changing the value of the variable. because the variables and control the extraction of the message.

这指示我们一定要改变 dummy 的值 then how？因为我们不能直接改变代码我们除了分析唯一能做的事就是传参，所以我们需要通过传参来改变 dummy 的值，我们传的值就是 key1，key2，于是乎看 processkey_12 函数

1
2
3

void process_keys12(int* key1, int* key2) {  
**((int**)(key1 + *key1)) = *key2;
}

可以看到这个函数是对传入的指针 key1 key2 进行操作，我们来深入分析下这个函数，

key1 本身是指针 *key1 解引用后也就是值，这涉及到我们刚才说的指针加法运算，key1 是指向 int 类型的指针，所以 key1 + * key1 实际上是让指针指向的地址向后走（4 乘以（key1））个字节，然后整体再强转 int 类型，最后再解引用，得到的是相应计算后指向的地址的 4 个字节的值，而赋值式子右侧的 key2 被赋给左侧这个式子，而 key1，key2 本身的值是由我们传入的，所以我们可以传入 key2 的值使得左侧式子被赋成我们想要的值，而 key1 的值同样为我们所传入，左侧传入 key1 后可以在 key1 的地址上做移动使得左侧指向指定的地址的值然后被 key2 赋值，总而言之，我们可以通过改变 key1，key2 的值来用这个式子改变任意已知地址变量的值为指定值

于是我们想用这个式子来改变 dummy 的值，我们打断点调试 key12 相关的代码然后在监视中取 dummy 地址和 key1 地址

	名称	值	类型
	&dummy	0x000000000014fc14 {1}	int *

	名称	值	类型
	key1	0x000000000014fc74 {-24}	int *

我们发现 key1 的地址比 dummy 高 96，我们想要

key1 + key1 准确定位到 dummy 的地址，所以（ key1） * 4 =-96 ，* key1 = -24

我们想要 dummy 赋值为 777，所以右侧*key2 = 777。（必须在 64 位下）

我们打开 vs 的项目属性在调试中传入参数 -24 ，777， 1，1（后面 key34 未知所以随便填）

运行得到以下结果

![image 7](./安全项目findkeys（decode）大一上安全实验.assets/image 7.png)

说明 key1，key2 正确

2.What about key3&key4?

key1 和 key2 相当于一个引导，因为 key1，key2 相关的代码和 key3，key4 很对仗，可以想到 key3，key4 就是他们的升级版

分析得到的新 tip

我们来看破解前两个密钥后的得到的提示信息

![image 7](./安全项目findkeys（decode）大一上安全实验.assets/image 7-1747885560491-19.png)

提示让我们找到能强制调用 extract_message2 函数而避免调用 extract_message1 的 key3，key4 的值

以下为相关部分代码

if (key3 != 0 && key4 != 0) {
	process_keys34(&key3, &key4);     ///////////////////
}

msg1 = extract_message1(start, stride);/**/

if (*msg1 == '\0') {
	process_keys34(&key3, &key4);//////////////////////
	msg2 = extract_message2(start, stride);/**/
	printf("%s\\n", msg2);
}
else {
	printf("%s\\n", msg1);
}

return 0;
}

可以看到我用/////标注了两个 process_keys34(&key3, &key4)函数用/**/标注了 extract_message1 和 extract_message2，根据提示我们想要跳过执行

msg1 = extract_message1(start, stride);/**/这一句

然后进入 if 执行 msg2 = extract_message2(start, stride);/**/这一句就能得到正确答案

extract_message2(start, stride)的 start 和 stride 保持不变

实际上通过分析 extract_message2(start, stride)的代码我们发现它和 extract_message1 相似

char* extract_message2(int start, int stride) {
int i, j;
for (i = 0, j = start;
**(((char**)data) + j) != '\0';
i++, j += stride)
{
message[i] = *(((char*)data) + j);
}
message[i] = '\0';
return message;
}

它的读入方式是从 data 的 start 位开始单层循环每次读入一个字符然后跳 stride-1 个字符，如果 key1，key2 不变，start = 9，stride = 3，在这里就是从第 9 个字符开始读一个跳过两个，我们会发现这样读入仍然会得到有意义的字符串 From ：CTE…………..

![image 8](./安全项目findkeys（decode）大一上安全实验.assets/image 8-1747885454244-14.png)

这启示我们不用改 start，stride 的值和 extract_message2 之后怎么操作字符串，可以专一进行强制调用 extract_message2 函数而避免调用 extract_message1 的建议

如何做到避免调用和强制调用函数

类比 **((int )(key1 + *key1)) = * key2 这个可以修改任意地址里的值的万能式子

(((int)&key3) + *key3) += * key4 这个式子可以让我们使得任意地址里的值加上 *key4

我们正是需要用到这个式子来做到强制调用函数

这里有两种强行步入函数的方法

方法 1.修改 data 对应的值满足 if 条件来步入条件分句

注意到，影响调用 extract_message1 还是 2 的 if 条件如下

process_keys34(&key3, &key4);  
}
msg1 = extract_message1(start, stride);

if (*msg1 == '\0') {   //这里就是分支点
process_keys34(&key3, &key4);
msg2 = extract_message2(start, stride);
printf("%s\n", msg2);
}
else {
printf("%s\n", msg1);
}

如果msg1 == ‘\0’就会步入我们想要的 extract_message2 函数得到结果，如果我们不做任何修改，会直接执行 else 语句打印 msg1，我们想要打印 msg2，就需要满足 if 条件让msg1 =‘\0’，而我们正好拥有改变指定地址值的 power😋

if I want *msg1 == ‘\0’, then I have to take it.（乱入）

想修改 msg1 的结果我们需要倒回去看的读入条件 extract_message1

char* extract_message1(int start, int stride) {
    int i, j, k;
    int done = 0;
    for (i = 0, j = start + 1; !done; j++) {
        for (k = 1; k < stride; k++, j++, i++) {
            if (*(((char*)data) + j) == '\0') {
                done = 1;
                break;
            }
            message[i] = *(((char*)data) + j);
        }
    }
    message[i] = '\0';
    return message;
}

if ((((char)data) + j) == ‘\0’)是中值循环的主要条件，而 j 第一次为 start+1 = 10，也就是 data 数组的第十个字节，如果我们把它赋值成’\0’，这个函数就会什么都不读入，message 就会默认为空，

*msg1 == ‘\0’就会成立

所以接下来就是运用 key3，key4 来修改指定值的时机了

(((int)&key3) + *key3) += * key4//注意是 +=

我们取 data 地址，将其第十个字符改变为 \0 （ascll 里的 00）//注意是数组的 10（从 0 开始）

直接在内存窗口里输入&data 回车

我们想改第 10 个字节 46 为 00 ，我们的修改是 int 类型的，一次修改 4 个字节，所以找到 data [2] 的内存位置 0x0000000140006088 将 63 46 46 72（0x72464663）改为 63 46 00 72 （0x72004663）也就是让*key4 = 两数相减为-4,587,520

接下来算 key3 （（int *）&key3 + * key3）应该表示 data [2] 的地址 0x0000000140006088

&key3 的值在内存中查看得到为 0x000000000014fbf0 注意是&key3 不是 key3

我们让 0x000000000014fbf0 +（*key3 ） * 4 = 0x0000000140006088 （指针运算法则）

经过计算得到*key3 = 5367358616/4 = 1341839654

//这种方法的*key4 应该一致，key3 地址偏移量会根据机器不同而不同

我们将四个值传入运行

![image 10](./安全项目findkeys（decode）大一上安全实验.assets/image 10.png)

![image 11](./安全项目findkeys（decode）大一上安全实验.assets/image 11.png)

最后结果如上这代表我们传入的四个值都正确

方法 2 利用栈帧分析改变函数的返回地址

再次强调 64 位和 x86 结果不同不过两种情况下的分析方法相同

我们回到找 key3，key4 要解决的问题：强制调用 extract_message2 函数而避免调用 extract_message1

上一种方法我们用的代码里给的 if 语句修改值满足条件步入 extract_message2，这里我们使用修改函数的返回地址的方法来达到目的，这需要一点栈帧结构的知识

【C 程序在内存中的栈】 https://www.bilibili.com/video/BV1By4y1x7Yh/?share_source = copy_web&vd_source = d8b8c07d289d045ecef7ba91bfa51e69

64 位下栈顶为 RSP 栈底为 RBP

x86 下栈顶为 ESP 栈底为 EBP

在一个函数的反汇编的代码末尾处栈顶 RSP 会指向函数的返回地址我们只需要记住这一点就能分析

这次需要我们打开寄存器和反汇编

我们在 process_keys34 处打断点调试到这一步的时候会步入 process_keys34 的定义

调试

![image 13](./安全项目findkeys（decode）大一上安全实验.assets/image 13.png)

![image 12](./安全项目findkeys（decode）大一上安全实验.assets/image 12.png)

在反汇编中可以看到两个 process_keys34 的反汇编代码他们对应的最后一条代码左侧的地址就是返回地址所在地址，我们所做的就是将第一个代码的返回地址改成到第二个代码的返回地址，这样就能实现步入 extract_message2 函数

可以看到第一个 process_keys34 返回地址是 0000000140001533

           第二个 process_keys34 返回地址是 0000000140001567

两者相差 52（注意是 16 进制啊喂）也就是我们想要将存放返回地址的指针里的值加 52

上面已经提到这个存放返回地址的指针就是栈顶 RSP 所以我们查看寄存器 RSP 的值

点击反汇编窗口使得调试过程在反汇编中进行一步步调试知道转到 process_keys34 的定义在调试箭头指向定义最后的 ret 处时查看寄存器 RSP

![image 15](./安全项目findkeys（decode）大一上安全实验.assets/image 15.png)

此时查看寄存器 RSP = 000000000014FBE8 这个地址存放的就是第一个函数 process 的返回地址

![image 16](./安全项目findkeys（decode）大一上安全实验.assets/image 16.png)

通过查看内存也可以验证这一点

刚好就是 0000000140001533 和刚才第一个 process 函数返回地址相同

所以接下来我们就利用 power 改变 RSP 的值让他加上 52

我们又回到了 key3 key4 的这个式子

![image 17](./安全项目findkeys（decode）大一上安全实验.assets/image 17.png)

让*key4 = 52 （其实也可以是 53，因为 procee_key34 最后一条汇编指令本身就是空指令 nop 不执行也没关系）

让( key3 + ((int**)&key3))) 为 RSP 地址 000000000014FBE8

查看&key3 为 000000000014fbf0 通过指针运算 4 （ key3）+&key3 = 000000000014FBE8

求得*key3 =-2（注意负号）

所以此时 *key3 = -2 * key4 = 52 或 53

![image 18](./安全项目findkeys（decode）大一上安全实验.assets/image 18.png)

运行发现也能得出相应正确结果

![image 19](./安全项目findkeys（decode）大一上安全实验.assets/image 19.png)总结

补充

1.x86 架构下用修改函数返回地址方法做出的结果如下

![image 20](./安全项目findkeys（decode）大一上安全实验.assets/image 20.png)

其实 777（ *key2 或 dummy 的值）有很多种情况因为 start 和 stride 只取了它的第一字节和第二字节地址剩下的两个字节地址均可以任意填充

2.心得体会

提示建议的作用很大比如改变 dummy 变量的值和步入 extract_message2 函数这两个提示

还有这两个我们的作用式子

void process_keys12(int* key1, int* key2) {
**((int**)(key1 + *key1)) = key2;
}

void process_keys34(int key3, int* key4) {

**(((int**)&key3) + *key3) += *key4;

}

有了这两个函数我们可以改变任意变量的值还记得我理解这个式子的作用时的喜悦，感觉拥有了帕瓦，简直是超模 😋

3.栈帧结构的入门太简单了，根本无法独立做题，希望以后老师给的的入门教程能多一点

4.不同的环境下的结果不同，不同的方法结果也不同，题目的解答多样化，很好地体现了我们面向实际的理工科性质，现实情况只会更加复杂

参考资料

这题的思路主要总结了前几位学长的思路方法，博客链接或视频链接如下

【C 语言】SCU 安全项目 1-FindKeys_findkeysc 语言-CSDN 博客

[四川大学程序设计基础(C 语言)与安全安全项目讲解（lab1 Decode 项目）_哔哩哔哩_bilibili](https://www.bilibili.com/video/BV1CD4y1c7Qn/?spm_id_from = 333.337.search-card.all.click&vd_source = 46a9e0cd66aa17a4103b311e6485b293)

[【四川大学网安】Lab1-Decode（网安大一上 C 语言作业）_哔哩哔哩_bilibili](https://www.bilibili.com/video/BV1ay421h7MP/?spm_id_from = 333.337.search-card.all.click&vd_source = 46a9e0cd66aa17a4103b311e6485b293)

≡