Note
- 具体代码请移步至GitHub.
Data Lab
实验目的
补全文件 bits.c
中所包含的全部 13 个 puzzle 的函数主体.
实验框架
完成后的函数主体参考如下风格:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
/* * pow2plus1 - returns 2^x + 1, where 0 <= x <= 31 */ int pow2plus1(int x) { /* exploit ability of shifts to compute powers of 2 */ return (1 << x) + 1; } /* * pow2plus4 - returns 2^x + 4, where 0 <= x <= 31 */ int pow2plus4(int x) { /* exploit ability of shifts to compute powers of 2 */ int result = (1 << x); result += 4; return result; }
整数 puzzle
- 仅允许使用函数形参和定义局部变量, 不允许定义全局变量.
- 仅允许使用白话代码 (straightline code) 完成每个函数, 不允许使用任何语句, 例如循环或条件语句等.
- 仅允许使用一元运算符
!
,˜
, 以及二元运算符&
,ˆ
,|
,+
,<<
,>>
, 部分 puzzle 会进一步限制可用运算符的范围. - 仅允许使用 0 到 255 范围内的常数.
- 仅允许使用
int
类型. - 不允许使用宏定义.
- 不允许定义新函数和调用任何函数.
- 不允许使用强制类型转换.
- 可以假设机器使用 32 位补码整数, 使用算数右移, 并且当位移量小于 0 或大于 31 时会导致无法预测的行为.
浮点数 puzzle
- 仅允许使用条件或循环语句.
- 仅允许使用
int
和unsigned
数据类型. - 允许使用任意
int
和unsigned
类型的常数. - 允许使用任意算数, 逻辑和比较运算符.
- 不允许使用宏定义.
- 不允许定义新函数和调用任何函数.
- 不允许使用强制类型转换.
btest
- 正确性检查工具
btest
需要与bits.c
一同编译, 用于检测所实现函数的正确性, 基本命令 (测试所有函数):1
./btest
每次修改
bits.c
之后均需要重新编译btest
.可以使用选项
-f
来单独指定一个函数进行测试, 此外还可以通过选项-1
,-2
和-3
来指定传入的实参, 命令:1
./btest -f bitXor -1 4 -2 5
dlc
- 合法性检查工具
全称 data lab checker, 用于检测函数实现是否遵循上述规则, 基本命令:
1
./dlc bits.c
使用选项
-e
输出每个函数所使用的运算符的个数, 命令:1
./dlc -e bits.c
使用命令
./dlc -help
查看文档.程序
dlc
要求所有声明必须位于某个块中所有其他非声明语句之前.赋值运算符
=
的使用次数不受限制.
driver.pl
- 最终评分工具
driver.pl
用于为全部实验代码进行最终评分.
其他
帮手程序
ishow
和fshow
分别用于展示相应的二进制模式. 两个程序均只输入一个参数, 该参数可以是表示十进制数, 十六进制数和浮点数的字符串. 使用make
对两个程序进行编译.如果要使用
printf
语句进行 debug, 直接使用即可, 无需包含stdio.h
头文件 (可能 gcc 会报 warning, 忽略即可).
评价标准
- 正确性占 36 分, 代码性能表现占 26 分, 良好的代码风格占 5 分.
- 对于正确性, 每道题目都具有对应的分数, 通过一道题目即得分.
- 对于代码性能表现, 每道题目都规定了一个最大允许的运算符使用次数, 只要最终的使用次数落在该范围内即得分.
实验思路与总结
#01 bitXor
- 使用 ~
和 &
实现 ^
设两个比特 $p$ 和 $q$ 以及对应的命题 $P$ 和 $Q$, 在命题逻辑 (propositional logic) 下, 由德摩根定律 (De Morgan's laws), 异或运算可表示为
$$ \begin{equation} \label{1.3.1.bitXor-1} \begin{aligned} P \oplus Q &= (P \wedge \neg Q) \vee (\neg P \wedge Q) \\ &= \neg (\neg (P \wedge \neg Q) \wedge \neg (\neg P \wedge Q)), \end{aligned} \end{equation} $$将 $\eqref{1.3.1.bitXor-1}$ 式翻译至布尔代数下即为
|
|
#02 tmin
- 返回 $TMin_w$
根据 $B2T_w$ 的定义,
$$ \begin{equation} B2T_w (\boldsymbol{x}) \triangleq - x_{w - 1}2^{w-1} + \sum_{i=0}^{w-2} x_i 2^i, \end{equation} $$最小值 $TMin_w = -2^{w - 1}$, 其二进制模式为 0x100...00
, 即设置唯一的负权位即最高有效位为 1, 其他所有正权位为 0.
上述二进制模式在 C 语言下可利用移位运算得到:
|
|
#03 isTmax
- 判断是否为 $TMax_w$
在没有任何运算符与常数使用限制的情况下, 判断一个整型值 $x$ 是否为 $TMax_w$ 只需将其二进制模式与 $TMax_w$ 的进行比较即可:
|
|
由于本题限制了整型常量的范围, 因此无法直接与 0x7fffffff
进行比较. 为了解决这一问题可以通过验证 $x$ 的二进制模式是否具有与 $TMax_w$ 的相同的性质来间接进行判断, 因为表达式能够产生的二进制模式的范围并无限制 (例如全 1 模式 0x111...11
无法直接使用, 但可通过对 0 取反, 即 !0
, 来间接得到). 注意由于本题同时限制了移位运算符的使用, 因此即使通过表达式也同样无法间接获取 0x7fffffff
.
$TMax_w$ 具有如下两个特殊性质 (二者均在模 $2^w$ 意义下成立):
- $TMax_w$ 的位模式加 1 会上溢至 $TMin_w$ 的位模式;
- $TMax_w$ 的位模式取反等于 $TMin_w$ 的位模式.
根据上述两个性质构造等量关系 (令 $TMax_w$ 的位模式为 $x$):
$$ \begin{equation} x + 1 \equiv 2^{w} - 1 - x \ \ (\text{mod}\ \ 2^{w}), \end{equation} $$解得 $x = 2^{w - 1} - 1$ 或 $x = 2^{w} - 1$. 因此 $x$ 为 $TMax_w$ 的位模式当且仅当其满足如下约束:
$$ \begin{numcases}{} x + 1 \equiv 2^{w} - 1 - x \ \ (\text{mod}\ \ 2^{w}), \label{1.3.3.isTmax-1} \\ x \neq 2^w - 1. \label{1.3.3.isTmax-2} \end{numcases} $$约束 $\eqref{1.3.3.isTmax-1}$ 左侧即为 x + 1
, 右侧可表示为 ~x
. 由于整数 puzzle 同样限制了比较运算符的使用, 为了判断两个二进制位模式是否相同可以使用异或 ^
与逻辑非 !
间接实现. 实际上两个位模式的异或结果为全 0 当且仅当这两个位模式相同, 而逻辑非能够方便的将异或结果转化为布尔值, 因此判断两个位模式 x
和 y
是否相同的表达式为 !(x ^ y)
. 于是约束 $\eqref{1.3.3.isTmax-1}$ 可表示为:
|
|
约束 $\eqref{1.3.3.isTmax-2}$ 成立当且仅当 $x$ 取反不为全 0. 为了将取反结果转化为布尔值, 需要使用逻辑非 !
进行转化:
|
|
使用连续两个 !
是因为单次转化得到的布尔值为原值的相反结果.
结合约束 $\eqref{1.3.3.isTmax-1}, \eqref{1.3.3.isTmax-2}$ 得到最终表达式:
|
|
#04 allOddBits
- 判断一个二进制模式的所有奇数位是否均为 1
所有特定位均为 1 当且仅当所有特定位的按位与的结果为 1. 由于最大允许运算符数量为 12, 直接顺次对每个位进行按位与的暴力解法不可行. 一种办法是通过折半移位同时对多个位进行按位与:
|
|
x_2
的次低有效位即为所有奇数位的按位与的结果:
|
|
#05 negate
- 返回一个补码整数的相反数
最终实现为取反加一, 原理待补充.
#06 isAsciiDigit
通过将两个模式相减并检查结果是否为负数来实现比较运算.
#07 conditional
首先判断是否为零, 若为零则选择全 0 模式, 否则取反得到全 1 模式; 再使用按位与 &
进行条件选择.
#08 isLessOrEqual
先检查两个数是否同号, 若同号则通过相减是否得到负数进行判断, 若异号直接检查哪一个数为正哪一个数为负即可.
#09 logicalNeg
逻辑非等价于检查取反后的结果是否为全 0.
#10 howManyBits
举例:
0x0001101
需要 5 位, 具体为0x00 01101
, 即从左往右找最长连续相同的子串, 然后退一格断开. 思路是先将模式与其自身的右移一位结果进行按位异或, 得到每两位之间是否相同的结果, 最终答案的大小等于按位异或得到的模式中从左往右最长全等子串的长度关于 32 的补集. 注意由于至少需要 1 位进行表示, 所以需要对异或的结果至少将其与 1 进行按位或. 最后使用二分法找到该子串的补集的长度.
#11 floatScale2
分情况讨论, 如果是特殊值, 直接返回; 如果是非规格化数, 直接对尾数部分进行左移; 否则就是规格化数, 对阶码加一即可. 注意如果加一之后变为特殊值还需要对尾数进行清空.
#12 floatFloat2Int
分情况讨论, 如果阶码大于整型范围则直接返回 (由于返回值恰好为 -2147483648, 阶码真实值等于 31 的情况也可归纳至其中); 如果小于 0 则返回 0; 否则对尾数直接进行截断即可.
#13 floatPower2
分情况讨论, 如果指数大于阶码范围则直接返回, 如果小于阶码范围则返回 0, 然后分别处理位于规格化范围和非规格化范围两种情况即可.
实验结果展示
|
|