現在的數位電腦幾乎都以二進位形式儲存資料。如果事先不知道二進位的編碼意義,則無法解釋這些二進位資料的意義。因此我們必須透過程式語言定義的資料型別, 告訴Compiler變數內所存放的資料有多大,如何去解釋它,如何翻譯含有該變數的運算指令等問題。只要是資料,不論是存放在主記憶體內的變數,或是存放於暫存器的運算結果, 都有型別。而型別和運算符號間的關係如下:
變數,常數,以及運算符號可以組合成運算式。運算式執行完畢後會在暫存器上留下該運算式的執行結果,此結果也具有型別。
資料型別(Data Type)
C語言所定義的資料型別如下
型別 | 符號位元 | 位元長度 | 表示方法 | 數值範圍 |
整數 | 有 | 16或32 | int | -2147483648 ~ 2147483647 |
8 | char | -128 ~ 127 | ||
16 | short | -32768 ~ 32767 | ||
32 | long | -2147483648 ~ 2147483647 | ||
64 | long long | |||
無 | 16或32 | unsigned int | 0 ~ 4294967295 | |
8 | unsigned char | 0 ~ 256 | ||
16 | unsigned short | 0 ~ 65535 | ||
32 | unsigned long | 0 ~ 4294967295 | ||
64 | unsigned long long | |||
浮點數 | 有 | 32 | float | 10^-38~10^38 |
64 | double | 10^-308~10^308 | ||
字元 | 有 | 8 | char | -128 ~ 127 |
以上的整數使用二補數,浮點數則採用IEEE的標準,相關資料請見電腦系統概論。至於char,對C語言來說,採用ASCII code的編碼方式。
變數的宣告是以
type varname; type varname = constant; // 給定初始值initial value
的形式來宣告varname的型態。常數的部分,其表示法為
123表示十進位的int
0123表示八進位的int
0x123表示十六進位的int
123L表示十進位的long
123.0表示十進位的float
123.0L表示十進位的double
123.0e-8表示123*10-8的float
'a'表示char
'\n'表示char的換行符號(new line)
'\t'表示char的Tab
'\b'表示char的Backsapce
'\r'表示Carriage Return
'\f'表示Line Feed
'\\'表示\
'\''表示'
變數宣告的前面也可以加上const這個保留字,以表示此變數只能在宣告時給定初始值,以後就不能再改了
const double PI = 3.14159;
運算符號(Operator)
算術(Arithmetic)運算符號
運算符號 | 功能敘述 | 運算符號 | 功能敘述 |
+ | 加 | * | 乘 |
- | 減 | / | 除 |
% | 餘數 | ||
++ | 加一 | -- | 減一 |
以上除了%只能用於整數外,其餘符號不論整數或浮點數均可使用。++和--是所謂的unary operator,只能用於變數,可放在變數的前或後面,意義如下
x++ 此運算式的結果為x的數值,此外x變數的內容會加1
++x 此運算式的結果為(x的數值+1),此外x變數的內容會加1
x-- 此運算式的結果為x的數值,此外x變數的內容會減1
--x 此運算式的結果為(x的數值-1),此外x變數的內容會減1
邏輯(logic)運算符號
運算符號 | 功能敘述 | 運算符號 | 功能敘述 |
> | 大於 | < | 小於 |
>= | 大於等於 | <= | 小於等於 |
== | 等於 | != | 不等於 |
&& | logic AND | || | logic OR |
! | logic NOT |
C語言裡並沒有boolean資料型態(只有true和false兩種值),條件是否成立完全是看運算式的結果,若為0表示不成立,不為0表示成立。這一點設計得不好,很容易讓人犯錯,誤把邏輯運算寫成數值運算而不自覺。像java語言就提供了boolean資料型態,且邏輯運算和數值運算不能混用,以免程式撰寫者犯錯。
AND 兩者為真才為真,其餘皆為假
OR 兩者為假才為假,其餘皆為真
位元(Bit)運算符號
運算符號 | 功能敘述 | 運算符號 | 功能敘述 |
& | bit AND | << | left bit shift |
| | bit OR | >> | right bit shift |
^ | bit XOR | ~ | 1的補數 |
所謂位元運算符號,其作用的大小是bit,而不是整個數值。因此要了解這類符號的運算結果,必須先把數值轉成二進位(2補數)。以下範例內的==>表示計算的過程, 且為說明起見, 假設這些數字為8bits
2 & 3 ==> 00000010 & 00000011 ==> 00000010 ==> 相當於2
2 & 1 ==> 00000010 & 00000001 ==> 00000000 ==> 相當於0
2 | 1 ==> 00000010 |000000 01 ==> 00000011 ==> 相當於3
XOR表示兩者相同時為0,兩者不同時為1
2 ^ 3 ==> 00000010 ^ 00000011 ==> 00000001 ==> 相當於1
~2 ==> ~00000010 ==> 11111101 ==> 相當於-3
left bit shift是把每一個bit都向左移,右邊補0
2 << 1 ==> 00000010 << 1 ==> 00000100 ==> 相當於4
right bit shift是把每一個bit都向右移,左邊補上最左邊的bit
2 >> 1 ==> 00000010 >> 1 ==> 00000001 ==> 相當於1
-3 >> 1 ==> 11111101 >> 1 ==> 11111110 ==> 相當於-2
指標(Pointer)陣列(Array)與函數(Function)運算符號
運算元 | 功能敘述 | 運算元 | 功能敘述 |
& | 取變數的地址 | -> | 透過結構指標取結構成員數值 |
* | 透過指標取數值 | [] | 取陣列元素數值 |
FunctionName() | 函數呼叫 | . | 結構變數.結構成員 |
以上運算符號的用法和意義,請見後面章節詳述
其他運算符號
運算元 | 功能敘述 | 運算元 | 功能敘述 |
= | 將右邊的值複製到左邊的變數 | (type) | 將右邊的數值轉換成type型別 |
+= | 將右邊的數值加上左邊的數值然後指定給左邊的變數 | ?: | 若?左邊成立則做:左邊否則做:右邊 |
, | 合併兩個運算視為一個敘述 | sizeof(type) | 傳回type所需要的byte數 |
(運算式) | 表示()內優先運算 |
= 將右邊的數值指定(assigement,也就是複製)給左邊的變數
+= 將將右邊的數值加上左邊的數值然後指定給左邊的變數,其餘如-= *= /= %= &= ^= |= <<= >>=的意義也都相同,只是第一個運算符號不同而已
, 將兩個運算式結合成一個,以後面運算式的數值作為結果。比較常見的用途是在for(;;)迴圈,由於以分號分開的部分只能有一個敘述,若想放進兩個運算式,就可以使用","如下
for (i=0, j=2; i<n && j<m; i++, j++);
另一個,的用途是在變數宣告時,若要一個敘述內宣告好幾個變數可以用
int x, y, z;
c? p1: p2 相當於if(c) p1 else p2這個條件敘述的縮寫,範例如下
(x==0) ? 0 : 1/x;
運算優先權與結合順序
運算式可以由任意的運算符號,變數,以及常數所組成。而電腦執行程式時只能依序執行指令,因此運算式中運算符號的執行順序,必須定義得非常明確,編譯程式才能幫我們做正確的翻譯。程式語言中有關定義運算符號的執行順序,是由優先權(Priority)和結合順序(Association)兩者構成的。優先權越高的越早執行,相同優先權的符號,則看其結合順序。若為左結合(Left Association)表示左邊的符號先做,若為右結合(Right Association)表示右邊的符號先做。下表是C語言定義的優先權和結合順序,上方的列的優先權高於下方的列,同一列的運算順序則由表最右側的結合順序決定。例如第三列乘法*的優先權高於第四列+法,而同為第三列的*/%則視其在運算式中的出現順序決定。
運算元 | 結合順序 | ||||||||||
( ) | [ ] | -> | . | 左到右 | |||||||
! | ~ | ++ | -- | + | - | * | & | (type) | sizeof | 右到左 | |
* | / | % | 左到右 | ||||||||
+ | - | 左到右 | |||||||||
<< | >> | 左到右 | |||||||||
< | <= | > | >= | 左到右 | |||||||
== | != | 左到右 | |||||||||
& | 左到右 | ||||||||||
^ | 左到右 | ||||||||||
| | 左到右 | ||||||||||
&& | 左到右 | ||||||||||
|| | 左到右 | ||||||||||
?: | 右到左 | ||||||||||
= | += | -= | *= | /= | %= | ^= | |= | <<= | >>= | 右到左 | |
, | 左到右 |
第二優先權裡的+-*&是所謂unary operator,其作用的目標只有一個。此處+表示正號,-表示負號,*表示由指標取值,&表示取變數的地址。以下是幾個運算式計算的過程:
2+3+4*5 其中*為第三優先權左結合,+為第四優先權左結合,因此*先做,再來是左邊的+,最後中間的+,整個的執行過程
2+3+4*5==>2+3+20==>5+20==>25
所以最後的結果是"int 25"
2+3+4*5.0 此處要注意的是5變成了5.0,也就是說這些常數並不是同一個型別,因此過程變成
2+3+4*5.0 ==> 2+3+4.0*5.0 ==> 2+3+20.0 ==> 5+20.0 ==> 5.0+20.0 ==> 25.0
最後結果為"float 25"
假設int x; float y;
x = y = 0;因為=是右結合,因此右邊的=號先做,而y的型別是float,常數0的型別是int,因此過程如下
x = y = 0 ==> x = y = (float)0 ==> x = 0.0 ==> x = (int)0.0 ==> 0
最後結果為"int 0", 且x的內容為0,y變數的內容為0.0
最後強調上述範例的精神是,運算式最後的結果必然有型別,而且此結果是存放在ALU的暫存器內。雖然=運算符號會改變左側變數的內容,但整個運算過程的重點在於暫存器上的型態和大小。
假設int x= 1;float y;
y = x++ ==> y = 1 ==> y = (float)1 ==>1.0
最後結果為"float 1.0", 且x變數的內容為int 2,y變數的內容為float 1.0
攝氏溫度轉華氏溫度
#include <stdio.h> int main() { float degree = 100.0; printf("100C=%fF\n", degree*9.0/5.0+32.0); }
華氏溫度轉攝氏溫度
#include <stdio.h> int main() { float degree = 100.0; printf("100F=%fC\n", (degree-32.0)*5.0/9.0); }
1+2+...+n的總合
#include <stdio.h> int main() { int n = 100; printf("1+2+...+%d = %d\n", n, n*(n+1)/2); }
特別注意上述的運算式裡/2要放到最後面,如果寫成n/2*(n+1),從數學式子的角度看好像沒問題,但別忘了,binary operator的兩邊必須是同樣型別的資料,而且計算的結果也是同樣的型別。因此n/2*(n+1)會先計算n/2,如果n不能被2整除的話,那麼為了符合計算結果必須是整數的限制,則小數點的部份就會無條件捨去,使得計算的結果錯誤。下面的範例一樣要注意相同的問題。
12+22+...+n2的總合
#include <stdio.h> int main() { int n = 100; printf("1*1+2*2+...+%d*%d = %d\n", n, n, n*(n+1)*(2*n+1)/6); }
把浮點數四捨五入為整數
C語言規定浮點數轉整數時,小數點部分無條件捨去。如果要達到浮點數四捨五入為整數的效果,可以使用下面的小技巧
#include <stdio.h> int round(float y) { return (int)(y + 0.5); } int main() { float x = 20.6; printf("%f 四捨五入成為 %d\n", x, (int)(x+0.5)); printf("%f 四捨五入成為 %d\n", x, round(x)); }