C語言 浮點數(floating point)

更新於 發佈於 閱讀時間約 12 分鐘

分類

  浮點數其實就像是小數一樣,該變數會將取得的小數值轉變為二進位儲存,分為三種類型:


△單精度浮點數、單精度浮點值(float)

4bytes能表達的小數類型,範圍在±3.4e-38~±3.4e+38之間,而有效位數為前7位,但能絕對保證的只有前6位數字。看不懂e是什麼嗎?點我!


△雙精度浮點數、雙精度浮點值(double)

8bytes能表達的小數類型,範圍在±1.79E-308 ~ ±1.79E+308之間,而精確位數前16位,但絕對保證的只有前15位數字。


長雙精度浮點數、長雙精度浮點值(long double)

16bytes能表達的小數類型,範圍在±1.79E-308 ~ ±1.79E+308之間,與double相同,但是精確位數則是前19位,而絕對保證的只有前18位數字。

#include "stdio.h"
#define __USE_MINGW_ANSI_STDIO 1

int main(void){
  float h = 0.5;//單精度浮點數宣告
  printf("%f\n",h);//%f 代表float

  double i = 0.5;//雙精度浮點數宣告
  printf("%lf\n",i);//%lf 代表double

  long double j = 1.5;//長雙精度浮點數宣告
  printf("%Lf\n",j);//%Lf 代表long double
}

--------------------------------結果---------------------------------
0.500000
0.500000
1.500000

有效位數是什麼?

儲存形式

  在理解有效位數之前,我們先來講講浮點數的儲存方式吧。浮點數的所占bits會用來分給號(sign)、指數(exponent)、尾數(mantissa),以float的32bits為例:

raw-image

●號(sign):佔1bit,用於表示其浮點數的正負,0表示正數,反之1代表負數。

●指數(exponent):佔8bits,用於表示儲存的移位關係。在電腦中指數的儲存方式是以指數偏移量為0,因此會等於移位數 + 指數偏移量。指數偏移量 = 2 ^ (k - 1) - 1,其中k為指數(exponent)所占用的bits數,因此float的指數偏移量 = 2 ^ (8 - 1) - 1 = 2 ^ 7 - 1 = 127。

●尾數(mantissa):佔23bits,用於表示小數的二進位。

浮點數(floating point) = 號(sign)*尾數(mantissa)*2^指數(exponent)
floating point = S * M *2 ^ E

其中 號(sign)為±1,而 2^指數(exponent)代表2的e次方。

  很難懂嗎?我們來以1.25作為例子好了。

1、將7.25化為二進位
  111.01

2、確認整個小數是為正數還是負數,倘若是正數則 號(sign)為0,反之負數則為1。
  S:0

3、將小數點移到能讓整個小數最高位是個位數的位置
  1.1101

4、找到由左而右的第一個1,只取後面的數字。
  1101

  捨去第一個1的原因在於,假設有一個10進位的數字是0100,我們會很自然地把前面的
0刪掉只留下100,因為那個0是無意義的。化做二進位來說,捨去掉無意義的0之後,無論
如何最前方就一定是1了,因此不必特意儲存也會知道。

5、將這串數字,後面補上數個0,直到共有23位,而這就是尾數(mantissa)。
  M:1101 0000 0000 0000 0000 000

6、計算剛剛第2點中小數點移了幾位,往左+1,往右-1,這則是指數(exponent)。
  111.01 → 1.1101 小數點共往左移動了兩格所以是2。
  但還沒結束喔,還要再加上指數偏移數也就是127。
  
  2 + 127 = 129,化做二進位表示為
  E:1000 0001

7、最終整個儲存形式為:
  0 1000 0001 1101 0000 0000 0000 0000 000
  S E M

8、計算方式
  S = +1
  E = 129 - 127 =2
  M = 0.1101(二進位) + 1(被捨去的) = 0.5 + 0.25 + 0.0625 + 1
  = 0.8125 + 1 = 1.8125

  floating point = S * M * 2 ^ e
  floating point = +1 * 1.8125 * 2 ^ 2
          = 1.8125 * 4 = 7.25

  

不精確的原因

  由float儲存方式我們可以知道儲存空間的有限,再者是二進位小數的難點。以一個簡單的例子即可知道,0.3的二進位為0.01001100110011001100,事實上這只是一部分,換句話說,它就是一個無限小數。

  設x為基數,y為進位制,z為該位數的話,可以看出小數其實就是 x y ^z。以十進位的0.6為例,就是 6 * 10 ^ -1。

  但在二進位當中值只會有0或1,因此小數的部分可以簡化為,是由數個2 ^ z組成,其中z為負數。但像剛剛舉例的0.3就無法用二進位完整表示,只能用無限個二進位小數做到逼近的值。

  這時候就出現了一個問題,剛剛有說儲存空間的有限,我們可以知道只能用有限的二進位是難以表達出像0.3的這種數字,因此一定多少都會有誤差,這就是為什麼浮點數會有不精確的問題。


範圍與有效位數的差別

  為什麼float的範圍可以這麼大?在剛剛的儲存形式當中,指數的形式可以有效幫助浮點數擴大範圍。

如二進位0.0........01,假設小數點後方的0有125個。稍微計算過後我們可以知道儲存
形式為:

  0 0000 0001 0000 0000 0000 0000 0000 000
  S E M

計算方式:

S = + 1
E = -126
M = 1

  因此這種極小的小數,都能因為指數而正確儲存。那有效位數的存在其實就是剛剛有提到的,因為二進位小數儲存的難度,導致數值不精確。而有效位數則是這個儲存空間能夠正確儲存的範圍,當然有效位數當中還是有少部分小數會是錯誤,因此精確位數的存在則是為了表示該範圍內的數值絕對是完全精確的。


浮點數不被建議使用的原因

精確問題

  在一個專案當中,數字的精確是非常重要的,或許你會覺得在精確範圍內使用不就精確了。但,是這樣嗎?

#include "stdio.h"

int main(void){
  float a = 0.3;
  printf("%f",a*3000000000000000);//你以為輸出的是900000000000000嗎?
}

--------------------------------結果---------------------------------
900000062111744.000000

  沒錯,就是這樣細微的差別,經過大量計算或是大數計算後,會產生不一樣的結果,這對於一個需要精確數字的專案來說是很傷的。


速度問題

  由於十進位小數轉二進位小數,必須不斷的計算直到做到逼近值,要知道這種計算是相當困難的,雖說現今大多cpu有為浮點數做專門的運算,但實際上還是比整數運算慢了些。

#include "stdio.h"
#include "sys/time.h"

int main(void){
  struct timeval begin, end;
  gettimeofday(&begin, 0);

  float a = 0.3;
  for(int i =0;i<100000000;i++){
    a++;
    a++;
    a--;
    a--;
  }

  gettimeofday(&end, 0);
  long seconds = end.tv_sec - begin.tv_sec;
  long microseconds = end.tv_usec - begin.tv_usec;
  double elapsed = seconds + microseconds*1e-6;
  printf("Time measured: %.3f seconds.\n", elapsed);
  return 0;
}

--------------------------------結果---------------------------------
Time measured: 1.139 seconds.

-------------------------------分隔線--------------------------------
#include "stdio.h"
#include "sys/time.h"

int main(void){
  struct timeval begin, end;
  gettimeofday(&begin, 0);

  int a = 3;
  for(int i =0;i<100000000;i++){
    a++;
    a++;
    a--;
    a--;
  }

  gettimeofday(&end, 0);
  long seconds = end.tv_sec - begin.tv_sec;
  long microseconds = end.tv_usec - begin.tv_usec;
  double elapsed = seconds + microseconds*1e-6;
  printf("Time measured: %.3f seconds.\n", elapsed);
  return 0;
}

--------------------------------結果---------------------------------
Time measured: 0.730 seconds.
(這邊採用CR Ferreira的計算時間方式)

  上方整數與浮點數的運算中,我們可以看出整數運算還是比浮點數快了些。


結論

  雖說浮點數有以上缺點,但只要排除這些問題,使用上還是可以的。假設今天你的專案不需要精確的數字,或是在精確位數內運算的,都還是可以使用浮點數。至於速度問題,雖然整數運算以及浮點數運算本身就是兩種不同的東西,但倘若兩種運算都可以達到目的的情況下,還是建議使用整數運算的好。





留言
avatar-img
留言分享你的想法!
Cheng Hsun Li-avatar-img
2025/02/20
float a = 0.3; printf("%f",a*3000000000000000); 這個例子舉得不好,float有效位數為7位,乘完的結果都超出7位數了,當然會失去精度
avatar-img
咖啡因學習教室
12會員
18內容數
這裡是來自 高科大 資管系二年級的學生,希望能在學習的過程中,也分享這些知識給大家。
咖啡因學習教室的其他內容
2024/03/14
前言 那麼今天要來教大家,如何實現各種排版,以及不同的 CSS 可以做出怎樣的效果。 整理好你的思緒,深深吸一口氣,讓我們在 2024 這嶄新的一年當中,開始新的學習之旅吧。 字體相關 color 設定文字的顏色。 <p style="color: blue;">這是藍色文字。</
2024/03/14
前言 那麼今天要來教大家,如何實現各種排版,以及不同的 CSS 可以做出怎樣的效果。 整理好你的思緒,深深吸一口氣,讓我們在 2024 這嶄新的一年當中,開始新的學習之旅吧。 字體相關 color 設定文字的顏色。 <p style="color: blue;">這是藍色文字。</
2024/03/14
前言 今天課程要來學習,在 .css 設計樣式後,怎麼透過選擇器,讓 .html 可以有所配對,經過這一步後,便可以開始學習,如何正式設計 .css 了。 選擇器 介紹 還記得上次課程,我們在 .css 檔案中,撰寫的程式碼嗎?讓我們來複習看看: .highlight { co
2024/03/14
前言 今天課程要來學習,在 .css 設計樣式後,怎麼透過選擇器,讓 .html 可以有所配對,經過這一步後,便可以開始學習,如何正式設計 .css 了。 選擇器 介紹 還記得上次課程,我們在 .css 檔案中,撰寫的程式碼嗎?讓我們來複習看看: .highlight { co
2024/03/14
前言 終於要到這個振奮人心的章節了,我們終於要來學習,如何讓自己的網頁更加美觀。 但在這之前,我們肯定得先學習,如何將我們的 CSS 檔案,連接到 HTML 當中。 連結分類 首先,我們在連結 CSS 的方法中,有分為三種: 內聯連結 在 .html 當中,任一標籤的裡面,用屬性 s
2024/03/14
前言 終於要到這個振奮人心的章節了,我們終於要來學習,如何讓自己的網頁更加美觀。 但在這之前,我們肯定得先學習,如何將我們的 CSS 檔案,連接到 HTML 當中。 連結分類 首先,我們在連結 CSS 的方法中,有分為三種: 內聯連結 在 .html 當中,任一標籤的裡面,用屬性 s
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
根據PHP官方說明,浮點數的精度有限。儘管取決於系統,PHP 通常使用 IEEE 754 雙精度格式,則由於取整而導致的最大相對誤差為 1.11e-16。非基本數學運算可能會給出更大誤差,並且要考慮到進行複合運算時的誤差傳遞。
Thumbnail
根據PHP官方說明,浮點數的精度有限。儘管取決於系統,PHP 通常使用 IEEE 754 雙精度格式,則由於取整而導致的最大相對誤差為 1.11e-16。非基本數學運算可能會給出更大誤差,並且要考慮到進行複合運算時的誤差傳遞。
Thumbnail
前言 這是紀錄本人學習Unity C#時的筆記,希望讓自己能夠整理思緒,方便記憶。 因為是新手自學的關係,也很有可能有誤解或錯誤的地方,請見諒… 變數 宣告變數不能使用數字開頭,或是除了_之外的符號。 ·整數 int ·浮點數 float、double float 精度低、佔的資源較少,double
Thumbnail
前言 這是紀錄本人學習Unity C#時的筆記,希望讓自己能夠整理思緒,方便記憶。 因為是新手自學的關係,也很有可能有誤解或錯誤的地方,請見諒… 變數 宣告變數不能使用數字開頭,或是除了_之外的符號。 ·整數 int ·浮點數 float、double float 精度低、佔的資源較少,double
Thumbnail
一、自動轉型-二、明確轉型-三、Parse方法-補充、日期時間的轉換>>> 當我們在撰寫程式過程中,有可能會遇到在做資料處理時與一開始宣告的資料型別不一樣,這時就會需要資料型別轉換了。那這邊有四種轉換介紹: 一、自動轉型 運算過程中在精確度不會改變時,程式就會自動幫我們做轉型處理,什麼意思呢?就是
Thumbnail
一、自動轉型-二、明確轉型-三、Parse方法-補充、日期時間的轉換>>> 當我們在撰寫程式過程中,有可能會遇到在做資料處理時與一開始宣告的資料型別不一樣,這時就會需要資料型別轉換了。那這邊有四種轉換介紹: 一、自動轉型 運算過程中在精確度不會改變時,程式就會自動幫我們做轉型處理,什麼意思呢?就是
Thumbnail
分類 △單精度浮點數、單精度浮點值(float) △雙精度浮點數、雙精度浮點值(double) △長雙精度浮點數、長雙精度浮點值(long double) 有效位數是什麼? 儲存形式 不精確的原因 範圍與有效位數的差別 浮點數不被建議使用的原因 精確問題 速度問題 結論
Thumbnail
分類 △單精度浮點數、單精度浮點值(float) △雙精度浮點數、雙精度浮點值(double) △長雙精度浮點數、長雙精度浮點值(long double) 有效位數是什麼? 儲存形式 不精確的原因 範圍與有效位數的差別 浮點數不被建議使用的原因 精確問題 速度問題 結論
Thumbnail
說明 重點 △定義變數 △文字的定義 △文字與數字的差別 △整數與浮點數 △signed(有號)與unsigned(無號)的區別 △e是什麼符號? 分類 △字元 △字串 △短整數 △整數 △長整數 △超長整數 △單精度浮點數 △雙精度浮點數 △長雙精度浮點數 應用 宣告與輸出 運算符 結論
Thumbnail
說明 重點 △定義變數 △文字的定義 △文字與數字的差別 △整數與浮點數 △signed(有號)與unsigned(無號)的區別 △e是什麼符號? 分類 △字元 △字串 △短整數 △整數 △長整數 △超長整數 △單精度浮點數 △雙精度浮點數 △長雙精度浮點數 應用 宣告與輸出 運算符 結論
Thumbnail
何謂浮點數? 在了解浮點數之前,可以先大概了解一下跟他相對應的定點數 定點數: 小數點固定,整個數字表示為 整數 + 小數 今天要表示 25.125 那定點數表示法就是 25 125,中間再以小數點作為連接 浮點數: 小數點是漂浮不定的,整個數字表示分為 有效數字跟指數,類似於科學記號表示法 今天要
Thumbnail
何謂浮點數? 在了解浮點數之前,可以先大概了解一下跟他相對應的定點數 定點數: 小數點固定,整個數字表示為 整數 + 小數 今天要表示 25.125 那定點數表示法就是 25 125,中間再以小數點作為連接 浮點數: 小數點是漂浮不定的,整個數字表示分為 有效數字跟指數,類似於科學記號表示法 今天要
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News