C語言 浮點數(floating point)

閱讀時間約 11 分鐘

分類

  浮點數其實就像是小數一樣,該變數會將取得的小數值轉變為二進位儲存,分為三種類型:

△單精度浮點數、單精度浮點值(float)

4bytes能表達的小數類型,範圍在±3.4e-38~±3.4e+38之間,而有效位數為前7位,但能絕對保證的只有前6位數字。看不懂e是什麼嗎?點我!

△雙精度浮點數、雙精度浮點值(double)

8bytes能表達的小數類型,範圍在±1.79E-308 ~ ±1.79E+308之間,而精確位數前16位,但絕對保證的只有前15位數字。

長雙精度浮點數、長雙精度浮點值(long double)

16bytes能表達的小數類型,範圍在±1.79E-308 ~ ±1.79E+308之間,與double相同,但是精確位數則是前19位,而絕對保證的只有前18位數字。
#include "stdio.h"
#define __USE_MINGW_ANSI_STDIO 1

int main(void){
  float h = 0.5;//單精度浮點數宣告
  printf("%f\n",h);//%f 代表float

  double i = 0.5;//雙精度浮點數宣告
  printf("%lf\n",i);//%lf 代表double

  long double j = 1.5;//長雙精度浮點數宣告
  printf("%Lf\n",j);//%Lf 代表long double
}
--------------------------------結果---------------------------------
0.500000
0.500000
1.500000

有效位數是什麼?

儲存形式

  在理解有效位數之前,我們先來講講浮點數的儲存方式吧。浮點數的所占bits會用來分給號(sign)、指數(exponent)、尾數(mantissa),以float的32bits為例:
●號(sign):佔1bit,用於表示其浮點數的正負,0表示正數,反之1代表負數。
●指數(exponent):佔8bits,用於表示儲存的移位關係。在電腦中指數的儲存方式是以指數偏移量為0,因此會等於移位數 + 指數偏移量。指數偏移量 = 2 ^ (k - 1) - 1,其中k為指數(exponent)所占用的bits數,因此float的指數偏移量 = 2 ^ (8 - 1) - 1 = 2 ^ 7 - 1 = 127。
●尾數(mantissa):佔23bits,用於表示小數的二進位。
浮點數(floating point) = 號(sign)*尾數(mantissa)*2^指數(exponent)
floating point = S * M *2 ^ E
其中 號(sign)為±1,而 2^指數(exponent)代表2的e次方。
  很難懂嗎?我們來以1.25作為例子好了。
1、將7.25化為二進位
  111.01
2、確認整個小數是為正數還是負數,倘若是正數則 號(sign)為0,反之負數則為1。
  S:0
3、將小數點移到能讓整個小數最高位是個位數的位置
  1.1101
4、找到由左而右的第一個1,只取後面的數字。
  1101
  捨去第一個1的原因在於,假設有一個10進位的數字是0100,我們會很自然地把前面的
0刪掉只留下100,因為那個0是無意義的。化做二進位來說,捨去掉無意義的0之後,無論
如何最前方就一定是1了,因此不必特意儲存也會知道。
5、將這串數字,後面補上數個0,直到共有23位,而這就是尾數(mantissa)。
  M:1101 0000 0000 0000 0000 000
6、計算剛剛第2點中小數點移了幾位,往左+1,往右-1,這則是指數(exponent)。
  111.01 → 1.1101 小數點共往左移動了兩格所以是2。
  但還沒結束喔,還要再加上指數偏移數也就是127。
  
  2 + 127 = 129,化做二進位表示為
  E:1000 0001
7、最終整個儲存形式為:
  0   1000 0001   1101 0000 0000 0000 0000 000
  S       E                     M
8、計算方式
  S = +1
  E = 129 - 127 =2
  M = 0.1101(二進位) + 1(被捨去的) = 0.5 + 0.25 + 0.0625 + 1
  = 0.8125 + 1 = 1.8125
  floating point = S * M * 2 ^ e
  floating point = +1 * 1.8125 * 2 ^ 2
           = 1.8125 * 4 = 7.25
  

不精確的原因

  由float儲存方式我們可以知道儲存空間的有限,再者是二進位小數的難點。以一個簡單的例子即可知道,0.3的二進位為0.01001100110011001100,事實上這只是一部分,換句話說,它就是一個無限小數。
  設x為基數,y為進位制,z為該位數的話,可以看出小數其實就是 x y ^z。以十進位的0.6為例,就是 6 * 10 ^ -1。
  但在二進位當中值只會有0或1,因此小數的部分可以簡化為,是由數個2 ^ z組成,其中z為負數。但像剛剛舉例的0.3就無法用二進位完整表示,只能用無限個二進位小數做到逼近的值。
  這時候就出現了一個問題,剛剛有說儲存空間的有限,我們可以知道只能用有限的二進位是難以表達出像0.3的這種數字,因此一定多少都會有誤差,這就是為什麼浮點數會有不精確的問題。

範圍與有效位數的差別

  為什麼float的範圍可以這麼大?在剛剛的儲存形式當中,指數的形式可以有效幫助浮點數擴大範圍。
如二進位0.0........01,假設小數點後方的0有125個。稍微計算過後我們可以知道儲存
形式為:
  0   0000 0001   0000 0000 0000 0000 0000 000
  S E M

計算方式:
S = + 1
E = -126
M = 1
  因此這種極小的小數,都能因為指數而正確儲存。那有效位數的存在其實就是剛剛有提到的,因為二進位小數儲存的難度,導致數值不精確。而有效位數則是這個儲存空間能夠正確儲存的範圍,當然有效位數當中還是有少部分小數會是錯誤,因此精確位數的存在則是為了表示該範圍內的數值絕對是完全精確的。

浮點數不被建議使用的原因

精確問題

  在一個專案當中,數字的精確是非常重要的,或許你會覺得在精確範圍內使用不就精確了。但,是這樣嗎?
#include "stdio.h"
int main(void){
  float a = 0.3;
  printf("%f",a*3000000000000000);//你以為輸出的是900000000000000嗎?
}
--------------------------------結果---------------------------------
900000062111744.000000
  沒錯,就是這樣細微的差別,經過大量計算或是大數計算後,會產生不一樣的結果,這對於一個需要精確數字的專案來說是很傷的。

速度問題

  由於十進位小數轉二進位小數,必須不斷的計算直到做到逼近值,要知道這種計算是相當困難的,雖說現今大多cpu有為浮點數做專門的運算,但實際上還是比整數運算慢了些。
#include "stdio.h"
#include "sys/time.h"
int main(void){
  struct timeval begin, end;
  gettimeofday(&begin, 0);
  float a = 0.3;
  for(int i =0;i<100000000;i++){
    a++;
    a++;
    a--;
    a--;
  }
  gettimeofday(&end, 0);
  long seconds = end.tv_sec - begin.tv_sec;
  long microseconds = end.tv_usec - begin.tv_usec;
  double elapsed = seconds + microseconds*1e-6;
  printf("Time measured: %.3f seconds.\n", elapsed);
  return 0;
}
--------------------------------結果---------------------------------
Time measured: 1.139 seconds.
-------------------------------分隔線--------------------------------
#include "stdio.h"
#include "sys/time.h"
int main(void){
  struct timeval begin, end;
  gettimeofday(&begin, 0);
  int a = 3;
  for(int i =0;i<100000000;i++){
    a++;
    a++;
    a--;
    a--;
  }
  gettimeofday(&end, 0);
  long seconds = end.tv_sec - begin.tv_sec;
  long microseconds = end.tv_usec - begin.tv_usec;
  double elapsed = seconds + microseconds*1e-6;
  printf("Time measured: %.3f seconds.\n", elapsed);
  return 0;
}
--------------------------------結果---------------------------------
Time measured: 0.730 seconds.
(這邊採用CR Ferreira的計算時間方式)
  上方整數與浮點數的運算中,我們可以看出整數運算還是比浮點數快了些。

結論

  雖說浮點數有以上缺點,但只要排除這些問題,使用上還是可以的。假設今天你的專案不需要精確的數字,或是在精確位數內運算的,都還是可以使用浮點數。至於速度問題,雖然整數運算以及浮點數運算本身就是兩種不同的東西,但倘若兩種運算都可以達到目的的情況下,還是建議使用整數運算的好。
為什麼會看到廣告
10會員
18Content count
這裡是來自 高科大 資管系二年級的學生,希望能在學習的過程中,也分享這些知識給大家。
留言0
查看全部
發表第一個留言支持創作者!
咖啡因學習教室 的其他內容
說明 重點 △定義變數 △文字的定義 △文字與數字的差別 △整數與浮點數 △signed(有號)與unsigned(無號)的區別 △e是什麼符號? 分類 △字元 △字串 △短整數 △整數 △長整數 △超長整數 △單精度浮點數 △雙精度浮點數 △長雙精度浮點數 應用 宣告與輸出 運算符 結論
前言 輸出 printf 格式控制字元、格式控制符(format char) 前言 輸出控制字元、輸出控制符 轉義字元、轉義符 格式控制字元、格式控制符 輸入 scanf gets gets與scanf差異
auto(自動)、register(暫存器)、static(靜態)、extern(外部),以作用範圍(scope)、存儲時期(life time)、連結(linkage)的不同作為區別。
說明 重點 △定義變數 △文字的定義 △文字與數字的差別 △整數與浮點數 △signed(有號)與unsigned(無號)的區別 △e是什麼符號? 分類 △字元 △字串 △短整數 △整數 △長整數 △超長整數 △單精度浮點數 △雙精度浮點數 △長雙精度浮點數 應用 宣告與輸出 運算符 結論
前言 輸出 printf 格式控制字元、格式控制符(format char) 前言 輸出控制字元、輸出控制符 轉義字元、轉義符 格式控制字元、格式控制符 輸入 scanf gets gets與scanf差異
auto(自動)、register(暫存器)、static(靜態)、extern(外部),以作用範圍(scope)、存儲時期(life time)、連結(linkage)的不同作為區別。
你可能也想看
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
C#是一種開源、跨平台、面向對象的編程語言,具有類型安全、泛型、模式匹配等特性。廣泛應用於桌面和Web應用程序、遊戲開發、移動應用、雲計算等領域。全球數十萬家公司像微軟、Unity Technologies、Stack Overflow等使用C#支持其業務。C#還提供豐富的進階學習資源和主題。
Thumbnail
想要進入工程師的世界,首先要先學會架設自己的Build code環境,有了編譯環境,接下來就可以安心的撰寫你想要的C語言程式啦! 如果你不知道該從何下手,那不妨先照著本篇文章的步驟做,Violet一步一步教你並解釋每個步驟的意義,很快你就會得到一個能編譯C語言程式碼的虛擬基環境哦!
Thumbnail
在開發應用程式時,經常會遇到需要調整圖片大小以節省空間或加快加載速度的情況。本教學將介紹如何使用 C# 語言來壓縮圖片並調整其大小,以便在應用程式中使用。
Thumbnail
Ç在葡語被稱為「cedilha」。除了葡語之外,來看看還有哪些語言有這個符號吧!
Thumbnail
這篇文章將會從基本概述到射線偵測應用的詳細步驟,講述運用射線改變特定圖層中,射線命中的物件顏色。
Thumbnail
  雖然Dart 語言本身支援跨平台的編譯方式,但在實務開發時還是不免需要使用外部非Dart語言所提供的函式庫進行功能開發且由於C 語言是最為廣泛且通用的程式語言,因此Dart語言也有提供支援與C語言函式庫互通性的方式;本篇主要是以MSVC作為C的編譯器來實作說明如何引用C語言會遇到的作法。
Thumbnail
Ironman伴讀小書僮又來了! 今天要念英文繪本給Piupiu和Piu 哥聽。 防疫期間在家育兒真的是很挑戰英雄,還是拯救地球簡單一點~ 跳一下來到繪本介紹, A Chair for My Mother -by Vera B. Williams 這本就是勸生女兒的繪本呀!故事中的小女孩孝順又貼心,
第n項的費式數列為何? #include int main() { int a0=0, a1=1, a2=1, i=3, fib, n; scanf("%d", &n); if (n==0) printf("0\n"); else if (n printf("1\n"); els
string SrcStr = "admin"; string[] UserNameCvt = SrcStr.Split(','); Roles.AddUsersToRole(UserNameCvt, "Administrator"); 註記: 網路上較少此種例子,多為string[] to S
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
C#是一種開源、跨平台、面向對象的編程語言,具有類型安全、泛型、模式匹配等特性。廣泛應用於桌面和Web應用程序、遊戲開發、移動應用、雲計算等領域。全球數十萬家公司像微軟、Unity Technologies、Stack Overflow等使用C#支持其業務。C#還提供豐富的進階學習資源和主題。
Thumbnail
想要進入工程師的世界,首先要先學會架設自己的Build code環境,有了編譯環境,接下來就可以安心的撰寫你想要的C語言程式啦! 如果你不知道該從何下手,那不妨先照著本篇文章的步驟做,Violet一步一步教你並解釋每個步驟的意義,很快你就會得到一個能編譯C語言程式碼的虛擬基環境哦!
Thumbnail
在開發應用程式時,經常會遇到需要調整圖片大小以節省空間或加快加載速度的情況。本教學將介紹如何使用 C# 語言來壓縮圖片並調整其大小,以便在應用程式中使用。
Thumbnail
Ç在葡語被稱為「cedilha」。除了葡語之外,來看看還有哪些語言有這個符號吧!
Thumbnail
這篇文章將會從基本概述到射線偵測應用的詳細步驟,講述運用射線改變特定圖層中,射線命中的物件顏色。
Thumbnail
  雖然Dart 語言本身支援跨平台的編譯方式,但在實務開發時還是不免需要使用外部非Dart語言所提供的函式庫進行功能開發且由於C 語言是最為廣泛且通用的程式語言,因此Dart語言也有提供支援與C語言函式庫互通性的方式;本篇主要是以MSVC作為C的編譯器來實作說明如何引用C語言會遇到的作法。
Thumbnail
Ironman伴讀小書僮又來了! 今天要念英文繪本給Piupiu和Piu 哥聽。 防疫期間在家育兒真的是很挑戰英雄,還是拯救地球簡單一點~ 跳一下來到繪本介紹, A Chair for My Mother -by Vera B. Williams 這本就是勸生女兒的繪本呀!故事中的小女孩孝順又貼心,
第n項的費式數列為何? #include int main() { int a0=0, a1=1, a2=1, i=3, fib, n; scanf("%d", &n); if (n==0) printf("0\n"); else if (n printf("1\n"); els
string SrcStr = "admin"; string[] UserNameCvt = SrcStr.Split(','); Roles.AddUsersToRole(UserNameCvt, "Administrator"); 註記: 網路上較少此種例子,多為string[] to S