Python「內建函數」(built-in functions)就是不用 import,隨時可以直接呼叫的函數,像 print()、len()、range() 這些,都算。
ascii():回傳物件的 ASCII 表示字串
ascii() 跟 repr() 很像,都會回傳物件的字串表示。差別在於 ascii() 會把非 ASCII 字元用跳脫序列(\x、\u、\U)來表示。
語法:ascii(object)基本用法:
print(ascii('Hello')) # 'Hello'(純 ASCII,不變)
print(ascii('你好')) # '\u4f60\u597d'(中文被跳脫)
print(ascii('café')) # 'caf\xe9'(é 被跳脫)
print(ascii('😊')) # '\U0001f60a'(emoji 被跳脫)可以看到,ascii() 會確保回傳的字串只包含 ASCII 字元,非 ASCII 的部分全部用跳脫序列取代。
ascii() vs repr() 的差別
兩者最大的差異就是對非 ASCII 字元的處理方式:
text = '你好 World'
print(repr(text)) # '你好 World'(保留原始字元)
print(ascii(text)) # '\u4f60\u597d World'(非 ASCII 被跳脫)
# 對純 ASCII 字串,兩者結果相同
print(repr('Hello')) # 'Hello'
print(ascii('Hello')) # 'Hello'簡單來說:repr() 儘量保留原始字元,ascii() 強制只用 ASCII 字元表示。
ascii() 處理不同型別
ascii() 可以處理任何物件,不只是字串:
# 列表
print(ascii(['你', '好'])) # ['\u4f60', '\u597d']
# 字典
print(ascii({'名字': '小明'})) # {'\u540d\u5b57': '\u5c0f\u660e'}
# 數字(沒有非 ASCII,所以不變)
print(ascii(42)) # 42
print(ascii(3.14)) # 3.14
# 布林值
print(ascii(True)) # True跳脫序列的格式
ascii() 使用的跳脫序列格式取決於字元的 Unicode 碼位大小:
# \xNN:碼位 128~255(1 byte)
print(ascii('é')) # '\xe9'
print(ascii('ñ')) # '\xf1'
# \uNNNN:碼位 256~65535(2 bytes)
print(ascii('你')) # '\u4f60'
print(ascii('★')) # '\u2605'
# \UNNNNNNNN:碼位 65536 以上(4 bytes)
print(ascii('😊')) # '\U0001f60a'
print(ascii('🐍')) # '\U0001f40d'什麼時候會用到 ascii()?
ascii() 最常用在需要確保資料只包含 ASCII 字元的場景,例如寫入只支援 ASCII 的日誌檔、除錯時檢查字串內容、或是產生跨平台相容的輸出:
# 安全地記錄可能含非 ASCII 的使用者輸入
user_input = '使用者輸入了:café ☕'
log_entry = f'[LOG] {ascii(user_input)}'
print(log_entry)
# [LOG] '\u4f7f\u7528\u8005\u8f38\u5165\u4e86\uff1acaf\xe9 \u2615'小小綜合例子
來做一個字串分析器,檢查字串中哪些字元是 ASCII、哪些不是:
# 字串 ASCII 分析器
def analyze_ascii(text):
print(f'原始字串:{text}')
print(f'ASCII 表示:{ascii(text)}')
print('-' * 40)
ascii_chars = []
non_ascii_chars = []
for c in text:
if ord(c) < 128:
ascii_chars.append(c)
else:
non_ascii_chars.append(f'{c} → {ascii(c)}')
print(f'ASCII 字元 ({len(ascii_chars)}個):{repr("".join(ascii_chars))}')
print(f'非 ASCII 字元 ({len(non_ascii_chars)}個):')
for item in non_ascii_chars:
print(f' {item}')
ratio = len(ascii_chars) / len(text) * 100 if text else 0
print(f'ASCII 比例:{ratio:.1f}%')
analyze_ascii('Hello 你好!Python 🐍')
# 輸出:
# 原始字串:Hello 你好!Python 🐍
# ASCII 表示:'Hello \u4f60\u597d\uff01Python \U0001f40d'
# ----------------------------------------
# ASCII 字元 (13個):'Hello Python '
# 非 ASCII 字元 (3個):
# 你 → '\u4f60'
# 好 → '\u597d'
# ! → '\uff01'
# 🐍 → '\U0001f40d'
# ASCII 比例:76.5%