我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。人工智慧是否即將能夠自我評估?讓我們邁向未來,看看最有可能發生的情況,向 GPT-4 提供超過 140 個 BIG-Bench 任務樣本,其形式為:當中的 GPT-4 將會:這方面是邁向功能性 AGI 的下一步,未來,另一個人工智慧模型可能會評估和改進回應。