LLM 可解釋性大突破:首次公開 AI 的思考路徑。Llama 4 翻車現場直擊,官方說的和你拿到的不一樣? | S2E8

LLM 可解釋性大突破:首次公開 AI 的思考路徑。Llama 4 翻車現場直擊,官方說的和你拿到的不一樣? | S2E8

61.715 Lượt nghe
LLM 可解釋性大突破:首次公開 AI 的思考路徑。Llama 4 翻車現場直擊,官方說的和你拿到的不一樣? | S2E8
📣 本集感謝《天下雜誌》贊助 想快速掌握每天的財經、科技、管理重點?我最近體驗了《天下每日報》App,覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。 每天 8 則精選新聞+深度解析,幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽,資訊密度很高但吸收很輕鬆。 🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天(價值 NT$360),還有機會抽 AirPods 4! 👉 ⁠https://bit.ly/42cE2Ph 大型語言模型到底會不會「思考」🧠?這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究,透過名為「電路追蹤(Circuit Tracing)」的方法,第一次打開了語言模型的腦袋,讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。 這集我們聊聊: 📌 為什麼 LLM 這麼難解釋? 📌 MLP 到底在模型裡做了什麼? 📌 CLT 是怎麼繞過黑盒、還原語意電路? 📌 Claude 真的有「中間想法」還是只是唬人? 📌 未來會不會出現一個完全可控、可理解的 AI? 此外,當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高,實際上卻連 strawberry 都拼不對?Meta 說的和大家實際拿到的版本真的一樣嗎?ChatBot Arena 上測試的是誰?這場開源大戰背後,又藏了哪些沒說清楚的眉角🧐? 00:00 開頭 02:41 Llama 4 發表 05:42 實測翻車 09:42 測試版不等於開源版? 10:50 Meta 為何這麼趕? 12:27 LLM 可解釋性的困難 14:05 Claude 的思維過程 15:20 LLM 有計畫能力 17:57 技術細節 20:48 為何 LLM 是黑盒? 21:25 怎麼打開黑盒? 23:34 未來會有可解釋的 LLM? 26:13 結論:今天學到什麼? 🎧 聽完也歡迎留言告訴我:你覺得語言模型真的「有在思考」嗎?Llama 4 的表現,有讓你失望嗎? 🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠⁠https://linktr.ee/jktech⁠