INTELLECT-3：開啟開源大模型訓練新紀元

- 11月 27, 2025

🚀 INTELLECT-3：開啟開源大模型訓練新紀元

引言：打破壟斷，重新定義大模型訓練範式

在當今AI高速發展的時代，大型語言模型（LLM）的訓練已成為科技競爭的焦點。然而，這項尖端技術的訓練過程往往被少數科技巨頭所壟斷。

2025年11月26日，Prime Intellect 團隊發布了 INTELLECT-3，這標誌著一個突破性的進展。它不僅是一個性能卓越的 100B+ 參數 MoE（Mixture-of-Experts）模型，更重要的是，其訓練基礎設施也全面開放。這項發布代表了一種全新的訓練理念：讓大模型訓練走向更加開放和社區驅動的未來。

INTELLECT-3是一個106B參數的MoE模型，基於GLM 4.5 Air，通過監督微調（SFT）和強化學習（RL）訓練而成。它在數學、程式碼、科學和推理基準測試中，成績甚至超越了許多更大規模的封閉模型。

🔬 技術架構：MoE與強化學習的完美結合

INTELLECT-3的卓越性能，得益於其先進的技術架構與訓練方法：

1. Mixture-of-Experts (MoE) 架構

MoE架構通過結合多個「專家」模型，專注於不同的任務領域。

高效率： 106B的總參數量中，只有一部分參數在每次前向傳播中被激活。
優勢： 相比傳統的稠密模型，MoE在保持計算效率的同時，顯著提升了模型性能和處理複雜任務的能力，並減少了計算負擔。

2. 強化學習（RL）訓練方法

Prime Intellect團隊使用了客製化的 PRIME-RL 異步強化學習框架，讓模型通過試錯來學習最佳策略。

優勢： 強化學習特別適用於需要深度推理和問題解決能力的任務。
核心創新： PRIME-RL 的即時異步訓練能力，使其在大規模集群中也能高效運行，擅長處理長期決策問題，有效避免傳統瓶頸。

🛠️ 訓練基礎設施：大規模分布式訓練的奇蹟

INTELLECT-3的訓練過程，展示了開放平臺也能擁有頂尖的分布式訓練能力：

核心驅動力與生態系統：

組件名稱	核心功能	重要性
PRIME-RL	客製化異步強化學習框架	實現高效、大規模的強化學習訓練。
Verifiers 庫	創建LLM強化學習環境的開源工具	提供統一的環境接口，加速環境開發與共享。
Environments Hub	包含數百個社區實現的RL環境平臺	為模型提供豐富多樣的訓練場景。
Prime Sandboxes	高吞吐量、安全可靠的程式碼執行環境	確保程式碼生成任務的安全與效率。

強大的運算能力：

INTELLECT-3的訓練涉及了驚人的計算資源：

512 個 NVIDIA H200 GPU
分佈在 64 個互聯節點上

儘管涉及如此大規模的分布式計算，Prime Intellect的平臺仍能保持高效的通信和同步，確保訓練過程的無縫協作。

🌍 開源策略：AI 民主化的重要一步

Prime Intellect的目標是 “每個人都能擁有自己的超智能體”。他們的開放策略是對當前AI領域封閉趨勢的直接回應：

1. 全面開放訓練配方：

團隊開放了完整的訓練配方，包括：模型權重、訓練框架、數據集和評估方法。這使研究人員和開發者能夠：

重現 INTELLECT-3的訓練過程。
在其基礎上進行進一步的開發和改進。

2. 平台化服務降低門檻：

Prime Intellect提供了 "全棧"支持，用戶可以通過統一接口訪問所有必需的資源，大大降低了個人和小型企業參與大規模模型訓練的門檻。

📈 性能評估：超越預期的表現

INTELLECT-3在多個基準測試中的表現令人矚目，其成績可與一些更大規模的封閉模型相媲美：

優勢領域： 數學推理、程式碼生成、科學問題解決和邏輯推理。
實用性： 儘管參數規模超過100B，INTELLECT-3仍保持了較好的推理效率。

💡 意義與未來展望：開放AGI之路

INTELLECT-3的發布不僅是一項技術突破，更是對AI社區發展模式的重大探索。

對AI社區的意義： 證明了通過開放合作，非大公司的團隊也能訓練出世界一流的模型。
構建真正的AI民主化： 有助於構建一個更加公平和多樣化的AI生態系統，避免權力過度集中。

Prime Intellect的座右銘是：「我們相信，只有當每個人都能訓練自己的模型時，AI才能真正成為推動社會進步的力量。」

INTELLECT-3是一個宣言——宣告了開放AI運動的崛起，以及一個更加民主化AI未來的可能。

本文整理自Prime Intellect團隊發布的INTELLECT-3技術報告及相關資料。欲了解更多技術細節，請訪問 Prime Intellect官網。

搜尋此網誌

智子筆記