“北京造”大模型開源性能全球領先

2025年07月31日09:15 | 來源：北京日報

小字號

原標題：“北京造”大模型開源性能全球領先

7月28日晚，總部位於北京的清華系大模型企業智譜發布其新一代旗艦大模型GLM-4.5。這個專為智能體應用打造的基礎模型，在復雜推理、代碼生成及智能體交互等通用能力上，實現了能力融合與技術突破，綜合測試性能已躋身全球領先行列。

“衡量AGI（通用人工智能）的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5是我們對此理念的首次完整呈現。”智譜相關負責人介紹，GLM-4.5首次在單個模型中實現將推理、編碼和智能體能力原生融合，以滿足智能體應用的復雜需求。

業內人士分析，這款新模型的發布，代表了AI邁向通用人工智能的一次重要轉變。它不再滿足於扮演一個被動回答問題的“聊天機器人”，而是要成為能夠理解復雜目標、自主規劃並執行多步驟任務的“全優生”。例如，模型能夠勝任全棧開發任務，一鍵生成較為復雜的應用、游戲、交互網頁。在實際例子中，用戶通過z.ai使用該模型時，僅用一句簡單的指令，就可讓GLM-4.5獨立開發出具備搜索功能的“谷歌”網站、可以發彈幕的“B站”，甚至直接上線一個完整的“Flappy Bird”小游戲。

在性能評估中，GLM-4.5的表現展示了其架構優勢：在涵蓋研究生水平推理和復雜軟件工程解題等12項全球公認的硬核測試中，其綜合得分位列全球第三，在所有國產模型和開源模型中均排名第一。GLM-4.5系列在成本和效率上也實現了突破：API調用價格低至輸入價格為0.8元/百萬tokens（大模型處理文本的基本單位），輸出價格為2元/百萬tokens，大幅低於目前主流的模型定價。

發布后不到兩個小時，GLM-4.5模型就引發了不少國際媒體關注，發布后不到12小時，其已位列國際開源社區Hugging-Face榜單全球第二。

國際社交媒體X平台就在首頁推薦了這款中國大模型。美國消費者新聞與商業頻道CNBC報道稱：“中國企業正在研發的人工智能模型不僅智能化水平提升，使用成本也持續降低，這與深度求索（DeepSeek）當年震動市場的突破核心優勢相呼應。”彭博社表示，OpenAI的挑戰者智譜發布開源模型，試圖在這個蓬勃發展的行業中搶佔制高點。（記者孫奇茹）

(責編：鮑聰穎、高星)

分享讓更多人看到

人民日報報系

旗下網站

“北京造”大模型開源性能全球領先

客戶端下載

熱門排行