中國電信使用國產芯片訓練1萬億參數的AI模型

中國電信,作為國內的國有電信巨頭之一,成功創建了兩個完全使用國產芯片訓練的大型語言模型(LLM)。這一突破標誌著中國在AI技術自給自足方面邁出了重要一步,特別是在美國對其競爭對手的先進半導體訪問限制日益加劇的背景下。

根據中國電信AI研究所的說法,其中一個模型是TeleChat2-115B,另一個則未命名,這些模型都是在數萬個中國製造的芯片上訓練的。這一成就是在美國加強出口規則,限制中國購買來自Nvidia等外國公司的高端處理器的情況下取得的。該AI研究所在微信上發表聲明稱,這一成就展示了中國獨立訓練LLM的能力,並標誌著AI技術創新和自給自足的新時代。

這些模型的規模令人矚目。中國電信表示,未命名的LLM擁有1萬億參數。在AI術語中,參數是幫助模型在訓練過程中學習的變量。參數越多,AI就越複雜和強大。

中國公司正努力跟上國外AI領導者的步伐。美國對Nvidia最新AI芯片如A100和H100的出口限制迫使中國尋求替代方案。因此,中國公司開發了自己的處理器,以減少對西方技術的依賴。例如,TeleChat2-115B模型擁有約1000億參數,因此可以與主流平台媲美。

中國電信並未具體說明是哪家公司提供了用於訓練其模型的國產芯片。然而,正如之前在這些頁面上討論的那樣,華為的Ascend芯片在中國的AI計劃中發揮了關鍵作用。

近年來面臨美國制裁的華為也在加大其在人工智能領域的努力。該公司最近開始測試其最新的AI處理器Ascend 910C,潛在客戶正在國內市場等待。大型中國服務器公司以及之前使用Nvidia芯片的互聯網巨頭顯然正在測試這款新芯片的性能。華為的Ascend處理器作為Nvidia硬件的少數可行替代品之一,被視為中國減少對外國技術依賴的關鍵組成部分。

除了華為,中國電信還與其他國內芯片製造商如專注於AI處理器的中國初創公司寒武紀合作。這些合作關係反映了中國科技行業建立本土AI解決方案生態系統的更廣泛趨勢,進一步保護該國免受美國出口管制的影響。

通過開發自己的AI芯片和技術,中國正在逐步減少對外國製造硬件的依賴,特別是Nvidia高度需求且因此昂貴的GPU。雖然美國制裁使中國公司難以獲得最新的Nvidia硬件,但外國芯片的黑市已經出現。許多中國公司寧願購買低功率的替代品,如前幾代型號,以保持對Nvidia官方支持和服務的訪問,而不是冒險在灰色市場運營。

中國的這一成就反映了其在AI和半導體技術方面方法的更廣泛轉變,強調在日益競爭的全球經濟中以及面對美國保護主義貿易政策時的自給自足和韌性。

訂閱電子報

最新文章

科技競爭白熱化,OpenAI 旗艦模型 o3-pro 強勢來襲

OpenAI 於 6 月 10 日重磅宣布,推出最強推理模型 o3-pro,在多項基準評測中超越 Google Gemini 2.5 Pro 與 Anthropic Claude 4 Opus。同時,旗艦模型 o3 輸入與輸出 Tokens 價格驟降 80%,大幅降低 AI 使用門檻。此舉重塑生成式 AI 市場格局,推動頂級性能普及,引發行業強烈震動。

25%消費者關注氣候議題?銀髮族環保意識抬頭,品牌行銷策略轉型

氣候變遷影響消費者決策,銀髮族環保意識增強。本文深入剖析品牌如何調整行銷策略,應對消費者行為變化,擁抱永續價值。

OpenAI/Google/Anthropic 精選指南:學會提示工程 & AI Agent 構建,搶先掌握 2025 商業新機會

OpenAI、Google、Anthropic 聯合推出 8 大 AI 指南!涵蓋提示工程實戰、高效 AI Agent 構建、商業應用策略及 601 個真實案例。免費下載資源,掌握 AI 技術落地關鍵,搶先布局未來商機!適用開發者、企業主、數位轉型團隊。

500GB隱私雲端戰開打:Ente相片儲存挑戰Google照片,個資保護懶人包

Ente 相片儲存(Ente Photos)的出現,正是在這樣的背景下,挑戰Google 相簿的市場地位。它不仅提供了慷慨的 500GB 儲存空間,更標榜了與Google 相簿不同的個資保護策略,值得我們深入探討。

Khoj AI:您的智能第二大脑,助力高效信息管理與個性化研究助手

在當今資訊爆炸的時代,每天面對海量數據,如何有效管理並運用這些資訊成為現代人的挑戰。