首頁
LBank 新聞中心
Tether的QVAC將數十億參數AI模型推向手機及消費級GPU
请求头:
tethers-qvac-pushes-multi-billion-parameter-ai-models-onto-phones-and-consumer-gpus
Tether的QVAC將數十億參數AI模型推向手機及消費級GPU
QVAC Fabric 將 BitNet LoRA 微調與推理帶到 AMD 和 Intel GPU、Apple 的 Metal 架構以及高階行動 GPU,聲稱較 CPU 基準提升 2–11 倍速度,並降低最多 90% 的記憶體使用量。Tether 表示已在 Pixel 9、Galaxy S25 和 iPhone 16 上微調出最高達 38 億參數的模型,並在 iPhone 16 上達到最高 130 億參數,將裝置端 AI 推升至遠超過當今典型 30 億以下演示的境界。此次發布符合 Tether 從純穩定幣發行商轉型為基礎設施提供者的策略,補充早前 QVAC 計畫,如 410 億代幣的 Genesis I 資料集及本地 AI 工作台,挑戰大型科技公司的 AI 壟斷。
2026-03-17 來源:crypto.news

Tether 的 QVAC Fabric 整合 BitNet LoRA,以在消費級 GPU 和旗艦手機上微調並運行數十億參數的 AI 模型,推動嚴肅的 AI 工作向邊緣延伸。

摘要
  • QVAC Fabric 將 BitNet LoRA 微調與推理帶到 AMD 及 Intel GPU、Apple 的 Metal 架構以及高端行動 GPU,宣稱在 CPU 基準上速度提升 2 至 11 倍,且記憶體使用量降低高達 90%。​
  • Tether 表示已在 Pixel 9、Galaxy S25 及 iPhone 16 上微調至高達 38 億參數的模型,且在 iPhone 16 上達到 130 億參數,將裝置端 AI 推升遠超過現行典型的低於 30 億參數示範。​
  • 此版本契合 Tether 由純穩定幣發行者轉型為基礎設施營運者的轉變,並補足早期 QVAC 計畫如擁有 410 億代幣的 Genesis I 數據集與在地 AI 工作台,挑戰大型科技公司的 AI 壕溝。

Tether 的 AI 部門悄然推出迄今最積極的非穩定幣押注之一:一個跨平台的 BitNet LoRA 框架,整合於其 QVAC Fabric 堆疊中,能直接在消費級 GPU 與旗艦智慧型手機上訓練並運行數十億參數的語言模型。如果這些數據在 Tether 自身基準外依然成立,將使裝置端 AI 從「可愛示範」晉升為對硬體商與與加密基礎建設投資者均具系統性意義的技術。

新版 QVAC Fabric 帶來 BitNet LoRA 在 AMD 與 Intel GPU、Apple Metal 生態系及多款行動 GPU 上的微調與推理功能,統一於單一框架中。Tether 主張,在旗艦裝置上,GPU 推理速度較 CPU 基準快 2 至 11 倍,且相比全精度模型,記憶體使用可降低高達 90%。實際上,這意味著可在相同硬體範圍內塞入更大型模型,或同時運行更多併發會話,對熱能與記憶體有限的手機及筆電來說至關重要。

這些關鍵數據極具挑戰性:Tether 團隊表示已成功完成對 Pixel 9、Galaxy S25 及 iPhone 16 等裝置上高達 38 億參數模型的微調,並在 iPhone 16 上推進至 130 億參數的微調。這是對目前主要仍停留在低於 30 億參數模型且重負載多由雲端承擔的裝置端 AI 市場的明顯升級。若可複現,這暗示未來可在本地完成嚴肅的個性化與領域特化調整,無需將用戶數據外送裝置。​

策略層面,這吻合 Tether 正在從純穩定幣發行者轉型為更廣泛基礎設施營運者的進程。公司已在能源、挖礦及媒體領域投入數十億,現更將邊緣 AI 工具列入版圖,並將相關 QVAC 與 BitNet LoRA 代碼開源於 GitHub,供開發者檢視與衍生。開源並非出於利他,而是為了分布。如果 QVAC 成為獨立開發者及小型實驗室將模型推上消費硬體的標準途徑,Tether 將在一套遠離銀行監管直接打擊線的堆疊中,買到文化與技術上的影響力。​

對市場而言,短期影響在於敘事而非損益。此處無通證、無明顯「挖礦」收益角度。但宏觀故事明確:隨著更多 AI 工作移向邊緣,基礎設施權力將從集中的超大規模雲端,轉向掌控關鍵工具鏈與硬體抽象層者。Tether 正在釋放訊號,表明它有意成為其中一員,利用其資產負債表培育那些降低單一雲端或司法轄區依賴的基元。對日漸沉迷 AI 相關路徑的加密生態而言,這提醒大家並非每個嚴肅押注都需附帶代幣代號。​

目前明顯的技術問題包括:BitNet LoRA 所宣稱的加速及記憶體壓縮效果,在同一裝置上與像 llama.cpp、MLC 或 Qualcomm 自家 SDK 等現有方案相比如何?實際使用中的能源與熱控妥協如何?其商業部署授權條款有多寬鬆?但若即使保守比例的 Tether 論述能通過獨立基準測試驗證,QVAC Fabric 中 BitNet LoRA 的整合將是將高端智慧手機轉變為中型語言模型訓練與推理平台的實質進展——推動 AI 更接近邊緣,同時為 Tether 贏得在關鍵數位基礎設施中又一據點。