開學第一周,深大全國產化、本地化部署的滿血版DeepSeek-R1(671B)正式上線。深圳大學大數據系統計算技術國家工程實驗室、深圳大學信息中心聯合華為基於昇騰平台部署的滿血版DeepSeek-R1(671B)大模型為全校師生提供高效、穩定的本地化AI服務。
相較於蒸餾版模型,滿血版DeepSeek-R1具備顯著優勢,性能更強:基於671B參數量級支持複雜邏輯推理與長文本深度交互,功能更全:支持私有知識庫融合,為教學科研提供定製化服務。
深圳大學選擇本地化部署Deepseek-R1彰顯三大核心價值,一是服務高可用性,基於校內昇騰算力平台(85P算力儲備),規避外部服務中斷風險,保障7x24小時穩定響應,滿足教學、科研及辦公的連續性需求;二是數據私隱零泄露,所有用戶問答數據僅限本地存儲,不用於任何模型優化或第三方共享,嚴格保障科研機密與個人私隱,為學術探索築牢安全防線;三是定製化服務擴展,未來可快速接入校本知識庫(如學術資源、課程體系),打造「AI+教育」「AI+X科研」垂直領域解決方案,賦能學科交叉創新。
在校園網內,師生通過掃碼打開申請頁,即可可無限次免費體驗滿血版DeepSeek,徹底告別「服務器繁忙」困擾。
深大智算中心正在建設中
深圳大學大數據國家工程實驗室長期從事大模型理論及應用相關研究,2023年4月在LLaMA框架基礎上開源首個百億參數大規模中文語言模型伶荔(https://github.com/CVI-SZU/Linly),聯合騰訊續推出首個模塊化大語言模型訓練框架TencentPretrain(https://github.com/Tencent/TencentPretrain),大大推動了國內大語言模型技術的發展。在開源伶荔模型基礎上,相關團隊陸續推出了可以與人真實互動的2D/3D數字人與數字客服,人臉細粒度分析多模態大模型、病理/超聲/腹部CT多模態診斷大模型以及金融領域軟件需求分析大模型等垂直領域大模型。後續將在DeepSeek基礎上持續提升相關系統性能。
據透露,大數據國家工程實驗室正在承建深大自己的智算中心(投資超過一個億,算力達330P Flops),相關IT/GPU設備已經完成招標採購,機房建設正在緊鑼密鼓進行中。除了為全校師生教學科研提供算力服務,智算中心團隊將會把滿血版DeepSeek系列部署在高性能GPU上,提供安全可靠、數據私隱零泄露的國產化大模型服務。(記者 林麗青)