AI大模型一体机 – 北京新维讯科技有限公司

本地部署，私有大模型，高效赋能，安全数据本地处理

DeepSeek一体机本地私有化部署

简述

磐思DeepSeek一体机是由新维讯科技有限公司自主研发的企业级AI大模型私有化部署解决方案，深度融合高性能硬件、定制化软件平台与全栈安全技术，为企业提供开箱即用、安全可控的本地化大模型服务。该产品以“数据不出域、模型私有化”为核心设计理念，通过软硬一体化交付模式，覆盖从底层算力资源到上层AI应用的全链条需求，助力企业快速构建智能化业务体系，实现数据驱动的高效运营。

适用场景

构建智能知识库（RAG）

搭建基于RAG技术的企业知识库系统，支持内部人员根据业务需求自主提取关键信息，包括：
运营数据分析：自动生成业务报表，挖掘经营指标趋势。
文档智能检索：快速定位合同、制度等内部文件，支持PDF/Word/Excel多格式解析。
多语言文档翻译：实现中英日韩等语种互译，保留原文格式与专业术语。
客户信息整合：聚合分散的客户数据，构建统一视图并自动分类标签。

产品特点

软硬一体交付，开箱即用

预集成私有化大模型服务平台与高性能硬件集群，为企业提供标准化大模型服务解决方案，省去硬件采购、环境配置、模型调试等环节，实现开机即用；

多模型即插即用，灵活适配

支持LLaMA、Qwen、DeepSeek等多元模型兼容全系列模型，帮助传统企业快速建立大模型的承载底座，支撑AI应用稳定运行。

高集成设计，极简开发

兼容OpenAI API，方便各种开源工具集成，支持OpenUI等开源工具。助力企业快速构建私有化知识库、日常办工辅助、合同审核、智能客服、辅助开发等常见的AI应用。

专业服务

提供全流程的技术支持服务，保障落地效果，聚焦垂直领域，构建垂直领域知识库，融合原有系统，打造专属智能体。

配置信息

Ubuntu Server LTSC操作系统
IPMI 2.0 管理接口
支持本地Deepseek，通义千问等模型部署，提供UI交互界面，数据训练模块，多用户权限管理模块，实例负载均衡模块
本地RAG集成

支持GPU到CPUx32传输带宽，比业界x16翻倍，满足CPU与GPU高通信带宽场景要求；
支持32个DDR5内存插槽，最高5600MHz；
支持8卡直通和10卡Switch两种配置，支持多种GPU拓扑，灵活匹配不同应用场景需求；
支持GPU Direct，支持存储/网络 RDMA/GPU P2P 直接传输数据，满足集群部署需求；
超高扩展能力，支持最多15个标准PCIe插槽，可配置8个双宽GPU+7个PCIe标准插卡+1个OCP3.0网卡；
存储配置灵活可选，满足大容量和高性能的本地存储需求，最大支持24个U.2NVMe；
系统关键部件均采用冗余、热插拔设计，同时支持免工具拆装，提升故障维护效率，提升系统的可用性；
集成智能管理芯片，提供开放的管理平台，支持IPMI2.0、Redfish、SNMP等多种管理协议；
支持远程KVM、虚拟媒介、关键部件状态监控、异常报警等各种管理功能，实现了全面的远程系统级智能管理。

Deepseek R1-14B

标准19英寸4RU机架式服务器
GPU：RTX4090*2卡
64GB RECC DDR4内存
单卡24GB显存
≈20tokens/s
支持20+用户同时访问

Deepseek R1-32B

标准19英寸4RU机架式服务器
GPU：RTX4090*4卡
128GB RECC DDR4内存
单卡24GB显存
≈20tokens/s
支持50+用户同时访问

Deepseek R1-70B

标准19英寸4RU机架式服务器
GPU：RTX4090*8卡
256GB RECC DDR5内存
单卡24GB显存
≈20tokens/s
支持70+用户同时访问

Deepseek R1-671B 4-bit 标准量化

标准19英寸4RU机架式服务器
GPU：RTX4090*8卡
512GB RECC DDR5内存
单卡24GB显存
≈10tokens/s
支持10+用户同时访问

Deepseek R1-671B满血版部署

标准19英寸8RU机架式服务器
GPU：H20*8卡
NVIDIA HGX H20 8-GPU SXM 141GB GPU模组
1024GB RECC DDR5内存
单并发20 tokens/秒，支持高并发
原生FP8无精度损失

演播制作

融合媒体+IP化

内容制作与管理

播出系统

制播安全

AI智能算力

广电与传媒

后期制作

教育与培训

赛事竞技

现场节目制作

新媒体直播

本地部署，私有大模型，高效赋能，安全数据本地处理

DeepSeek一体机本地私有化部署

简述

适用场景

构建智能知识库（RAG）

工作流智能优化

内容创作赋能

全渠道智能客服

产品特点

软硬一体交付，开箱即用

多模型即插即用，灵活适配

高集成设计，极简开发

专业服务

配置信息

Deepseek R1-14B

Deepseek R1-32B

Deepseek R1-70B

Deepseek R1-671B 4-bit 标准量化

Deepseek R1-671B满血版部署

演播制作

融合媒体+IP化

内容制作与管理

播出系统

制播安全

AI智能算力

广电与传媒

后期制作

教育与培训

赛事竞技

现场节目制作

新媒体直播

本地部署，私有大模型，高效赋能， 安全数据本地处理

DeepSeek一体机本地私有化部署

简述

适用场景

构建智能知识库（RAG）

工作流智能优化

内容创作赋能

全渠道智能客服

产品特点

软硬一体交付，开箱即用

多模型即插即用，灵活适配

高集成设计，极简开发

专业 服务

配置信息

Deepseek R1-14B

Deepseek R1-32B

Deepseek R1-70B

Deepseek R1-671B 4-bit 标准量化

Deepseek R1-671B满血版部署

微信扫码获取方案报价13311202006

本地部署，私有大模型，高效赋能，安全数据本地处理

专业服务

微信扫码
获取方案报价
13311202006