本地部署,私有大模型,高效赋能, 安全数据本地处理

DeepSeek一体机本地私有化部署

简述

磐思DeepSeek一体机是由新维讯科技有限公司自主研发的企业级AI大模型私有化部署解决方案,深度融合高性能硬件、定制化软件平台与全栈安全技术,为企业提供开箱即用、安全可控的本地化大模型服务。该产品以“数据不出域、模型私有化”为核心设计理念,通过软硬一体化交付模式,覆盖从底层算力资源到上层AI应用的全链条需求,助力企业快速构建智能化业务体系,实现数据驱动的高效运营。

适用场景

构建智能知识库(RAG)

搭建基于RAG技术的企业知识库系统,支持内部人员根据业务需求自主提取关键信息,包括:
运营数据分析:自动生成业务报表,挖掘经营指标趋势。
文档智能检索:快速定位合同、制度等内部文件,支持PDF/Word/Excel多格式解析。
多语言文档翻译:实现中英日韩等语种互译,保留原文格式与专业术语。
客户信息整合:聚合分散的客户数据,构建统一视图并自动分类标签。

工作流智能优化

通过智能Agent对接企业现有工作流与知识库体系,实现数据驱动的自动化决策响应:
系统深度对接:无缝集成ERP、CRM等业务系统及公共/个人知识库。
动态数据融合:实时抽取流程节点数据,结合上下文生成精准响应。
智能决策输出:自动生成审批建议、风险预警或操作指引,提升流程效率。

内容创作赋能

打造媒体内容生产全流程辅助工具:
创意激发与生成:根据关键词自动生成文章大纲、营销文案或脚本初稿。
信息高效提炼:从海量新闻/报告中提取核心观点,生成结构化摘要。
多模态素材处理:语音采访内容自动转写为文字稿,保留语义与情感表达。

全渠道智能客服

构建自动化客户服务体系,覆盖咨询-服务-售后全链路:
咨询即时响应:7×24小时自动回复商品咨询、物流查询等高频问题。
业务自动化办理:订单状态跟踪、退款智能审核,处理耗时缩短80%。
多语种服务支持:覆盖全球主流语言,支持文字/语音双通道交互。
语音交互升级:集成ASR/TTS技术,实现电话客服智能化改造。

产品特点

软硬一体交付,开箱即用

预集成私有化大模型服务平台与高性能硬件集群,为企业提供标准化大模型服务解决方案,省去硬件采购、环境配置、模型调试等环节,实现开机即用;

多模型即插即用,灵活适配

支持LLaMA、Qwen、DeepSeek等多元模型兼容 全系列模型,帮助传统企业快速建立大模型的承载底座,支撑AI应用稳定运行。

高集成设计,极简开发

兼容OpenAI API,方便各种开源工具集成,支持OpenUI等开源工具。助力企业快速构建私有化知识库、日常办工辅助、合同审核、智能客服、辅助开发等常见的AI应用。

专业 服务

提供全流程的技术支持服务,保障落地效果,聚焦垂直领域,构建垂直领域知识库,融合原有系统,打造专属智能体。

配置信息

Ubuntu Server LTSC操作系统
IPMI 2.0 管理接口
支持本地Deepseek,通义千问等模型部署,提供UI交互界面,数据训练模块,多用户权限管理模块,实例负载均衡模块
本地RAG集成

支持GPU到CPUx32传输带宽,比业界x16翻倍,满足CPU与GPU高通信带宽场景要求;
支持32个DDR5内存插槽,最高5600MHz;
支持8卡直通和10卡Switch两种配置,支持多种GPU拓扑,灵活匹配不同应用场景需求;
支持GPU Direct,支持存储/网络 RDMA/GPU P2P 直接传输数据,满足集群部署需求;
超高扩展能力,支持最多15个标准PCIe插槽,可配置8个双宽GPU+7个PCIe标准插卡+1个OCP3.0网卡;
存储配置灵活可选,满足大容量和高性能的本地存储需求,最大支持24个U.2NVMe;
系统关键部件均采用冗余、热插拔设计,同时支持免工具拆装,提升故障维护效率,提升系统的可用性;
集成智能管理芯片,提供开放的管理平台,支持IPMI2.0、Redfish、SNMP等多种管理协议;
支持远程KVM、虚拟媒介、关键部件状态监控、异常报警等各种管理功能,实现了全面的远程系统级智能管理。

Deepseek R1-14B

标准19英寸4RU机架式服务器
GPU:RTX4090*2卡
64GB RECC DDR4内存
单卡24GB显存
≈20tokens/s
支持20+用户同时访问

Deepseek R1-32B

标准19英寸4RU机架式服务器
GPU:RTX4090*4卡
128GB RECC DDR4内存
单卡24GB显存
≈20tokens/s
支持50+用户同时访问

Deepseek R1-70B

标准19英寸4RU机架式服务器
GPU:RTX4090*8卡
256GB RECC DDR5内存
单卡24GB显存
≈20tokens/s
支持70+用户同时访问

Deepseek R1-671B 4-bit 标准量化

标准19英寸4RU机架式服务器
GPU:RTX4090*8卡
512GB RECC DDR5内存
单卡24GB显存
≈10tokens/s
支持10+用户同时访问

Deepseek R1-671B满血版部署

标准19英寸8RU机架式服务器
GPU:H20*8卡
NVIDIA HGX H20 8-GPU SXM 141GB GPU模组
1024GB RECC DDR5内存
单并发20 tokens/秒,支持高并发
原生FP8无精度损失

微信扫码
获取方案报价
13311202006