CoreAI · Mar 2024 — Present
AI Toolkit for VS Code
“让 AI 智能体开发快速且愉悦”

问题陈述
AI 开发碎片化且效率低下
构建生产级 AI 智能体需要在多种工具、平台和工作流之间来回切换。开发者在模型提供商、测试环境和部署流水线之间浪费了大量时间。
模型发现
找到合适的模型意味着要浏览数十个独立的提供商门户,在不同格式间比较规格,并手动测试每个候选模型。
工具碎片化
开发者需要在用于提示的 Web UI、用于编码的独立 IDE、用于部署的终端工具和用于评估的独立仪表板之间来回切换。
智能体调试
多步骤智能体工作流如同黑盒。当智能体失败时,无法设置断点、检查中间状态或追踪执行流程。
部署阻力
从可用原型到生产环境需要手动配置基础设施、独立的 CI/CD 流水线以及深厚的云平台专业知识。
用户画像
AI 应用开发者
将 AI 能力集成到生产应用中的全栈开发者。熟悉编码,但需要快速迭代提示词、评估模型质量并交付可靠的智能体。
- 在一个地方测试来自多个提供商的模型
- 不离开 VS Code 即可构建和调试智能体
- 以最少的配置部署到云端
机器学习工程师
专注于模型优化和微调。需要工具来为特定领域任务定制开源模型,并在不同硬件目标(CPU、GPU、NPU)上进行性能基准测试。
- 使用 QLoRA 在本地 GPU 或云端微调模型
- 转换和量化模型以便边缘部署
- 在不同执行提供程序间分析推理性能
公民开发者
产品经理、设计师或领域专家,希望在不编写代码的情况下快速原型化 AI 功能。需要可视化、低门槛的工具来快速验证想法。
- 使用无代码构建器创建基于提示词的智能体
- 使用自然语言反馈迭代提示词
- 导出生产就绪代码交付给工程团队
用户旅程
从创意到已部署的 AI 智能体
发现
浏览模型目录,从 9 个以上的提供商中查找模型。并排比较能力、定价和延迟。
痛点: 需要逐一访问每个提供商门户
原型
在 Playground 中使用多模态输入测试模型。使用 Agent Builder 编写提示词并接入 MCP 工具。
痛点: 没有统一的地方来迭代提示词和工具
构建与调试
使用完整的 IntelliSense 编写智能体代码。按 F5 启动 Agent Inspector,支持断点和工作流可视化。
痛点: 智能体工作流不透明且难以调试
评估与部署
使用内置指标运行批量评估。一键部署到 Microsoft Foundry 并启用追踪。
痛点: 测试和部署使用不同的工具链
用户故事
As AI 应用开发者
I want to 在单一界面中比较来自 OpenAI、Anthropic 和开源提供商的模型
So that 无需在提供商门户之间切换即可为我的场景选择最佳模型。
As 产品经理
I want to 使用可视化无代码构建器构建和测试基于提示词的智能体
So that 在投入工程资源之前验证 AI 功能创意。
As 机器学习工程师
I want to 使用 QLoRA 在我的领域数据集上微调开源模型
So that 提高企业专有词汇和工作流的准确率。
As 平台工程师
I want to 使用断点和执行追踪调试多智能体工作流
So that 在问题到达生产环境之前定位智能体失败原因并修复。
As Windows 开发者
I want to 转换和优化模型以便在 Copilot+ PC 上实现 NPU 加速
So that 无需依赖云即可提供快速的离线 AI 体验。
功能特性
模型目录
跨 Microsoft Foundry、GitHub、Hugging Face、ONNX、Ollama、OpenAI、Anthropic、Google 和 NVIDIA NIM 的统一模型发现。并排比较和一键进入 Playground。
9 个以上集成的模型提供商
Agent Builder
用于创建提示词智能体的无代码可视化界面。支持自然语言提示工程、"Inspire Me" 生成、MCP 工具集成和结构化输出。
几分钟内从零到智能体
Agent Inspector
AI 智能体的完整 F5 调试,支持断点、实时流式可视化、多智能体工作流图和一键代码导航。
一流的调试器集成
模型评估
使用内置指标(F1、相关性、相似度、连贯性)和自定义评估器进行批量评估。"评估即测试",实现 CI 风格的质量关卡。
量化的模型质量
微调
通过 Azure Container Apps 使用 QLoRA 在本地 GPU 或云端自定义模型。支持 Phi、Llama、Mistral、DeepSeek 及面向 Copilot+ PC 的 NPU 优化变体。
本地 GPU + 云端训练
一键部署
从 VS Code 直接将智能体部署到 Microsoft Foundry。内置追踪和性能分析,支持跨 CPU、GPU 和 NPU 的生产环境监控。
从 VS Code 到生产环境一键完成
技术架构
跨平台覆盖
通过 VS Code 在 Windows、macOS 和 Linux 上运行。本地推理支持 CPU、GPU (CUDA) 和 NPU 硬件加速,适用于 Copilot+ PC,支持离线 AI 场景。
提供商无关
单一界面抽象了 9 个以上的模型提供商。开发者可以在云端模型和本地模型之间切换而无需修改智能体代码,减少供应商锁定。
全生命周期覆盖
从模型发现到微调、评估、调试和云部署 -- 整个 AI 开发生命周期都在开发者日常使用的编辑器中完成。
相关项目

Microsoft 365 Agents Toolkit
面向 Microsoft 365 构建的企业开发者面临着碎片化的 SDK、复杂的认证配置以及每个新项目的手动云端配置。Agents Toolkit 简化了整个生命周期 -- 脚手架、调试、部署和发布 -- 服务于 Teams、Copilot 和 Outlook 上超过 2 万名月活跃开发者。
查看案例