CoreAI · Mar 2024 — Present

AI Toolkit for VS Code

“让 AI 智能体开发快速且愉悦”

VS Code 市场 GitHub

1M+

Installs

Model Providers

Core Features

30+

Contributors

问题陈述

AI 开发碎片化且效率低下

构建生产级 AI 智能体需要在多种工具、平台和工作流之间来回切换。开发者在模型提供商、测试环境和部署流水线之间浪费了大量时间。

模型发现

找到合适的模型意味着要浏览数十个独立的提供商门户，在不同格式间比较规格，并手动测试每个候选模型。

工具碎片化

开发者需要在用于提示的 Web UI、用于编码的独立 IDE、用于部署的终端工具和用于评估的独立仪表板之间来回切换。

智能体调试

多步骤智能体工作流如同黑盒。当智能体失败时，无法设置断点、检查中间状态或追踪执行流程。

部署阻力

从可用原型到生产环境需要手动配置基础设施、独立的 CI/CD 流水线以及深厚的云平台专业知识。

用户画像

核心用户

AI 应用开发者

将 AI 能力集成到生产应用中的全栈开发者。熟悉编码，但需要快速迭代提示词、评估模型质量并交付可靠的智能体。

在一个地方测试来自多个提供商的模型
不离开 VS Code 即可构建和调试智能体
以最少的配置部署到云端

次要用户

机器学习工程师

专注于模型优化和微调。需要工具来为特定领域任务定制开源模型，并在不同硬件目标（CPU、GPU、NPU）上进行性能基准测试。

使用 QLoRA 在本地 GPU 或云端微调模型
转换和量化模型以便边缘部署
在不同执行提供程序间分析推理性能

扩展用户

公民开发者

产品经理、设计师或领域专家，希望在不编写代码的情况下快速原型化 AI 功能。需要可视化、低门槛的工具来快速验证想法。

使用无代码构建器创建基于提示词的智能体
使用自然语言反馈迭代提示词
导出生产就绪代码交付给工程团队

用户旅程

从创意到已部署的 AI 智能体

发现

浏览模型目录，从 9 个以上的提供商中查找模型。并排比较能力、定价和延迟。

痛点: 需要逐一访问每个提供商门户

原型

在 Playground 中使用多模态输入测试模型。使用 Agent Builder 编写提示词并接入 MCP 工具。

痛点: 没有统一的地方来迭代提示词和工具

构建与调试

使用完整的 IntelliSense 编写智能体代码。按 F5 启动 Agent Inspector，支持断点和工作流可视化。

痛点: 智能体工作流不透明且难以调试

评估与部署

使用内置指标运行批量评估。一键部署到 Microsoft Foundry 并启用追踪。

痛点: 测试和部署使用不同的工具链

用户故事

As AI 应用开发者

I want to 在单一界面中比较来自 OpenAI、Anthropic 和开源提供商的模型

So that 无需在提供商门户之间切换即可为我的场景选择最佳模型。

As 产品经理

I want to 使用可视化无代码构建器构建和测试基于提示词的智能体

So that 在投入工程资源之前验证 AI 功能创意。

As 机器学习工程师

I want to 使用 QLoRA 在我的领域数据集上微调开源模型

So that 提高企业专有词汇和工作流的准确率。

As 平台工程师

I want to 使用断点和执行追踪调试多智能体工作流

So that 在问题到达生产环境之前定位智能体失败原因并修复。

As Windows 开发者

I want to 转换和优化模型以便在 Copilot+ PC 上实现 NPU 加速

So that 无需依赖云即可提供快速的离线 AI 体验。

功能特性

Core

模型目录

跨 Microsoft Foundry、GitHub、Hugging Face、ONNX、Ollama、OpenAI、Anthropic、Google 和 NVIDIA NIM 的统一模型发现。并排比较和一键进入 Playground。

9 个以上集成的模型提供商

Agent Builder

用于创建提示词智能体的无代码可视化界面。支持自然语言提示工程、"Inspire Me" 生成、MCP 工具集成和结构化输出。

几分钟内从零到智能体

Core

Agent Inspector

AI 智能体的完整 F5 调试，支持断点、实时流式可视化、多智能体工作流图和一键代码导航。

一流的调试器集成

Performance

模型评估

使用内置指标（F1、相关性、相似度、连贯性）和自定义评估器进行批量评估。"评估即测试"，实现 CI 风格的质量关卡。

量化的模型质量

微调

通过 Azure Container Apps 使用 QLoRA 在本地 GPU 或云端自定义模型。支持 Phi、Llama、Mistral、DeepSeek 及面向 Copilot+ PC 的 NPU 优化变体。

本地 GPU + 云端训练

一键部署

从 VS Code 直接将智能体部署到 Microsoft Foundry。内置追踪和性能分析，支持跨 CPU、GPU 和 NPU 的生产环境监控。

从 VS Code 到生产环境一键完成

技术架构

User Interface

VS Code Extension

TypeScript + React

Webview UI

React Components

Extension Tree View

VS Code API

↓

Commands, events, state

Application Services

Agent Builder

Prompt Engineering

Agent Inspector

F5 Debugger

Model Playground

Interactive Chat

↓

API calls, inference requests

Backend Agents

Inference Agent

C# / .NET 8+

Workspace Agent

C# / .NET 8+

MCP Server

Tool Integration

↓

Model requests, tool calls

Model Providers

Microsoft Foundry

Cloud Models

GitHub Models

Open Source

Ollama / ONNX

Local Inference

OpenAI / Anthropic

3rd Party APIs

↓

Deployment, monitoring

Infrastructure

Microsoft Foundry

Cloud Deploy

Azure Container Apps

Fine-Tuning

Windows ML / NPU

Edge Runtime

TypeScriptReactC# / .NET 8+ONNX RuntimeCUDA / NPUMCP ProtocolQLoRADocker / WSL2AzureVS Code API

跨平台覆盖

通过 VS Code 在 Windows、macOS 和 Linux 上运行。本地推理支持 CPU、GPU (CUDA) 和 NPU 硬件加速，适用于 Copilot+ PC，支持离线 AI 场景。

提供商无关

单一界面抽象了 9 个以上的模型提供商。开发者可以在云端模型和本地模型之间切换而无需修改智能体代码，减少供应商锁定。

全生命周期覆盖

从模型发现到微调、评估、调试和云部署 -- 整个 AI 开发生命周期都在开发者日常使用的编辑器中完成。

AI Toolkit for VS Code

问题陈述

AI 开发碎片化且效率低下

模型发现

工具碎片化

智能体调试

部署阻力

用户画像

AI 应用开发者

机器学习工程师

公民开发者

用户旅程

从创意到已部署的 AI 智能体

发现

原型

构建与调试

评估与部署

用户故事

功能特性

模型目录

Agent Builder

Agent Inspector

模型评估

微调

一键部署

技术架构

跨平台覆盖

提供商无关

全生命周期覆盖

相关项目

Microsoft 365 Agents Toolkit