mirror of https://github.com/microsoft/SkillOpt.git synced 2026-07-05 15:27:51 +08:00

Files

CharlesYang030 244e346b83 SkillOpt v0.1.0: initial release

- Skill optimization framework with training loop analogy
- 11 benchmarks, 4 model backends (Azure OpenAI, Claude, Codex, Qwen)
- WebUI for browser-based training control
- Pluggable architecture for extending benchmarks and backends

2026-05-21 17:22:04 +00:00

1.5 KiB

Raw Blame History

API Reference

Core Classes

`EnvAdapter`

Abstract base class for benchmark environments.

class EnvAdapter(ABC):
    async def execute(self, item, skill, model) -> TaskResult
    def evaluate(self, prediction, ground_truth) -> float
    def build_prompt(self, item, skill) -> str

`DataLoader`

Abstract base class for data loading and splitting.

class DataLoader(ABC):
    def setup(self, cfg: dict) -> None
    def get_split_items(self, split: str) -> list[DataItem]

`ModelBackend`

Abstract base class for LLM backends.

class ModelBackend(ABC):
    async def generate(self, messages, **kwargs) -> ModelResponse
    async def generate_with_tools(self, messages, tools, **kwargs) -> ModelResponse

`Trainer`

Main training loop orchestrator.

class Trainer:
    def __init__(self, cfg: dict)
    async def train(self) -> TrainResult
    async def evaluate(self, skill: str, split: str) -> EvalResult

Data Classes

`DataItem`

@dataclass
class DataItem:
    id: str
    input: str
    ground_truth: str
    metadata: dict = field(default_factory=dict)

`TaskResult`

@dataclass
class TaskResult:
    item_id: str
    prediction: str
    score: float
    trajectory: list[dict]

`ModelResponse`

@dataclass
class ModelResponse:
    content: str
    usage: dict
    model: str

For detailed source code, see the skillopt/ directory.

1.5 KiB Raw Blame History

API Reference

Core Classes

EnvAdapter

DataLoader

ModelBackend

Trainer