Functional View & Building Blocks¶

Application 레이어부터 Cloud·On-prem·Edge 인프라까지 전 계층을 포괄하는 구조입니다. 환경에 맞춰 필요한 컴포넌트부터 점진적으로 확장하거나, 통합 플랫폼으로 한 번에 구축할 수 있습니다.

계층 구조¶

flowchart TB
    subgraph U["Users & Clients"]
        UI["Open WebUI / Self-service portal"]
        APP["Custom apps & agents"]
        WF["Workflow automation (n8n)"]
    end

    subgraph G["Gateway & Guardrails"]
        GW["AI Gateway<br/>(LiteLLM / Kong)"]
        GR["Guardrails AI"]
    end

    subgraph A["Agentic Layer"]
        AG["Agents<br/>(LangGraph / Strands / Agno / OpenClaw)"]
        MCP["MCP Servers (A2A)"]
        VDB["Vector DB / S3 Vectors<br/>(Qdrant / Chroma / Milvus)"]
        MEM["Memory (Mem0)"]
    end

    subgraph M["Model Serving"]
        LLM["Self-hosted LLM<br/>(vLLM / SGLang / Ollama / Ray)"]
        EMB["Embedding (TEI)"]
        DYN["NVIDIA Dynamo Platform"]
        BR["Amazon Bedrock / Nova / SageMaker"]
        EXT["External LLM<br/>(OpenAI / Gemini / Anthropic)"]
    end

    subgraph O["Observability"]
        LF["Langfuse"]
        PHX["Phoenix"]
        ML["MLflow"]
    end

    subgraph I["Compute & Infrastructure"]
        EKS["Amazon EKS / EKS Hybrid Node"]
        GPU["GPU"]
        TRN["Trainium / Inferentia"]
        GRV["Graviton"]
        ALB["ALB + ACM"]
        S3V["S3 Vectors / EFS"]
        IAM["IRSA + Secrets Manager"]
    end

    UI --> GW
    APP --> GW
    WF --> GW
    GW --> GR
    GR --> LLM
    GR --> BR
    GR --> EXT
    GW --> AG
    AG --> MCP
    AG --> VDB
    AG --> MEM
    AG --> LLM
    LLM --> DYN
    GW --> LF
    AG --> LF
    LLM --> PHX
    AG --> ML

    EKS --- GPU
    EKS --- TRN
    EKS --- GRV
    EKS --- ALB
    EKS --- S3V
    EKS --- IAM

빌딩 블록¶

Application Layer¶

Self-service portal — 모델·에이전트에 대한 통합 액세스를 단일 UI에서 제공.
Open WebUI / Custom Applications / n8n — 사용자와 워크플로우 자동화가 게이트웨이를 통해 동일한 진입점을 사용.

Gateway & Guardrails¶

LiteLLM — OpenAI 호환 프록시, multi-provider routing.
Kong AI Gateway OSS — Kong 기반 AI 플러그인.
Guardrails AI — 정책 강제 및 안전 가드.

Agentic Layer¶

LangGraph / Strands / Agno / OpenClaw — 에이전트 워크플로우 프레임워크. 코드 레벨에서 완전 제어.
MCP Servers — Model Context Protocol을 통해 도구를 서비스로 노출 (Calculator MCP).
Vector DB / S3 Vectors / Memory(Mem0) — RAG와 장기 메모리.

Model Serving¶

자체 호스팅: vLLM, SGLang, TGI, Ollama, TEI.
AWS 관리형: Amazon Bedrock, Nova, SageMaker.
외부 LLM: OpenAI, Gemini, Anthropic — 동일 게이트웨이로 라우팅.
고도화 경로: NVIDIA Dynamo Platform (KV-cache routing, AIPerf, AIConfigurator).

Observability¶

Langfuse — LLM·에이전트 트레이싱, 세션·태그 단위 분석.
Phoenix — 평가·모니터링.
MLflow — 실험 추적.

Compute & Infrastructure¶

Amazon EKS / EKS Hybrid Node — AWS Cloud와 온프레미스를 하나의 클러스터로 통합.
이기종 컴퓨트 — Workload별 GPU / Trainium / Inferentia / Graviton 조합.
ALB + ACM, S3 Vectors / EFS, IRSA + Secrets Manager — 프로덕션-grade 디폴트.

구성 모델¶

모든 컴포넌트는 다음 머지 순서로 구성을 읽습니다.

.env -> config.json -> .env.local -> config.local.json

CLI 서브커맨드는 머지된 결과를 입력으로 Handlebars 템플릿을 *.rendered.yaml로 렌더링한 뒤 적용합니다. 모든 카테고리에서 동일한 패턴을 사용하므로, 한 컴포넌트를 이해하면 나머지도 같은 방식으로 동작합니다.

자세한 스키마는 Configuration을 참고하세요.

배포 형태¶

Demo setup — ./cli demo-setup 으로 큐레이션된 스택을 병렬 설치 (openwebui는 litellm 이후 등 명시적 의존성 적용). Quick Start
Interactive setup — ./cli interactive-setup 으로 카테고리별 컴포넌트 선택. 둘 다 동일한 클러스터 형태를 산출합니다.

Use Cases Get Started