MS 빌드 2026 총정리: UI를 직접 조작하는 '컴퓨터 조작 에이전트'와 조직을 혁신할 'Work IQ' API 가이드
- 공유 링크 만들기
- X
- 이메일
- 기타 앱
마이크로소프트는 연례 개발자 컨퍼런스인 MS Build 2026을 통해 기업 내 모든 정보와 인적 리소스를 유기적으로 제어하는 지능형 엔터프라이즈 자동화 아키텍처를 제시했습니다. 그 핵심 축은 2026년 6월 16일 정식 출시(GA) 예정인 '마이크로소프트 Work IQ' 플랫폼과 화면 픽셀을 이해하고 마우스를 직접 조작하는 Copilot Studio의 '컴퓨터 조작 에이전트(Computer-Using Agents)' 기능입니다.
보도자료 복사 수준의 설명에서 벗어나, 기술적인 아키텍처 원리와 실제 활용 시나리오, 그리고 비용 분석 가이드까지 종합적으로 다룹니다.
---
1. Microsoft Work IQ의 3단계 작동 아키텍처
Work IQ는 단순한 데이터 수집용 대시보드가 아닙니다. 사내에 흩어져 있는 메일, 메신저 대화, ERP 로그, 오피스 문서들의 실시간 데이터 흐름을 추적해 업무 병목을 스스로 진단하고 워크플로우를 자동 구성하는 인텔리전스 인프라입니다.
┌─────────────────┐ ┌───────────────────────┐ ┌─────────────────────────┐
│ 1. 데이터 수집 │ ───> │ 2. 메모리 그라운딩 │ ───> │ 3. 추론 및 실행 │
│ (Microsoft Graph│ │ (데이터 벡터화/연동) │ │ (자율 워크플로우 실행) │
└─────────────────┘ └───────────────────────┘ └─────────────────────────┘
- 데이터(Data) 수집 단계: Microsoft Graph API를 이용해 사내 메신저(Teams), 오피스 메일(Outlook), 결재 시스템 등의 비정형 텍스트와 파일 로그를 실시간 크롤링하여 동적으로 피드를 쌓습니다.
- 메모리(Memory) 그라운딩 단계: 수집된 텍스트와 조직 관계도를 의미 단위로 매핑하여 엔터프라이즈 지식 그래프에 그라운딩(Grounding)하고 벡터 메모리에 색인합니다.
- 추론(Inference) 단계: 지식 그래프를 기반으로 특정 부서의 프로젝트 지연 사유를 파악하고, 스스로 병목을 해결할 조치(Action Item)를 수립하여 담당 에이전트들에게 처리를 자동 배분합니다.
이와 같은 대형 비즈니스 추론 계층에 맞선 엔지니어 타겟의 독자 도구로는 앤트로픽의 터미널 코딩 에이전트 Claude Code 사용 가이드가 있으며, 두 플랫폼은 개발자 영역(CLI)과 전사 사무 영역(GUI)에서 확실한 대비를 이루고 있습니다.
---
2. Copilot Studio 컴퓨터 조작 에이전트와 레거시 ERP 자동화
기존의 RPA(로봇 프로세스 자동화)나 API 기반 시스템은 조금만 화면 레이아웃이 바뀌거나 API가 없는 구형(Legacy) 소프트웨어 환경에서는 무용지물이었습니다.
하지만 Copilot Studio 컴퓨터 조작 에이전트(Computer-Using Agents)는 픽셀(Pixel) 단위로 운영체제 화면 이미지를 캡처하고, 자체 Vision-Language 모델이 요소들의 위치를 인지하여 사람이 마우스를 클릭하고 타자를 입력하는 행동을 컴퓨터 하드웨어 이벤트로 직접 자율 재현합니다.
💡 레거시 회계 ERP 등록 자동화 시나리오 예제:
- 자연어 명령: "이번 달 정산 엑셀 파일을 읽고, 15년 전에 설치한 회사 내부 회계 ERP 프로그램의 거래처 등록 메뉴에 각각 주소와 사업자 번호를 입력해 줘."
- 에이전트 작동 프로세스:
- 캡처 및 좌표 매핑: 엑셀 파일을 파싱하여 내부 데이터 테이블을 추출하고, 바탕화면에 띄워진 구형 ERP 창을 주기적으로 이미지 캡처하여 각 입력 필드의 픽셀 좌표를 도출합니다.
- 마우스 이동 및 클릭: 마우스 포인터를 해당 필드 위치로 이동시키고 실시간 마우스 클릭 이벤트를 생성합니다.
- 키보드 입력: 회사명과 사업자번호 텍스트 스트링을 입력단에 직접 입력하고 저장 단축키(Alt+S)를 누른 뒤 정상 저장 완료 팝업을 인식할 때까지 루프를 돌며 이를 반복 수행합니다.
이처럼 강력한 클라우드 및 OS 통제 능력은 클라우드 기업과의 전략적 인프라 파트너십으로 이어지고 있으며, 대표적으로 KT의 Microsoft 동맹 기반 에이전틱 패브릭 B2B 플랫폼을 통해 국내 대기업들의 ERP 현대화 서비스에 이 아키텍처가 빠르게 공급되고 있습니다.
---
3. Copilot Studio 가격 정책 및 라이선스 모델
기업 도입 시 가장 큰 걸림돌이 될 수 있는 Copilot Studio 가격 구조를 명확히 짚어봅니다.
- 기본 요금: 테넌트(Tenant)당 월 $200 기본 라이선스 비용이 청구됩니다. 이 비용에는 월 2,000회의 AI 메시지 호출(Run) 크레딧이 기본 포함됩니다.
- 추가 메시지 팩: 월 2,000회를 초과하는 트래픽에 대해서는 1,000회 추가 메시지당 별도 요금이 종량 청구됩니다.
- 컴퓨터 조작 에이전트 프리미엄 요금: 일반적인 텍스트 응답과 달리 컴퓨터 화면을 픽셀 이미지로 지속 분석하고 마우스를 이동시키는 컴퓨터 조작 에이전트를 가동할 시, 1회 명령 세션당 일반 메시지의 수십 배에 달하는 'AI Consumption Credit'이 급격히 소모됩니다.
따라서 단순히 엑셀 파일을 파싱하거나 텍스트를 분류하는 기본 작업은 가격이 저렴한 자체 경량화 모델로 로컬에서 해결하고, 화면을 직접 눈으로 보고 제어해야 하는 복잡한 레거시 ERP 자동화 작업에만 Copilot Studio 컴퓨터 조작 에이전트를 매칭하는 설계가 필요합니다.
---
4. 요약
마이크로소프트의 Work IQ와 Copilot Studio의 진화는 코드가 필요 없는 '자율 컴퓨터 조작 시대'를 알리고 있습니다. 전사 오피스 데이터는 Work IQ로 지식 그래프를 구성하고, API가 없는 단절된 시스템은 컴퓨터 조작 에이전트의 픽셀 조작 기술을 접목하여 완벽한 디지털 트랜스포메이션을 실현하십시오.
- 공유 링크 만들기
- X
- 이메일
- 기타 앱