

2023년과 2024년 AI업계의 화두가 누가 더 거대하고 똑똑한 모델(LLM)을 만드느냐를 겨루는 '모델 전쟁'의 시기였다면, 2025년 현재 업계의 화두는 완전히 달라졌습니다. "당신의 모델은 IQ가 몇입니까?"가 아니라, "당신의 모델은 실제로 일을 할 줄 압니까?"로 바뀐 것입니다.
세계적인 AI 석학 앤드류 응(Andrew Ng) 교수는 "최근 AI의 가장 큰 트렌드는 모델의 성능 향상이 아니라, 에이전트 워크플로우(Agentic Workflow)다"라고 말한 바 있는데요. 단순히 질문에 답하는 챗봇을 넘어, 스스로 계획을 세우고 도구를 사용하여 과업을 완수하는 '워크플로우' 기술이 AI의 생산성을 결정짓는 핵심 변수가 될 것이라는 예측이기도 했습니다.
앤드류 응 “AI는 새로운 전기… 애플리케이션에 기회 있다”
오늘 글에서는 최근 왜 세계 테크 기업들이 더 큰 모델보다 '워크플로우'에 열광하는지, 그리고 이 기술이 가장 까다로운 전문가 영역인 리걸(Legal)분야를 어떻게 혁신하고 있는지 살펴보고자 합니다.
우리는 그동안 AI에게 복잡한 비즈니스 문제를 던져주고는, 엔터키를 누르자마자 완벽한 답이 나오기를 기대했습니다. 이는 마치 사람에게 "지금 바로 내가 물어본 것을 바탕으로 논문을 써내라"고 요청하는 것과 같습니다. 결국 AI가 우리의 기대에 미치지 못하는 결과물을 내놓게 되면서, 우리는 점점 AI에 대해 실망감을 갖기 시작했습니다.
하지만 '워크플로우'를 도입하면 이야기가 달라집니다. AI에게 직관적인 즉답을 강요하는 대신, 단계별로 사고하고 추론할 수 있는 프로세스를 설계해 주는 것입니다.
기존 방식: 질문 → 답변
워크플로우 방식: 질문 → 계획 수립 → 초안 작성 → 웹 검색 및 검증 → 비판적 검토 → 수정 → 답변
실제로 앤드류 응 교수가 인용한 코딩 벤치마크(HumanEval) 결과에 따르면, 구형 모델인 GPT-3.5라도 스스로 코드를 짜고 오류를 수정하는 '성찰' 워크플로우를 적용했을 때, 최신 모델인 GPT-4가 단일 프롬프트로 내놓은 답변보다 더 뛰어난 성과를 보였습니다.

그렇다면 이 워크플로우 기술은 실제 현장에서 어떻게 쓰이고 있을까요? 범용적인 '업무 자동화'시장과 전문 영역인 '법률(Legal)'시장, 두 가지 측면에서 살펴볼 수 있습니다.
일반적인 기업의 업무 자동화에서는 'n8n'과 같은 워크플로우 오케스트레이션 도구가 주목받고 있습니다. n8n은 자체적인 AI를 내장했다기보다는, OpenAI나 Anthropic 같은 강력한 외부 LLM을 슬랙(Slack), 지메일(Gmail), 노션(Notion) 등 실제 업무 도구와 유기적으로 연결(Integration)해주는 역할을 합니다.
예를 들어 '고객 문의 처리' 워크플로우를 짠다면 다음과 같습니다.
[메일 수신 → LLM API 호출하여 내용 분석 및 감정 파악 → 사내 DB 조회 → 답장 초안 작성 → 담당자 승인 요청 → 메일 발송]

과거에는 개발자가 직접 코드를 짜서 연동해야 했던 이 복잡한 과정을, 이제는 n8n이 제공하는 로우코드(Low-code) 기반의 시각적 인터페이스를 통해 구현할 수 있게 되었습니다. 이는 기술적 이해도가 있는 기획자나 마케터라면, AI를 단순 지식 검색 도구가 아닌 실제 비즈니스 프로세스를 굴리는 '엔진'으로 활용할 수 있는 길이 열렸음을 의미합니다.
반면, 법률 분야에서 AI가 뱉어내는 '그럴듯한 거짓말(Hallucination)'은 치명적인 문제가 될 수 있습니다. 때문에 리걸 AI야말로 워크플로우 기술의 가장 강력한 시험대입니다. 오픈AI의 투자를 받은 리걸테크 유니콘 'Harvey'는 변호사와 협업하는 전문 에이전트를 목표로, 변호사의 사고 과정을 '수직적 워크플로우(Vertical Workflow)'로 구현하는 데 앞장서고 있습니다.

Harvey가 지향하는 시스템은 수천 페이지의 M&A 계약서를 검토할 때, 단순히 요약하는 것이 아니라 다음과 같은 정교한 파이프라인을 따릅니다.
[위험 조항 추출 → 조직 표준 계약서와 비교 → 관련 판례 및 법리 검색 → 수정안 제시 → 근거 제공]
이 과정에서 여러 개의 LLM과 시스템이 단계별로 작동하며, 변호사는 각 단계의 결과물을 검토하고 개입할 수 있습니다. 이를 통해 사람이 수일 걸리던 작업을 획기적으로 단축하면서도, 전문가의 검수를 통해 결과물의 신뢰성을 확보하는 구조를 만들고 있습니다.
이제 AI 업계는 특정 도메인, 특히 법률과 같이 고도의 전문성이 요구되는 영역에서는 '전문가의 사고방식을 가장 완벽하게 워크플로우로 설계한 기업'이 시장을 주도할 가능성이 커졌습니다.
기존의 AI는 우리가 완벽한 질문을 던져야만 쓸모있는 답을 내놓았습니다. 하지만 워크플로우 기반 AI는 불완전한 질문에서 시작해 스스로 필요한 정보를 파악하고, 단계별로 작업을 진행하며, 중간중간 사람의 검토를 받아 최종 결과물을 완성합니다. 마치 신입 변호사가 선임 변호사의 가이드를 받으며 일하는 것처럼 말입니다.
따라서 이제 AI 도입의 핵심은 "어떤 AI를 쓸까?"가 아니라 "우리 업무의 워크플로우를 어떻게 AI에게 가르칠까?"가 되어야 합니다.
프롬프트 한 줄로 마법 같은 결과를 기대하는 시대는 끝났습니다. 대신, 업무의 본질을 꿰뚫고 이를 논리적인 단계로 쪼개어 AI에게 위임하는 '프로세스 설계 능력'이 기업의 핵심 경쟁력이 될 것입니다. 그리고 그 가장 진보된 형태의 워크플로우 혁신이 지금 AI 분야에서 일어나고 있습니다.


