강의 요청하기 IR피칭덱 작성 가이드(무료)

AI 스타트업, AI 비즈니스 옥석 가리기 (The AI Startup Litmus Test)

2023. 5. 12. 09:50

요즘 가장 화두가 되고 있는 키워드 중 하나를 꼽으라면 단연 AI, 그 중에서도 생성형 AI(Generative AI)라고 할 수 있다. 작년 말 ChatGPT가 나왔을 때 글쓴이를 비롯한 대부분 사람이 받았을 인상은 아마 충격 그 자체였을 것이다. 마치 사람과 채팅하듯한 궁금한 것에 대해 답을 얻거나 새로운 무언가를 금방 금방 창조해내는 모습에서 AI Chatbot에 대한 선입견을 완전히 깨버리는 계기가 됐다. 

 

그리고 올 초부터 'AI'를 타이틀로 하는 무수한 스타트업 혹은 기존의 비즈니스에 AI를 추가하여 새롭게 브랜딩하는 스타트업들을 주변에서 많이 볼 수 있었다. 이제는 AI라는 얘기만 나와도 벌써 식상할 정도로 AI가 핫하고 굉장히 유행인데, 이런 현상이 비단 우리나라에서만 나타나는 것은 아닌 것 같다.

 

이런 상황에서 오늘 아침 우연히 메일함을 보다가 눈에 띄는 글을 하나 발견했는데, 그 내용도 굉장히 공감가는 바가 많아서 이 자리를 빌어 공유하고자 한다.

 

https://www.nfx.com/post/ai-startup-litmus-test 

 

The AI Startup Litmus Test

Differentiation is critical for Generative AI startups. Use the AI Litmus Test to determine if your company is unique, hard and defensible.

www.nfx.com

 

Marketplace와 Network Effect를 활용할 수 있는 다양한 스타트업에 투자하는 VC인 NfX에서 등록된 아티클로 제목부터 굉장히 강렬하다. 

 

'The AI Startup Litmus Test'

 

강렬한 제목만큼이나 AI 스타트업을 판단해야 하는 심사역이나 혹은 AI 스타트업을 운영하고 있는/준비하고 있는 창업자에게 짧지만 강력한 인사이트를 주고 있는 글이다. 이런 좋은 글을 읽고 드는 생각을 본 포스팅에서 한 번 정리해보고자 한다. 글에 대한 전문은 위의 링크를 참조하시면 된다.

 

지금은 그 어느 때보다 AI를 쉽게 활용할 수 있는 시대라고 한다. AI라는 강력한 도구를 보다 쉽게 사용할 수 있게 되면서 이전에는 불가능했거나 빠르게 확장할 수 없었던 비즈니스 아이디어를 구현하고 심지어 높은 ROI를 올릴 수 있는 투자 대상으로 전환될 수 있게 됐다. 기존 기업도 AI를 활용하여 본래 하던 일을 더 효율적으로 효과적으로 할 수 있게 됐다. 

 

하지만 언제나 밝은 면이 있으면 어두운 면이 있듯이 도구로써 AI의 진입장벽이 낮아진 데에 부작용도 존재한다. 바로 선별해야 할 쓰레기도 많이 생겨나고 있다는 점이다(너도 나도 AI...).

 

예전에 공유경제가 한창 유행했을 때 수많은 'Uber for X' 기반의 스타트업이 나타났다(우리나라에서는 '우리는 XX을 위한 배달의민족입니다'). 하지만 이제는 'ChatGPT for X'를 표방하는 스타트업이 우후죽순 늘어나고 있다는 것이다. 이런 상황에서 내가 판단해야 하는 AI스타트업이 타당한 비즈니스 모델과 매력적인 기회를 지니고 있는지를 판단하기 위해서 참조 아티클의 저자는 ChatGPT for X에서 AI부분(ChatGPT)은 잠시 무시하고 'X'에 집중하라고 조언한다. 실제 비즈니스는 ChatGPT for X가 아니라 X이다. X라는 비즈니스 자체가 매력적인 시장 규모를 지니고 있는지, 고객이 현재 불만족하고 있는지, 주요 경쟁자는 누구 있는지 비즈니스 자체의 매력을 살펴봐야 한다. 

 

비즈니스 자체가 매력적이라면 이제 무엇을 봐야 할까?

이에 대해 참조 아티클에서는 2가지 핵심 질문을 제시하고 있다.

 

1) (AI가 만들어내는 산출물에 대해) 요구되는 정확도의 수준이 어디에 위치하고 있는가?

2) AI 파이프라인의 어떤 차별점이 있는가?

 

각 질문에 대한 보다 구체적인 내용을 정리해보겠다.

 

1) (AI가 만들어내는 산출물에 대해) 요구되는 정확도의 수준이 어디에 위치하고 있는가?

AI가 가미된 제품은 고객을 위해 무언가 산출물을 만들고 제시할 것이다. 이때 AI가 만들어낸 산출물이 실제 얼마나 정확해야 의미가 있는지를 판단해보는 것이다. 요구하는 정확도의 수준이 높을수록 구현하기 힘들고 상용화가 힘들 것이다. 하지만 정말 고객을 만족시킬 수 있을 정도의 정확도를 가져갈 수 있다면 일종의 진입 장벽으로 플레이어에게 해자(Moat)를 제공할 것이다. 대표적인 사례로는 특정 질병을 진단하는 AI 제품을 들 수 있겠다. 암을 진단해야 하는데 정확도가 95%밖에 되지 않는다면?? 의사가 보조적으로 쓰는 도구로써는 가치가 있겠지만, 오롯이 이 제품만으로 암을 진단해야 한다면, 실제 적용하기에 무리가 있을 것이다.

 

반면 요구하는 정확도가 높지 않은 '창조'의 영역에서는 어떨까요? 우리가 ChatGPT의 정확도를 얘기하면서 언급하는 '세종대왕 맥북 던짐 사건'이라는 AI 할루네이션(hallucination) 현상이 높은 정확도를 요구하는 영역에서는 리스크로 작동하겠지만, 의외의 창조성이 중요한 영역에서는 오히려 장점으로 작용할 수 있다. 만약 AI 스타트업의 목표로 하는 비즈니스 도메인이 산출물에 대해 요구되는 정확도가 높지 않는다면, 당장 비즈니스가 가능한 영역이라고 판단할 수 있겠다. 다만 이 경우에는 진입장벽은 그리 높지 않을 수 있다. 

 

2) AI 파이프라인의 어떤 차별점이 있는가?

MS(or Open AI), 구글, 네이버와 같은 대기업은 독창적인 인공지능 모델을 구축하고 무수한 투자를 통해 학습할 수 있다. 하지만 비교적 자원이 한정된 스타트업은 대기업과 똑같은 행보로 독창적인 모델을 구축할 수 없다. 그렇기 때문에 현실적으로 기존에 공개되서 활용할 수 있는 AI모델을 중심으로 특정 영역에서 보다 최적화하여 가치제안을 창조하고 전달할 수 밖에 없다.

 

결국 기초가 되는 AI모델보다는 AI 모델을 기반으로 총체적인 고객경험에 차별화를 줘야 하는데, 차별적 고객 경험의 기본이 되는 것이 바로 'AI 파이프라인(AI Pipeline)'이다. AI 파이프라인이란 AI모델을 활용하여 고객에게 최종 가치를 전달하는 전반적인 프로세스를 의미한다. 그 안에는 흔히 데이터 수집, 데이터 정리, 전처리, 모델링, 배포 등의 단계를 거친다. 

 

스타트업은 기본적으로 공개된 기본 AI모델을 사용하기 때문에 모델 자체보다는 해당 모델을 활용하는 프로세스에서 차별적 경쟁우위를 만들 수 있어야 한다. AI 파이프라인을 차별화하는 예시에 대해 참조 아티클에서는 아래와 같이 제시하고 있다.

- GPT3의 컨텍스트 창에 제공할 정보를 요약하는 GPT Neox(공개 AI모델 중 하나)와 같이 적합한 작업에 적합한 기본 모델을 선택하면 성능과 인프라 비용을 최적화할 수 있음
- 맞춤형 임베딩을 통해 엔지니어링 및 전처리 데이터를 신속하게 처리하여 특정 세대 작업의 성능을 크게 향상시킬 수 있음
- 후처리 결과를 통해 ODD(Operation Domain Design)의 한계를 강화할 수 있음
- 특정 데이터 세트에 맞게 기본 모델을 미세 조정하여 고유한 성능을 얻을 수 있음
- 엔드 투 엔드 검증 파이프라인을 지원하는 강력한 인프라를 통해 신속한 테스트, 반복 및 개선이 가능한 파이프라인을 회사의 파이프라인에 구축할 수 있음

 

AI 스타트업, 그리고 AI 비즈니스의 옥석을 가릴 수 있는 2가지 핵심 인사이트를 제시하는 동시에 이제 막 AI를 도구로 새로운 비즈니스 모델을 만들고자 하는 창업자, 창업팀에게 유용한 하나의 조언을 제시하고 있다. 그 조언은 초반부터 너무 유명인사를 영입하는데 시간, 노력, 자원을 쓰지 말라는 것이다!

 

AI 파이프라인을 차별화하는데 있어서 대부분의 경우 당장 ML엔지니어가 필요로 하지 않는다. 그렇기 때문에 처음부터 너무 무리하게 고급 AI전문가를 영입할 필요가 없다는 말이다(물론 초기 시장 검증 이후 대규모 서비스 제공을 위해서는 인프라부터 고민하고 설계할 전문 엔지니어 팀이 필요하다고 생각한다).

 

마지막으로 AI 비즈니스 아이디어, AI 비즈니스 모델의 가능성, 타당성을 점검할 수 있는 리트머스 용지와 같은 질문들은 다음과 같다.

1. ChatGPT, Bard와 같은 기본 모델이 우리 제품을 근시일 내 대체가능한가? (대체 불가능해야 한다)
   -> 기본 모델만으로 동일한 산출물을 낼 수 없는 우리만의 독창적인 AI 파이프라인이 존재하는가?

2. 제품을 쉽게 카피할 수 없는가? (카피할 수 없어야 한다)
   -> 우리 팀과 동일한 고객 문제 해결에 대한 인사이트가 있는 다른 사람이 기본 모델을 활용하여 유사하게 제품을 만들 수 있는가?
   -> 제품의 차별화는 어디에서 기인하는가? (AI 파이프라인 or 고객 경험 or 비즈니스 모델)

3. 제품을 제대로 작동하려면 고객에게 얼마나 자주 정확한 답을 제공해야 하는가? (원문의 질문자체가 모호하지만, 개인적으로 고객이 제품을 사용하는 빈도 or 요구되는 정확도 수준에 대한 진단 질문으로 해석. 구현만 할 수 있다면 빈도가 높을수록, 요구되는 정확도의 기준이 높을수록 보다 경쟁우위가 있다고 판단)
   -> ODD를 어떻게 정의하고 알려진 무지(Known Unknowns)와 알려지지 않은 불확실함(Unknown Unknowns)을 중심으로 가드레일을 구축하고 있는가?
   -> AI 모델의 정확도를 어떻게 측정할 수 있는가?

4. 고객이 ChatGPT(or Bard)를 사용한다면, 우리 제품이 수행하는 과업과 동일한 과업을 수행하기 위해 얼마나 많은 시간이 걸리는가? (많은 시간이 걸리거나 불가능해야 한다)
   -> 올바른 프롬프트만 입력할 수 있으면 ChatGPT에서도 유사한 산출물을 낼 수 있는 것인가?

5. AI 파이프라인의 변경으로 제품이 개선되었는지 어떻게 검증하며, 그 검증에는 얼마나 걸리는가? (검증할 수 있고 그 시간이 짧아야 한다)
  -> 개선 사항을 측정하기 위해 어떤 지표를 사용하고 있으며, 어떤 내재적 편향이 있는가??
  -> 검증 프로세스가 수동인가 or 자동인가? 
  -> 프로세스가 자동화된 경우, 유효성 검사 파이프라인에 의미론적 의미가 있는가? or 지표가 변경될 때 그 이유가 명확한가?

6. 비즈니스를 수행하기에 적합한 팀인가? (적합해야 한다)
   -> 고객을 얼마나 잘 알고 이해하고 있는가?
   -> 머신러닝 인프라를 구축하고 최적화한 경험이 있는가?
   -> AI 모델의 강점과 약점을 평가하고 테스트하는 방법을 이해하고 있는가?

 

아티클의 전반적인 내용이 AI 스타트업을 평가하는 입장에서 어떤 부분을 살펴봐야 할 지 알려주는 어조였지만, 개인적으로 이 내용은 AI를 핵심 또는 요소 기술로 비즈니스에 접목하고자 하는 창업자에게 더 의미있는 내용이라고 생각한다. 무작정 FOMO에 빠져서 AI를 도입하는 것이 아니라, AI가 우리의 비즈니스 모델의 펀더멘털 향상에 어떤 기여를 할 수 있을지 단기적, 그리고 장기적 관점에서 고려하도록 도와주는 질문들이 위의 핵심 성찰 질문 및 리트머스 질문들이 아닐까 생각한다. 왜냐하면 새로운 제품을 창조하고 고객에게 전달하는 스타트업이 실패했을 때 가장 큰 손실을 입는 주체가 창업자(팀)이기 때문에 가장 신중하게 의사결정을 해야 한다고 생각한다.

 

이상 AI 스타트업을 판단해야 하거나 AI 제품을 준비하는 창업자에게 조금이나마 도움이 되길 바라며, NfX의 'The AI Startup Litmus Test'라는 글을 읽고 핵심 내용에 개인적인 생각과 의견을 정리한 포스팅을 마무리하고자 한다. 

 

 

- 끝 -

린스프린트 김정수 대표 / jskim@leansprint.kr

 

린스프린트(LeanSPRINT)는 액셀러레이터, 사내벤처 운영부서를 위한 초기 스타트업 프로그램을 제공합니다.

 - 린스프린트 홈페이지 : http://leansprint.kr

 - 린스프린트 초기 스타트업 프로그램 : https://bit.ly/3u3q8z7

 - 린스프린트 Series A 투자유치 컨설팅 프로그램 :  https://bit.ly/3DLWjXr

 

 

BELATED ARTICLES

more