AI 기본법 시행 후 스타트업이 점검해야 할 IP·데이터·영업비밀 체크리스트

파인특허
May 15, 2026

AI 스타트업의 지식재산 전략은 더 이상 “우리 모델을 특허로 낼 수 있는가”에서 끝나지 않습니다. 2026년 1월 22일 「인공지능 발전과 신뢰 기반 조성 등에 관한 기본법」이 시행되면서, AI 서비스는 기술 보호와 함께 데이터 출처, 투명성, 안전성, 영업비밀 관리, 외주개발 계약까지 함께 점검해야 하는 단계로 들어왔습니다.

특히 생성형 AI, 의료·금융·채용·교육·교통 등 민감 영역에 적용되는 AI, 고객 데이터를 계속 학습에 활용하는 SaaS형 AI 서비스라면 초기부터 IP와 컴플라이언스를 분리해서 볼 수 없습니다. 특허는 기술을 공개하고 권리화하는 수단이고, 영업비밀은 공개하지 않아야 가치가 유지되는 수단입니다. 학습데이터와 모델 운영 정책은 이 둘 사이에서 회사의 리스크를 좌우합니다.

이 글은 AI 기업이 제품 출시 전 점검해야 할 실무 체크리스트를 정리한 것입니다.

먼저 구분해야 할 세 가지 자산

AI 기업 내부에는 성격이 다른 자산이 섞여 있습니다.

첫째, 공개해도 되는 기술입니다. 예를 들어 특정 모델 구조, 데이터 전처리 방식, 추론 속도 개선 방법, 산업별 적용 시스템처럼 특허 출원을 통해 권리화할 수 있는 기술입니다. 이 영역은 공개 전 출원 여부를 검토해야 합니다.

둘째, 공개하면 가치가 떨어지는 기술입니다. 모델 학습 파이프라인, 데이터 라벨링 기준, 하이퍼파라미터 튜닝 노하우, 프롬프트 체인, 평가셋, 고객별 최적화 규칙 등이 여기에 들어갑니다. 이 영역은 영업비밀로 관리할 수 있는지부터 봐야 합니다.

셋째, 회사가 마음대로 쓸 수 없는 외부 자산입니다. 크롤링 데이터, 고객 제공 데이터, 오픈소스 코드, 외부 API, 공개 데이터셋, 협력사가 만든 모듈, 직원이 개인 계정으로 만든 실험 코드가 여기에 해당합니다. 이 영역은 권리 귀속과 이용 조건을 먼저 확인해야 합니다.

AI 분쟁은 대개 세 번째 자산을 첫 번째나 두 번째 자산처럼 다루는 데서 시작됩니다. “우리가 학습시켰으니 우리 것”이라는 말은 계약, 라이선스, 개인정보, 저작권, 영업비밀 문제를 모두 통과한 뒤에야 의미가 있습니다.

AI 기본법 이후 체크해야 할 항목

1. 우리 서비스가 고영향 AI에 가까운지 본다

AI 기본법은 사람의 생명, 신체 안전, 기본권에 중대한 영향을 미칠 수 있는 AI에 대해 별도 관리체계를 예정하고 있습니다. 시행령 서식에서도 에너지, 먹는물, 보건의료, 의료기기, 원자력, 범죄 수사·체포, 채용·대출 심사, 교통, 공공서비스, 교육 등 적용영역을 확인하도록 하고 있습니다.

스타트업 입장에서는 “우리는 단순 추천 서비스”라고 생각해도, 실제 고객사가 채용, 대출, 보험, 의료, 교육 평가에 사용하면 고영향 AI 이슈가 생길 수 있습니다. 따라서 제품소개서와 계약서에는 AI의 사용 가능 영역, 금지 영역, 고객의 책임 범위를 구분해 두는 것이 좋습니다.

점검 질문:

  • 고객이 이 AI 결과를 사람의 채용, 대출, 진단, 안전 판단에 쓰는가?
  • AI 결과가 자동 의사결정에 가까운가, 아니면 참고자료인가?
  • 고객이 결과를 해석·검증할 수 있는 로그와 설명자료가 있는가?
  • 제품소개서가 실제 기능보다 과장되어 있지는 않은가?

2. 학습데이터의 출처표를 만든다

AI 기업은 기술문서보다 데이터 출처표가 먼저 필요할 때가 많습니다. 데이터 출처표는 거창한 문서가 아니라, 어떤 데이터가 어디서 왔고 어떤 조건으로 쓰이는지 정리한 표입니다.

최소 항목은 다음과 같습니다.

항목 확인할 내용
데이터명 내부 식별 가능한 이름
출처 자체 생성, 고객 제공, 공개 데이터, 구매 데이터, 크롤링, 외주 납품
이용 근거 계약, 약관, 라이선스, 동의, 법령상 근거
허용 범위 학습, 검증, 제품 내 표시, 재판매, 제3자 제공 가능 여부
제한 사항 비상업적 이용, 출처 표시, 재배포 금지, 모델 학습 금지 등
개인정보 여부 포함, 비식별, 익명, 미포함
삭제 요청 대응 고객 해지 또는 권리자 요청 시 제거 가능성

이 표가 없으면 투자실사, 고객 보안심사, 대기업 PoC, 공공기관 도입 과정에서 설명이 막힙니다. 특히 “공개되어 있는 데이터”와 “학습에 자유롭게 써도 되는 데이터”는 같은 말이 아닙니다.

3. 생성형 AI 결과물의 권리 귀속을 계약서에 넣는다

생성형 AI를 쓰는 업무에서는 결과물의 권리 귀속이 흔히 비어 있습니다. 외주사가 AI로 만든 UI, 마케팅 문구, 코드, 이미지, 리포트를 납품했을 때 그 결과물을 누가 어떤 범위로 사용할 수 있는지 명확하지 않으면 나중에 문제가 됩니다.

계약서에는 다음 조항이 필요합니다.

  • AI 도구 사용 가능 여부
  • 입력자료에 고객의 영업비밀이나 개인정보를 넣을 수 있는지
  • 결과물에 제3자 권리 침해 요소가 포함될 경우 책임
  • 결과물 수정·재사용·2차 활용 권한
  • 사용한 오픈소스와 외부 모델의 라이선스 고지
  • 납품물의 학습데이터 재사용 금지 여부

AI를 금지하는 조항만 넣는 것은 현실적이지 않을 수 있습니다. 더 중요한 것은 “어떤 자료를 넣지 말아야 하는지”와 “사용했다면 어떤 정보를 고지해야 하는지”입니다.

4. 영업비밀로 둘 것과 권리화할 것을 나눈다

AI 기술은 모든 것을 출원하는 것이 정답이 아닙니다. 특허는 공개를 전제로 하고, 영업비밀은 비공개 관리를 전제로 합니다. 따라서 같은 AI 서비스 안에서도 나눠야 합니다.

특허 검토 대상:

  • 모델 구조나 학습방법이 기술적 효과를 만드는 경우
  • 특정 산업 문제를 해결하는 데이터 처리 흐름이 있는 경우
  • 하드웨어, 센서, 제어, 진단, 보안 등 기술 구성과 결합된 경우
  • 경쟁사가 제품을 보면 구현을 어느 정도 추론할 수 있는 경우

영업비밀 관리 대상:

  • 데이터 정제 기준
  • 라벨링 매뉴얼
  • 프롬프트 템플릿과 평가셋
  • 고객별 튜닝 파라미터
  • 장애 대응 로그와 운영 노하우
  • 가격 산정 알고리즘과 내부 벤치마크

영업비밀로 관리하려면 접근권한, 반출통제, 비밀표시, 로그관리, 퇴사자 회수, 협력사 NDA가 실제로 작동해야 합니다. “중요한 자료”라고 생각하는 것만으로는 부족합니다.

5. 오픈소스와 외부 API를 별도 관리한다

AI 제품은 오픈소스 모델, 벡터DB, 프레임워크, 평가도구, 외부 API를 빠르게 결합해 만듭니다. 문제는 PoC 단계에서 쓴 라이브러리가 그대로 상용 제품에 들어가는 경우입니다.

출시 전에는 최소한 다음을 확인해야 합니다.

  • 사용 중인 오픈소스 목록
  • 각 라이선스 종류
  • 수정 여부
  • 배포형 제품인지 SaaS인지
  • 고객에게 설치 파일이나 컨테이너를 제공하는지
  • 소스코드 공개, 고지, 라이선스 사본 제공 의무가 있는지
  • 외부 API 약관상 결과물 저장·재학습·재판매가 가능한지

특히 기업 고객에게 온프레미스 형태로 납품하거나 SDK를 제공한다면 오픈소스 고지와 라이선스 의무가 훨씬 중요해집니다.

출시 전 내부 체크리스트

  • 데이터 출처표가 있는가?
  • 고객 데이터가 학습에 쓰이는지 약관에 명확히 적혀 있는가?
  • 생성형 AI 결과물의 소유권과 책임이 계약서에 들어가 있는가?
  • 고영향 AI에 해당할 가능성이 있는 적용영역을 검토했는가?
  • 특허 출원 전 공개한 기술자료가 있는가?
  • 영업비밀로 관리할 자료에 접근권한과 반출통제가 있는가?
  • 오픈소스 라이선스 목록을 만들었는가?
  • 외주개발자가 만든 코드와 모델의 권리 이전 조항이 있는가?
  • 고객에게 제공하는 설명자료가 실제 기능을 과장하지 않는가?
  • 장애·오류·환각 결과에 대한 책임 범위가 약관에 반영되어 있는가?

자주 묻는 질문

AI 모델 자체도 보호받을 수 있나요?

모델 자체를 그대로 보호한다기보다, 모델 구조, 학습방법, 데이터 처리 흐름, 특정 산업 문제를 해결하는 시스템 구성, 추론 속도나 정확도를 개선하는 기술적 수단이 보호 대상이 될 수 있습니다. 다만 공개하면 모방이 쉬운 부분과 비밀로 유지해야 하는 부분을 구분해야 합니다.

고객 데이터를 학습에 쓰려면 약관만 있으면 되나요?

약관은 출발점일 뿐입니다. 데이터의 성격에 따라 개인정보, 영업비밀, 저작권, 계약상 비밀유지 의무가 함께 문제될 수 있습니다. B2B 서비스라면 고객사 내부 데이터의 재학습 사용을 별도 동의나 계약서로 분리하는 편이 안전합니다.

생성형 AI 결과물을 회사가 바로 상업적으로 써도 되나요?

사용한 AI 도구의 약관, 입력자료의 권리관계, 결과물의 유사성, 외주계약의 권리귀속에 따라 달라집니다. 특히 로고, 캐릭터, 광고 이미지, 코드, 데이터셋은 별도 검토가 필요합니다.

파인특허의 실무 제안

AI 기업은 제품 출시 전 특허 가능성, 데이터 이용권, 영업비밀 관리, 오픈소스 라이선스, 고객 계약서를 한 번에 봐야 합니다. 한 영역만 따로 점검하면 실제 리스크를 놓치기 쉽습니다.

파인특허는 AI 기술의 권리화뿐 아니라 데이터·영업비밀·계약 구조를 함께 검토해, 기업이 공개할 기술과 감춰야 할 기술을 구분하는 전략을 제안합니다.