← Back to projects
2025.12 - 2026.02 · KT AIVLE School 8기 Bigproject · AI 트랙 대상(1위)

PIILOT - AI 기반 개인정보 보호 플랫폼

기업 인프라에 산재된 개인정보를 AI 모델로 자동 탐지하고 비식별화하여 보안 및 법적 리스크를 최소화하는 통합 관제 플랫폼.

Background

생성형 AI 기술의 확산과 함께 기업의 개인정보 유출 사고가 급격히 증가하고 있다. 국내 기업 개인정보 유출 건수는 2022년 167건에서 2025년 451건 이상으로 3년간 170% 증가하였다. 대형 통신사 2,324만 명 개인정보 유출로 과징금 1,348억 원이 부과되는 등 사회적 피해 규모가 역대 최대 수준을 기록하고 있다.

법적 환경도 빠르게 변화하고 있다. 2025년 개정된 개인정보보호법에 따라 위반 시 과징금 상한이 매출의 3% → 10%로 대폭 상향되어 기업의 법적 리스크가 크게 커졌다. 그러나 기업 현장에서는 아래 세 가지 구조적 문제가 해결되지 않은 채 방치되어 있었다.

PIILOT은 이 세 가지 문제를 AI 자동화로 해결하는 것을 목표로 설계되었다. 수동 점검 중심의 기존 방식과 달리, AI 기반 자동 탐지로 관리 범위를 확대하고 사후 대응이 아닌 사전 탐지 기반 예방으로 패러다임을 전환하였다.

Overview

기업 환경의 DB·파일 서버에 분산된 개인식별정보(PII)를 AI 모델이 자동으로 탐지·비식별화하는 통합 관제 플랫폼이다. 개인정보 유출을 사전에 방지하고 탐지하는 것을 목적으로, 문서·이미지 하이브리드 비식별화 파이프라인과 2단계 XGBoost 분류 아키텍처를 핵심 AI 엔진으로 구성하였다.

총 54일간(2025.12.29 - 2026.02.20) 진행된 KT AIVLE School 8기 Bigproject로, AI 6명, BE 4명, FE 2명, Infra 2명으로 구성된 14인 팀이 개발하였다. 최종 발표에서 AI 트랙 대상(1위)을 수상하였다.

PIILOT 로그인 화면
PIILOT 서비스 로그인 화면 - "개인정보 유출을 사전에 방지하고 탐지하는 AI 기반 파일럿 관제 플랫폼"

Key Features

대시보드에서 연결된 서버 수, 개인정보 포함 컬럼/파일 수, 총 이슈 개수를 한눈에 파악할 수 있으며, DB·파일 서버별 암호화 추세와 개인정보 유형 분포를 실시간 차트로 제공한다.

PIILOT 대시보드
대시보드 - DB·파일 서버 암호화 추세, 개인정보 유형 분포, 이슈 목록 실시간 모니터링

DB 서버와 파일 서버를 연결하여 개인정보가 포함된 컬럼·파일을 탐지하고, 암호화 여부·위험도·스캔 이력을 관리한다. DB 스캔은 변경된 테이블만 재스캔하는 Change Signature 방식으로 재스캔 시 약 93% 시간 단축을 달성하였다.

DB 개인정보 목록
DB 개인정보 목록 - 컬럼별 PII 유형, 암호화 여부, 위험도 조회
파일 개인정보 목록
파일 개인정보 목록 - 파일별 마스킹 상태, 위험도, 스캔 이력 관리

AI 자동 마스킹 (Auto Masking)

이미지·문서·오디오·비디오 파일 내의 개인정보를 AI 모델이 자동으로 감지하여 마스킹 처리한다. 얼굴·개인식별 정보가 담긴 이미지를 선택하면 변환 결과를 실시간으로 미리볼 수 있으며, 비식별화 전·후를 나란히 비교할 수 있다. 마스킹된 파일은 Redis에 30분간 캐싱하여 저장 시 AI 서버 재호출 없이 즉시 처리되며, 원본 파일은 ZIP AES 암호화 후 별도 저장된다.

마스킹 전 - 파일 선택 화면
마스킹 전 - 파일 선택 및 변환 대기 상태
마스킹 후 - 얼굴 비식별화 결과
마스킹 후 - 얼굴 자동 블러 처리 결과 비교

Approach

AI - PII 합성 데이터셋 설계 및 동적 생성

AI - 문서/이미지 하이브리드 비식별화 파이프라인

AI - DB 레코드 암호화 여부 판별 모델 (2단계 XGBoost)

AI - DB 컬럼 개인정보 탐지 (RAG + LLM)

BE - 백엔드 API 구현

Role - 팀원 AI: PII 합성 데이터셋 설계 및 동적 생성, 문서/이미지 하이브리드 비식별화 파이프라인 설계, DB 레코드 암호화 여부 판별 모델(2단계 XGBoost) 구축
BE: 파일 개인정보 목록 API 구현, 개인 알림 시스템 API 구현

Tech Stack

Python KoELECTRA XGBoost YOLOv12n-face EasyOCR faster-whisper KT 믿:음 2.0 RAG / LangGraph Kalman Filter Java 21 Spring Boot 3.5 PostgreSQL Redis AWS Next.js QueryDSL pgvector

Results