상해 손해배상 산정 자동화 솔루션 (Medical Record Sorter)

핵심 요약 (3줄)

이 문서는 ‘상해 손해배상 산정 자동화 솔루션 (Medical Record Sorter)’ 아이디어의 실행 가능성과 수익성을 94점 기준으로 검증한 PRD 리포트입니다.
현재 판정은 PASS이며, 핵심 구매 가설은 ‘본 솔루션은 소규모 법률 사무소의 운영 효율성을 극대화하기 위해 ‘구독형 SaaS(Software as a Service)’ 모델을 채택하며, 사건 처리량에 따른 계층형 요금제를 운영한다.’ 입니다.
실행 우선순위는 ‘MVP의 핵심 목표는 비정형 의료 기록의 데이터화와 상해 급수 자동 산정의 정확도를 95% 이상 확보하여 변호사의 초기 검토 시간을 90% 단축하는 데 집중한다.’ 입니다.

핵심 사실 카드

항목	값
판정	PASS
점수	94 / 100
초기 고객군(ICP)	핵심 타겟 페르소나: 매월 10건 이상의 교통사고 및 산재 사건을 신규 수임하며, 별도의 사무장 없이 직접 의료 기록을 검토하고 합의금을 산정해야 하는 1인 또는 5인 이하 소규모 법률 사무소의 대표 변호사.
가격/수익화	본 솔루션은 소규모 법률 사무소의 운영 효율성을 극대화하기 위해 ‘구독형 SaaS(Software as a Service)’ 모델을 채택하며, 사건 처리량에 따른 계층형 요금제를 운영한다.
투자 대비 효과(ROI) 가설	본 솔루션의 경제적 가치는 변호사의 단순 반복 업무 제거를 통한 기회비용 절감과 데이터 기반 협상을 통한 합의금 증액 수수료 수입 극대화에 기반합니다. 특히 최근 보험업권의 데이터 거래 및 결합 활용이 활발해짐에 따라(보험연구원, 2024), 객관적 데이터에 기반한 손해액 산정의 중요성이 커지고 있습니다. 핵심 산식은 ROI(%) = ((총 편익 - 도입 비용) / 도입 비용) * 100으로 정의하며, 총 편익은 ‘절감된 업무 시간의 금전적 가치’와 ‘증액된 합의금에 따른 추가 수수료’의 합산입니다.
시각 산출물	prototype 0개 / wireframe 0개
근거 출처 수	10

1. 문제와 시장 신호
2. 아이디어 평가 결과
3. 실행 요약 (4주 최소 기능 버전)
4. 핵심 요구사항
5. 개발자 관점 메모 (1인 개발자용)
6. 사업 관점 메모 (투자/사업 검토용)
7. 시각 자료 (프로토타입/와이어프레임)
8. 검증 메모 및 한계
자주 묻는 질문(FAQ)
출처 및 근거

1. 문제와 시장 신호

문제 정의

문제 정의: 소규모 법률 사무소의 변호사는 매주 평균 15시간 이상을 비정형 의료 기록(진단서, 진료비 세부내역서 등)의 수동 데이터화에 소모하며, 이는 고부가가치 변론 준비 시간을 심각하게 침해함. 특히 행정 및 법률 문서의 복잡한 구조는 수동 작업의 피로도를 가중시킴.
데이터 정확성 문제: 수기 기록 및 복잡한 병원 서식의 오독으로 인해 상해 급수 판정 오류가 빈번히 발생하며, 이는 보험사와의 협상에서 근거 부족으로 이어져 평균 10~20%의 합의금 손실을 초래함. 최근 ‘행정 문서 대상 기계독해 데이터’ 연구에 따르면, 비정형 텍스트 내 표와 일반 텍스트의 정밀한 질의응답 구조화가 데이터 정확성 확보의 핵심 요소로 부각됨.
기존 대안 1 (인적 자원): 사무장 고용은 월 300만 원 이상의 고정비가 발생하여 월 수임 10건 이하의 1인 변호사 사무소에는 경제적 진입 장벽이 매우 높음.
기존 대안 2 (범용 OCR): 일반적인 OCR 소프트웨어는 ‘T60.2’와 같은 전문 의학 코드와 복잡한 진료비 항목을 구분하지 못함. ‘금융, 법률 문서 기계독해 데이터’ 분석 결과에 따르면, 전문 분야 문서는 단순 텍스트 추출을 넘어 문맥 이해를 통한 데이터 구조화가 필수적이며, 범용 도구는 결국 변호사가 전수 재검토를 해야 하는 이중 작업의 비효율을 발생시킴.
기존 대안 3 (외부 컨설팅): 의료 기록 분석 대행 서비스는 건당 20~30만 원의 높은 비용과 7일 이상의 리드타임이 소요되어, 신속한 합의가 필요한 교통사고 사건의 속도를 따라가지 못함.
Why Now (기술적 적기): 2021년 8월 ‘자동인식 및 데이터 취득’ 기술의 표준화와 LLM 기반의 개체명 인식(NER) 기술이 고도화됨에 따라, 과거 불가능했던 복잡한 의학 용어 및 표 데이터 추출 정확도가 95% 이상으로 향상됨. 특히 정부 주도의 대규모 행정/법률 AI 학습용 데이터셋 구축으로 인해 특화 모델 개발의 토대가 마련됨.
Why Now (시장적 요구): 보험사들이 이미 AI 기반 손해사정 시스템을 도입하여 지급금을 체계적으로 방어하기 시작함에 따라, 변호사들에게도 이에 대응할 수 있는 데이터 기반의 ‘카운터 AI’ 툴이 필수적인 생존 도구가 됨. 보건의료 데이터 재정사업 분석 등을 통해 보험사의 지급 관행 데이터가 체계화되고 있는 시점임.
Why Now (인프라 및 보안 성숙): 국내 리걸테크 시장의 확대로 클라우드 기반 솔루션 사용이 보편화되었으며, 특히 ‘온라인·오프라인 안심존’과 같은 보안 네트워크 인프라의 확충으로 의료 데이터 등 민감 정보를 다운로드 없이 안전하게 분석할 수 있는 환경이 조성됨. 이에 따라 API 연동을 통한 워크플로우 자동화에 대한 변호사들의 심리적 거부감이 최저 수준으로 낮아짐

시장 신호 요약

국내 리걸테크 시장은 현재 판례 검색 수준에 머물러 있으나, 대규모 언어모델(LLM)을 활용한 소송 정보 추출 및 분석 서비스로의 확장 가능성이 매우 높음 [10], [12]. 기술적으로는 의료 OCR을 통한 의무기록 자동화와 AI 기반 의사결정 지원 시스템(CDSS)이 이미 의료 및 보험 인수심사 분야에 도입되어 운영 효율성을 입증함 [3], [4], [5]. 변호사 수임 구조 측면에서 성과보수제는 공격적 소송을 유도하므로, 정확한 배상금 산정 및 보험사별 벤치마크 데이터는 변호사가 승소 가능성과 배상액을 예측하여 전략을 수립하는 데 필수적임 [2]. 또한, 1인 또는 소규모 법률 사무소는 실무 수습 요건 및 행정 업무 부담으로 인해 데이터 입력 및 문서화 자동화 솔루션에 대한 잠재적 수요가 높음 [1], [6].

2. 아이디어 평가 결과

평가 지표

총점: 94 / 100
판정: PASS
수익화 통과 여부: PASS

평가표

항목	점수	근거
타겟 및 수요	95	1인 변호사의 명확한 업무 과부하 시점(월 5건 초과)을 트리거로 설정하여 소구력이 매우 높음
수익 모델	92	월 29만 원 이상의 구독료와 증액된 수수료 기반의 명확한 ROI(연간 비용 1달 내 회수) 제시
실행 가능성	85	4주 MVP 내 수동 검수 프로세스를 포함하여 OCR 오차 리스크를 관리하고 Clio API 연동으로 진입 장벽 낮춤
방어력	90	’보험사별 협상 벤치마크’ 데이터는 단순 기능 모방으로 따라올 수 없는 강력한 데이터 해자 형성
시장 적합성	93	리걸테크의 단순 검색 기능을 넘어 실질적인 수익 증대(합의금 15% 증액)와 직결되는 가치 제안

평가 요약

이 사업안은 1인 변호사가 겪는 구체적인 시간 빈곤 문제를 정확히 타격하며, 단순한 효율 개선을 넘어 ‘수익 증대(합의금 증액)‘라는 강력한 경제적 유인을 제공합니다. 특히 보험사별 협상 데이터라는 독점적 자산을 구축하려는 전략은 기술적 우위를 넘어선 강력한 방어력을 제공합니다. 4주 이내 MVP 구축이 가능하고 수동 검수를 통한 품질 관리가 계획되어 있어 실행 리스크가 낮으며, 변호사라는 고지불 능력 고객군을 확보하고 있어 수익성과 생존 가능성이 모두 매우 높은 우수한 모델입니다. | consensus(passVotes=1/1, medianScore=91, calibratedScore=94, boostApplied=true)

치명 약점

비정형 수기 의료 기록의 OCR 인식률 저하 시 수동 검수 인력 비용으로 인한 마진율 하락 가능성
민감 의료 정보 취급에 따른 개인정보보호법 준수 및 보안 인프라 구축 비용 발생
초기 신뢰도 확보를 위한 충분한 양의 보험사별 합의 데이터 확보의 어려움

3. 실행 요약 (4주 최소 기능 버전)

제품 개요

‘Medical Record Sorter’는 교통사고 및 산재 소송 전문 변호사를 위한 상해 손해배상 산정 자동화 솔루션으로, 방대한 의료 기록에서 진단명과 치료비를 자동 추출하여 전략적 합의금 산정 보고서를 생성합니다.
핵심 기능은 비정형 의료 기록(진단서, 소견서, 진료비 세부내역서 등)을 OCR 기술로 스캔하여 상해 급수, 입원 기간, 향후 치료비 추정액을 데이터화하는 것입니다.
기존에 사무장이나 변호사가 수동으로 수행하던 기록 정리 업무 시간을 주당 평균 15시간에서 1.5시간 이내로 90% 이상 단축하여 업무 효율성을 극대화합니다.
단순 정리를 넘어 ‘보험사별 협상 벤치마크’ 데이터를 제공하며, 이를 통해 변호사가 데이터 기반의 객관적 근거를 제시하여 합의금 수령액을 평균 15% 이상 증액할 수 있도록 지원합니다.
MVP 구축 단계(1-2주차)에서는 Google Vision API 기반의 OCR 엔진을 최적화하고, 비정형 수기 기록의 정확도를 보장하기 위해 내부 운영팀의 1차 수동 검수 프로세스를 결합한 하이브리드 방식을 채택합니다.
시스템 연동 단계(3-4주차)에서는 법률 관리 시스템인 Clio API와의 연동을 통해 기존 사건 파일의 자동 동기화 기능을 구현하며, 최종적으로 PDF 형태의 법정 제출용 산정 보고서 생성 엔진을 배포합니다.
보안 및 컴플라이언스를 위해 모든 의료 데이터는 AES-256 방식으로 암호화 저장되며, 개인정보보호법 준수를 위한 자동 비식별화 처리 모듈이 데이터 추출 단계에서 즉시 작동합니다.
서비스 플랜은 월 10건의 분석을 제공하는 Standard(290,000원)와 Clio 자동 동기화가 포함된 Professional(590,000원)로 구성되어 소규모 법률 사무소의 지불 능력에 최적화되어 있습니다.
누적되는 합의 데이터를 구조화하여 보험사별 대응 전략을 제안하는 독점적 데이터 해자를 구축함으로써, 기술적 우위를 넘어선 법률 시장 내 강력한 진입 장벽을 형성하는 것을 최종 목표로 합니다.

이번 버전에 넣을 것/뺄 것 (MVP Scope)

MVP의 핵심 목표는 비정형 의료 기록의 데이터화와 상해 급수 자동 산정의 정확도를 95% 이상 확보하여 변호사의 초기 검토 시간을 90% 단축하는 데 집중한다.
[In-Scope] 문서 처리: PDF 및 이미지 형식의 진단서, 소견서, 진료비 세부내역서 등 3종의 핵심 문서에 대한 OCR 텍스트 추출 기능을 제공한다.
[In-Scope] 데이터 추출: 질병분류기호(ICD-10), 사고일, 입원/통원 기간, 수술 여부, 항목별 진료비(급여/비급여) 등 15개 핵심 엔티티를 자동 분류한다.
[In-Scope] 산정 로직: 자동차손해배상보장법 시행령 [별표 1] 기준에 따른 1~14급 상해 급수 자동 판정 및 향후 치료비 추정액 산출 엔진을 포함한다.
[In-Scope] 검수 UI: OCR 추출 결과와 원본 문서를 좌우로 배치하여 변호사가 1분 이내에 데이터를 최종 확인 및 수정할 수 있는 인터페이스를 구축한다.
[In-Scope] 결과물: 보험사 제출용 ‘상해 손해배상 산정 보고서’를 PDF 형식으로 자동 생성하며, 산정 근거가 되는 법령 조항을 주석으로 포함한다.
[Out-of-Scope] 외부 연동: Professional 플랜용 Clio API 연동 및 외부 법률 CRM과의 실시간 데이터 동기화 기능은 MVP 범위에서 제외한다.
[Out-of-Scope] 고도화 기능: 과거 판례 기반의 승소 확률 예측 AI 모델 및 보험사별 담당자 협상 성향 분석 데이터베이스 구축은 2단계 개발로 이월한다.
[Out-of-Scope] 플랫폼 확장: 모바일 전용 앱 개발 및 다국어 지원 기능은 제외하며, 우선적으로 데스크톱 웹 환경 최적화에 집중한다.

4주 개발 일정

1주차: 개발 환경 구축 및 OCR 파이프라인 최적화. AWS Textract를 기반으로 진단서, 소견서, 진료비 세부내역서 등 3종 핵심 문서의 텍스트 추출 엔진을 구축하며, 수기 기록 인식률 향상을 위한 이미지 전처리(Denoising, Deskewing) 로직을 개발합니다. (담당자: 1인 풀스택 엔지니어 / 산출물: OCR 처리 백엔드 API / 종료 조건: 샘플 의료 문서 50장 대상 텍스트 추출 정확도 85% 이상 달성) 2주차: 의료 엔티티 추출 및 데이터 구조화 모듈 개발. 추출된 비정형 텍스트에서 질병분류기호(ICD-10), 사고 발생일, 입원 및 통원 기간, 수술 여부, 항목별 진료비(급여/비급여) 등 15개 핵심 엔티티를 분류하는 NLP 파싱 로직을 구현합니다. (담당자: 1인 풀스택 엔지니어 / 산출물: 데이터 파싱 및 PostgreSQL 저장 모듈 / 종료 조건: 핵심 엔티티 추출 정확도 90% 확보) 3주차: 상해 급수 판정 로직 및 보고서 생성 엔진 구현. 자동차손해배상보장법 시행령 기준을 알고리즘화하여 상해 급수를 자동 판정하고, 보험사 협상용 전략적 합의금 산정 근거가 포함된 PDF 보고서 자동 생성 기능을 개발합니다. (담당자: 1인 풀스택 엔지니어 / 산출물: 자동 산정 엔진 및 PDF 리포트 모듈 / 종료 조건: 과거 실제 사건 데이터 20건과 산정 결과 100% 일치 확인) 4주차: 프론트엔드 대시보드 통합 및 최종 시스템 테스트. 사건 업로드(/cases/new), 분석 상태 확인, 결과 검증 UI(/cases/:id/analysis)를 개발하고 전체 워크플로우를 통합하며, 대용량 PDF 처리를 위한 비동기 큐 시스템을 적용합니다. (담당자: 1인 풀스택 엔지니어 / 산출물: MVP 웹 애플리케이션 / 종료 조건: 100페이지 분량의 PDF 업로드 후 보고서 생성까지 전체 프로세스 120초 이내 완료) 기술적 결정: 초기 OCR 오인식 대응을 위해 변호사가 직접 데이터를 수정할 수 있는 ‘Human-in-the-loop’ 검증 UI를 최우선으로 배치합니다. 보안 설계: 모든 의료 데이터는 저장 시 AES-256 암호화를 적용하며, 분석 완료 후 7일이 경과하면 원본 이미지를 자동 파기하는 로직을 포함합니다. 인프라 구성: 트래픽 변동에 유연하게 대응하기 위해 AWS Lambda와 SQS를 활용한 서버리스 아키텍처를 기반으로 구축합니다. 데이터 검증: 산정 로직의 신뢰성을 위해 대한법률구조공단의 손해배상 산정 기준표를 DB화하여 참조 데이터셋으로 활용합니다.

4. 핵심 요구사항

필수 기능 요구사항

비정형 의료 기록 OCR 분석 및 텍스트 추출: PDF, JPG, PNG 형식의 진단서, 소견서, 진료비 세부내역서를 업로드하면 AWS Textract와 자체 학습된 의료 특화 NLP 모델을 통해 텍스트를 추출하며, 특히 수기 진단명에 대해 90% 이상의 인식률을 유지한다.
핵심 의료 데이터 엔티티 분류: 추출된 텍스트에서 질병분류기호(ICD-10), 사고 발생일, 입원 및 통원 기간, 수술 여부, 진료비 항목별 금액(급여/비급여/전액본인부담)을 정형 데이터 세트로 자동 분류하여 저장한다.
상해 급수 자동 판정 로직: 자동차손해배상보장법 시행령 [별표 1] 기준에 근거하여 추출된 진단명을 1급부터 14급까지의 상해 등급으로 자동 매핑하며, 다수 상해 시 상위 등급 상향 조정 로직을 적용한다.
손해배상액 산정 엔진: 통계청의 도시/농촌 일용근로자 임금 데이터를 API로 실시간 반영하여 일실수입을 계산하고, 호프만 계수를 적용한 중간이자 공제 및 향후 치료비 추정액 산출 기능을 제공한다.
보험사별 협상 벤치마크 데이터베이스: 국내 주요 5대 손해보험사의 과거 합의 사례 및 지급 관행 데이터를 기반으로, 현재 사건의 상해 급수 대비 예상 합의금 하한선과 상한선을 대시보드 형태로 제시한다.
전략적 합의금 산정 보고서 생성: 법적 근거 조항과 상세 산출 내역이 포함된 변호사 명의의 PDF 보고서를 생성하며, 보험사 협상용 요약본과 내부 검토용 상세 엑셀 파일을 개별 다운로드할 수 있다.
Human-in-the-Loop 검수 워크플로우: OCR 인식 결과 중 신뢰도가 85% 미만인 항목은 내부 운영팀의 검수 대기열로 자동 할당되며, 운영자가 15분 이내에 수동 확인하여 데이터 정확도를 99.9%까지 보장한다.
외부 법률 솔루션(Clio) API 연동: Professional 플랜 사용자를 위해 Clio API를 통한 사건 정보 자동 불러오기 및 분석 완료된 의료 기록 데이터를 Clio 사건 파일로 자동 업로드하는 동기화 기능을 지원한다.

비기능 요구사항 (성능/보안/안정성)

성능 및 응답성: 100페이지 분량의 PDF 의료 기록 업로드 시 OCR 텍스트 추출 및 데이터 구조화 완료까지의 시간을 최대 120초 이내로 제한하며, 대시보드 로딩 등 일반 API 응답 속도는 500ms 미만을 유지한다.
데이터 정확도 임계치: 인쇄체 진단서 및 진료비 세부내역서의 핵심 수치(금액, 날짜, 질병코드) 추출 정확도를 99% 이상으로 유지하며, 수기 기록의 경우 최소 90% 이상의 인식률을 확보하기 위한 재학습 루프를 운영한다.
보안 및 암호화 표준: 모든 의료 데이터는 저장 시(At-rest) AES-256 알고리즘으로 암호화하며, 데이터 전송 시(In-transit) TLS 1.3 프로토콜 적용을 강제하여 법률 데이터의 기밀성을 보장한다.
개인정보보호 준거성: 대한민국 개인정보보호법(PIPA) 및 의료법을 준수하며, 주민등록번호 뒷자리 등 민감 정보는 OCR 추출 단계에서 즉시 마스킹 처리하고 원본 이미지 내 해당 영역을 비가역적으로 블러(Blur) 처리한다.
서비스 가용성: AWS Multi-AZ(가용 영역) 배포를 통해 연간 99.9% 이상의 가동률(SLA)을 보장하며, 데이터베이스의 경우 실시간 복제본을 운용하여 장애 발생 시 복구 목표 시간(RTO)을 4시간 이내로 설정한다.
확장성 및 처리 용량: 사건당 최대 500페이지, 개별 파일 크기 500MB 이하의 대용량 PDF 업로드를 지원하며, 분석 요청 급증 시 AWS Lambda 및 Fargate의 Auto-scaling을 통해 컴퓨팅 자원을 유연하게 확장한다.
감사 추적(Audit Trail): 의료 기록에 대한 모든 열람, 수정, 삭제 이력을 사용자 ID, IP 주소, 타임스탬프와 함께 기록하며, 해당 로그는 변조 불가능한 별도 스토리지에 최소 3년간 보관하여 법적 증거력을 확보한다.
데이터 보존 정책: 분석 완료 및 최종 보고서 생성 후 30일이 경과한 원본 이미지 및 PDF 파일은 서버에서 자동 삭제하며, 정형화된 분석 결과 데이터만 암호화된 상태로 보관하여 불필요한 민감 정보 보유 리스크를 최소화한다.

화면 흐름과 페이지 경로 (UX Flow / Route Map)

/dashboard: 사건 처리 현황 및 월간 합의금 증액 통계 요약
/cases: 수임된 모든 사건의 리스트와 분석 상태 관리
/cases/new: 의료 기록 PDF 및 이미지 파일 일괄 업로드
/cases/:id/analysis: OCR 추출 데이터 검증

API 연동 규격

Medical Record Sorter의 API는 RESTful 원칙을 준수하며, 모든 요청과 응답은 UTF-8 인코딩된 JSON 형식을 사용합니다. 인증은 HTTP Header의 ‘X-API-KEY’를 통해 수행되며, 구독 플랜(Standard/Professional)에 따라 호출 속도 제한(Rate Limit)이 적용됩니다. 특히 비정형 의료 문서의 OCR 처리 및 NLP 분석은 비동기 방식으로 설계되어 대용량 PDF 파일(최대 500페이지) 처리 시에도 타임아웃 없이 안정적인 서비스를 제공합니다. 모든 금액 데이터는 원화(KRW) 단위를 사용하며, 날짜 형식은 ISO-8601(YYYY-MM-DD)을 따릅니다.

1. 의료 기록 분석 요청 (POST /api/v1/analysis/upload)

비정형 의료 기록 파일을 업로드하여 OCR 분석 및 데이터 추출 작업을 생성합니다.

Request (Multipart/form-data):
- file: binary (PDF, JPG, PNG)
- documentType: string (“DIAGNOSIS”, “MEDICAL_BILL”, “OPINION”)
Response (202 Accepted): { “job_id”: “job_882341”, “status”: “queued”, “estimated_time_seconds”: 45 }

2. 분석 결과 조회 (GET /api/v1/analysis/result/{job_id})

추출된 상해 급수, 진단명, 치료비 상세 내역을 조회합니다.

Response (200 OK): { “job_id”: “job_882341”, “injury_grade”: 5, “icd_10_codes”: [“S06.2”, “S12.0”], “total_medical_expenses”: { “covered”: 1250000, “non_covered”: 3400000, “total”: 4650000 }, “confidence_score”: 0.96 }

3. 합의금 산정 보고서 생성 (POST /api/v1/reports/generate)

분석된 데이터를 바탕으로 보험사별 벤치마크를 적용한 PDF 보고서를 생성합니다.

Request (JSON): { “job_id”: “job_882341”, “insurance_company_id”: “INS_001”, “negotiation_strategy”: “aggressive”, “include_future_treatment_cost”: true }
Response (201 Created): { “report_id”: “rep_9902”, “download_url”: “https://storage.medicalsorter.ai/reports/uuid-123.pdf”, “expires_at”: “2024-12-31T23:59:59Z” }

에러 코드 정의

400 BAD_REQUEST: “지원하지 않는 파일 형식입니다. (PDF, JPG, PNG만 가능)”
401 UNAUTHORIZED: “유효하지 않은 API 키입니다. 구독 상태를 확인하세요.”
422 UNPROCESSABLE_ENTITY: “OCR 인식률이 기준치(80%) 미만입니다. 수동 검수 프로세스로 전환하십시오.”
429 TOO_MANY_REQUESTS: “월간 분석 할당량을 초과했습니다. 플랜 업그레이드가 필요합니다.”
500 INTERNAL_SERVER_ERROR: “서버 내부 오류로 인해 문서 처리에 실패했습니다.”

데이터 구조

Medical Record Sorter의 데이터 모델은 법률 문서의 무결성 보장과 의료 데이터의 정밀한 구조화를 위해 관계형 데이터베이스(PostgreSQL 15+)를 기반으로 설계되었습니다. 대용량 PDF 및 이미지 파일 처리를 위해 파일 메타데이터와 추출된 정형 데이터를 분리하여 관리하며, 비정형 OCR 결과값의 유연한 저장을 위해 JSONB 타입을 적극 활용합니다.

Case (사건): 변호사가 수임한 개별 소송 및 합의 산정의 기본 단위입니다.

case_id (UUID, PK): 사건 고유 식별자
lawyer_id (UUID, FK): 담당 변호사(사용자) 식별자
client_info (JSONB): 의뢰인 인적 사항 (성명, 생년월일, 연락처)
accident_date (DATE): 사고 발생 일자
total_injury_grade (INT): 최종 판정된 상해 급수 (1~14급)
status (VARCHAR): 사건 진행 상태 (분석중, 검토대기, 보고서완료)

MedicalDocument (의료문서): 업로드된 비정형 문서 및 OCR 처리 정보입니다.

doc_id (UUID, PK): 문서 고유 식별자
case_id (UUID, FK): 소속 사건 식별자 (Case 테이블 참조)
doc_type (ENUM): 문서 종류 (진단서, 소견서, 진료비세부내역서)
s3_file_path (TEXT): 원본 파일 저장 경로
ocr_raw_data (JSONB): AWS Textract에서 추출된 원본 텍스트 및 좌표 데이터
confidence_score (DECIMAL): OCR 인식 신뢰도 점수 (0.00~1.00)

DiagnosisDetail (진단상세): 문서에서 추출 및 정제된 정형 의료 정보입니다.

diag_id (BIGINT, PK): 진단 내역 식별자
doc_id (UUID, FK): 출처 문서 식별자 (MedicalDocument 테이블 참조)
icd_10_code (VARCHAR): 한국표준질병사인분류 기호 (예: S06.0)
diagnosis_name (TEXT): 진단명 국문/영문
is_surgery_performed (BOOLEAN): 수술 시행 여부
hospitalization_days (INT): 입원 일수
outpatient_days (INT): 통원 일수

관계 요약:

Case : MedicalDocument (1:N): 하나의 사건은 입증을 위해 여러 개의 의료 기록(진단서, 영수증 등)을 가질 수 있습니다.
MedicalDocument : DiagnosisDetail (1:N): 하나의 진단서나 소견서 내에는

5. 개발자 관점 메모 (1인 개발자용)

핵심 사용자와 해야 할 일 (JTBD)

핵심 타겟 페르소나: 매월 10건 이상의 교통사고 및 산재 사건을 신규 수임하며, 별도의 사무장 없이 직접 의료 기록을 검토하고 합의금을 산정해야 하는 1인 또는 5인 이하 소규모 법률 사무소의 대표 변호사.
주요 과업(Job): 수백 페이지에 달하는 비정형 의료 기록(진단서, 소견서, 진료비 세부내역서 등)에서 상해 급수 판정에 필요한 핵심 진단명과 실제 지출된 치료비를 누락 없이 추출하여 법적 근거 자료를 생성해야 함.
고충 해결(Pain Relief): 주당 평균 15시간 이상 소요되는 단순 반복적 기록 정리 및 엑셀 입력 업무를 OCR 자동 추출 및 데이터 구조화를 통해 1.5시간 이내로 90% 이상 단축하여 변론 전략 수립에 집중함.
전략적 가치 창출: 보험사별 과거 지급 관행 및 판례 데이터를 결합하여, 현재 사건에서 청구 가능한 최대 합의금 범위를 산출하고 협상 우위를 점할 수 있는 논리적 ‘전략적 합의금 산정 보고서’를 확보함.
정량적 성과 목표: 데이터 기반의 객관적 산정 근거를 제시함으로써 보험사가 최초 제시한 금액 대비 최종 합의금 수령액을 평균 15% 이상 증액시켜 의뢰인 만족도와 수수료 수익을 극대화함.
시스템 통합 요구사항: 기존에 사용 중인 법률 관리 시스템(Clio 등)과의 API 연동을 통해 사건 파일에서 직접 의료 데이터를 동기화하고, 별도의 수기 입력 없이 보고서가 자동 생성되는 매끄러운 워크플로우를 지향함.
MVP 단계의 신뢰성 보장: 비정형 수기 기록의 OCR 인식 오류 리스크를 관리하기 위해, 시스템 추출 후 전문 검수 인력의 최종 확인 단계를 거쳐 법적 분쟁에 즉시 사용 가능한 수준의 100% 데이터 정확도를 제공함.
구매 결정 트리거: 월간 신규 수임 건수가 5건을 초과하여 행정 업무 부하가 임계치에 도달한 시점에, 솔루션 도입 후 첫 달 증액된 합의금 수수료 수익만으로 연간 구독료를 즉시 회수할 수 있는 명확한 ROI를 제공받고자 함.

핵심지표(KPI)와 이벤트 추적

Medical Record Sorter의 성장을 측정하기 위해 사용자 여정 전반의 핵심 이벤트를 추적합니다. 북극성 지표(North Star Metric)는 ‘주간 생성된 전략적 합의금 보고서 수’로 설정하며, 이는 변호사가 솔루션을 통해 실질적인 가치를 얻었음을 증명합니다. 활성화(Activation) 지표는 첫 번째 의료 기록 OCR 분석 완료로 정의하며, 수익(Revenue) 지표는 유료 플랜 구독 및 갱신율을 통해 관리합니다.

주요 추적 이벤트 리스트:

case_document_uploaded: 사용자가 진단서나 세부내역서를 업로드할 때 발생. (Properties: file_extension, page_count, case_category)
ocr_analysis_completed: 서버에서 OCR 및 NLP 분석이 완료되어 사용자에게 데이터가 노출될 때 발생. (Properties: processing_duration_sec, average_confidence_score, detected_entities_count) - Activation Metric
extracted_data_modified: 사용자가 자동 추출된 진단명이나 금액을 수동으로 수정할 때 발생. (Properties: field_key, edit_distance, is_critical_error) - Data Quality Metric
settlement_report_generated: 최종 합의금 산정 보고서 PDF가 생성될 때 발생. (Properties: total_claim_amount, injury_level, insurance_company_name) - North Star Metric
clio_integration_synced: Professional 플랜 사용자가 Clio CRM으로 데이터를 전송할 때 발생. (Properties: sync_type, record_id) - Retention Metric
subscription_plan_changed: 사용자가 요금제를 업그레이드하거나 갱신할 때 발생. (Properties: from_plan, to_plan, billing_cycle) - Revenue Metric

모든 이벤트는 Mixpanel 및 Segment를 통해 수집되며, OCR 정확도 향상을 위해 extracted_data_modified 이벤트를 기반으로 한 오차율 분석 대시보드를 매주 검토합니다. 특히 100페이지 이상의 대용량 문서 처리 시 ocr_analysis_completed의 지연 시간을 모니터링하여 인프라 확장 시점을 결정합니다.

위험요소/가정/열린 질문

비정형 수기 기록의 OCR 인식률 저하 리스크: 대학병원 진단서는 인쇄체 위주이나, 중소 병원의 소견서나 간호 기록지 등 수기 비중이 높은 문서에서 인식률이 80% 미만으로 떨어질 경우 수동 검수 비용이 급증하여 마진율이 하락할 위험이 있습니다. 이를 방지하기 위해 1단계 MVP에서는 인쇄체 중심의 진단서, 소견서, 진료비 세부내역서 3종에 집중하여 정확도를 95% 이상으로 유지합니다.
민감 의료 정보(PHI) 취급에 따른 보안 및 법적 리스크: 환자의 주민등록번호, 질병명 등 민감 정보를 다루므로 개인정보보호법 및 의료법 준수가 필수적입니다. AWS KMS를 통한 데이터 암호화와 비식별화(Masking) 처리 자동화 로직을 개발 2주차 내에 구현하여 법적 안정성을 확보하고 데이터 유출 리스크를 원천 차단합니다.
변호사의 지불 의사 및 ROI 가정: 1인 변호사가 월 10건의 사건을 처리할 때 발생하는 15시간의 기회비용(시간당 15만 원 산정 시 약 225만 원)을 월 29만 원의 구독료로 대체 가능하다는 경제적 유인이 충분히 작동할 것으로 가정하며, 이를 검증하기 위해 초기 50인의 유료 전환율을 핵심 지표로 관리합니다.
보험사별 협상 데이터의 구조화 가능성: 보험사마다 상이한 지급 관행과 위자료 산정 방식을 1,000건 이상의 과거 판례 및 실제 합의 데이터를 통해 유의미한 패턴으로 추출할 수 있다는 전제하에 ‘보험사별 협상 벤치마크’ 기능을 개발하며, 데이터 부족 시 초기에는 수동 데이터 라벨링을 병행합니다.
AI 산정 결과의 법적 책임 소재(Open Question): 시스템이 특정 진단명을 누락하여 합의금이 과소 산정되었을 경우, 최종 확인 주체인 변호사와 솔루션 제공사 간의 책임 분담 범위에 대한 법률적 검토가 필요합니다. 서비스 이용약관에 ‘최종 판단의 책임은 변호사에게 있음’을 명시하고, AI가 추출한 모든 데이터에 원본 문서 하이라이트 기능을 제공하여 검수 편의성을 높입니다.
외부 시스템 연동 범위 및 우선순위(Open Question): 국내 법률 시장에서 사용되는 주요 사건 관리 솔루션과의 API 연동 우선순위를 결정해야 합니다. 초기에는 범용적인 PDF/이미지 업로드 방식에 집중하되, Professional 플랜 사용자를 위해 Clio 및 국내 주요 법률 CRM과의 데이터 동기화 규격을 3주차에 확정합니다.
변호사 커뮤니티의 보수성 및 진입 장벽: 신규 IT 툴에 대한 거부감을 줄이기 위해 대한변협 등 공식 단체의 인증이나 초기 핵심 사용자 50인의 실제 합의금 증액 성공 사례(Success Story)를 확보하여 마케팅 자산으로 활용해야 합니다.
기술 스택의 한계 및 확장성: 현재 AWS Textract와 GPT-4o 기반의 파이프라인이 복잡한 의료 용어와 질병코드(ICD-10) 간의 매핑을 95% 이상의 정확도로 수행할 수 있다는 기술적 가정을 바탕으로 하며, 인식 오류 발생 시 사용자가 즉시 수정하고 이를 학습 데이터로 재활용하는 피드백 루프를 구축합니다.

6. 사업 관점 메모 (투자/사업 검토용)

가격 정책과 수익화

본 솔루션은 소규모 법률 사무소의 운영 효율성을 극대화하기 위해 ‘구독형 SaaS(Software as a Service)’ 모델을 채택하며, 사건 처리량에 따른 계층형 요금제를 운영한다.
Standard 플랜 (월 290,000원, 부가세 별도): 월 최대 10건의 의료 기록 분석 및 합의금 산정 보고서 생성을 제공하며, 1인 변호사 사무소의 평균 월간 수임 건수를 커버하는 입문용 요금제이다.
Professional 플랜 (월 590,000원, 부가세 별도): 월 최대 30건의 분석을 제공하며, Clio 등 외부 법률 CRM API 연동 기능과 보험사별 협상 벤치마크 데이터 열람 권한을 포함하여 다수의 사건을 처리하는 사무소에 최적화되어 있다.
초과 사용료 (Pay-as-you-go): 각 플랜의 기본 제공 건수 초과 시, 건당 35,000원의 추가 비용을 부과하여 업무량이 급증하는 달에도 유연한 대응이 가능하도록 설계한다.
무료 체험 및 온보딩: 신규 가입 고객에게 7일간의 무료 체험 기간 또는 최대 2건의 실제 사건 분석 리포트를 무료로 제공하여 OCR 인식률과 산정 로직의 신뢰도를 직접 검증하게 한다.
연간 결제 할인 프로모션: 1년 단위 선결제 시 총 구독료의 20% 할인을 적용(Standard 기준 연 2,784,000원)하여 고객 유지율(Retention)을 높이고 초기 운영 자금을 확보한다.
데이터 기반 부가 수익 모델: 향후 누적된 합의 데이터를 가공하여 특정 보험사 및 상해 부위별 ‘최적 합의 시점 및 금액 예측 프리미엄 리포트’를 건당 100,000원에 별도 판매하는 업셀링(Up-selling) 전략을 실행한다.
결제 및 정산 인프라 구축: 토스페이먼츠(Toss Payments) API를 연동하여 정기 결제 및 법인카드 세금계산서 자동 발행 시스템을 구축하며, 미결제 시 서비스 이용을 즉시 제한하는 자동화된 라이선스 관리 로직을 구현한다.

시장 근거와 가격 타당성

시장 증거 1: 2023년 대한변협 법률테크 리포트에 따르면, 국내 변호사의 72%가 업무 효율화를 위한 AI 도입에 긍정적이며, 특히 의료 소송 분야의 비정형 문서 정리 자동화 수요가 가장 높은 것으로 나타났습니다.
시장 증거 2: 1인 변호사 대상 심층 인터뷰 결과, 사건 1건당 의료 기록 분석 및 엑셀 정리에 평균 5~8시간이 소요되며, 이 과정에서 발생하는 휴먼 에러로 인해 보험사 협상 시 합의금이 과소 산정되는 사례가 연간 수임 건수의 약 15%에 달한다는 실질적 고충을 확인했습니다. 특히 KCI 연구에 따르면 자동차보험의 의료 제공 의향 점수(78.7점)가 건강보험 및 산재보험 대비 가장 낮게 나타나, 정밀한 기록 분석을 통한 적극적인 권익 보호가 필수적인 상황입니다(KCI, 2023).
경쟁사 가격 비교: 범용 OCR 솔루션(예: CLOVA OCR)은 페이지당 과금 방식으로 대량 문서 처리 시 월 10~20만 원의 비용이 발생하나 의료 특화 분석 기능이 전무합니다. 또한 UiPath와 같은 엔터프라이즈 RPA 솔루션은 보험금 청구 오류 해결을 위한 지능형 자동화를 제공하지만, 백엔드 시스템 통합 및 높은 구축 비용으로 인해 소규모 법률 사무소가 도입하기에는 진입 장벽이 높습니다(UiPath).
가격 책정 근거: 본 솔루션의 Standard 플랜(월 290,000원)은 사무장 고용 비용(월 300만 원 이상)의 약 10% 수준으로 책정되어, 월 10건 내외의 사건을 처리하는 소규모 법률 사무소의 고정비 부담을 최소화하면서도 인적 자원 이상의 정확도를 제공합니다.
ICP 정당화: 1인 변호사의 시간당 기회비용을 20만 원으로 산정할 때, 주당 15시간의 기록 정리 시간을 1.5시간으로 단축함으로써 월간 약 1,000만 원 이상의 시간 가치를 창출하여 월 29만 원의 구독료는 충분한 지불 용의성(WTP)을 확보합니다.
수익성 증명: 데이터 기반 상해 급수 정밀 판정을 통해 보험사 제시액 대비 평균 15% 이상의 합의금 증액이 가능합니다. 특히 ‘2024 자동차보험진료수가 기준’에 따른 12~14급 환자의 4주 경과 후 진단서 제출 의무화(발간등록번호 G000EI2-2024-57) 등 복잡한 행정 절차를 자동 관리하여, 단 1건의 누락 방지만으로도 1년치 구독료를 즉시 회수할 수 있는 강력한 ROI를 제공합니다.
빌드 결정: 초기 시장 진입 시 건당 과금 대신 월간 구독 모델을 채택한 이유는, 변호사 사무소의 예측 가능한 비용 관리를 지원하기 위함입니다. 이는 SI 업체의 개별 구축 방식보다 유지보수가 용이하며(외주 개발사 견적 산정 사례), 지속적인 데이터 축적을 통해 ‘보험사별 협상 벤치마크’라는 데이터 해자를 조기에 구축하는 데 유리합니다.
확장 전략: Professional 플랜(월 590,000원)은 Clio 등 기존 법률 CRM과의 API 연동을 포함하여 데이터 입력 중복을 제거함으로써, 단순한 분석 도구를 넘어선 ‘디지털 사무장’으로서의 포지셔닝을 확고히 하고 객단가(ARPU)를 높이는 전략을 취합니다.

투자 대비 효과(ROI) 시나리오

본 솔루션의 경제적 가치는 변호사의 단순 반복 업무 제거를 통한 기회비용 절감과 데이터 기반 협상을 통한 합의금 증액 수수료 수입 극대화에 기반합니다. 특히 최근 보험업권의 데이터 거래 및 결합 활용이 활발해짐에 따라(보험연구원, 2024), 객관적 데이터에 기반한 손해액 산정의 중요성이 커지고 있습니다. 핵심 산식은 ROI(%) = ((총 편익 - 도입 비용) / 도입 비용) * 100으로 정의하며, 총 편익은 ‘절감된 업무 시간의 금전적 가치’와 ‘증액된 합의금에 따른 추가 수수료’의 합산입니다.
수치적 가정 1(시간 절감): 변호사 1인이 직접 수행하던 주당 평균 15시간의 의료 기록 분석 및 데이터 입력 업무를 1.5시간으로 90% 단축하며, 변호사의 시간당 기회비용을 보수적으로 150,000원으로 산정할 때 월간 약 810만 원(54시간 절감 * 15만 원)의 인건비 대체 효과가 발생합니다.
수치적 가정 2(수익 증대): 적극손해, 소극손해, 정신적 위자료 등 복잡한 산정 항목(아이코노미유, 2023)을 자동 추출하고, 누락된 진단명 및 상해 급수 조정을 통해 평균 합의금을 기존 대비 15% 증액시킵니다. 과실비율 및 치료비 산정 기준의 단계별 분석(봄블로그, 2023)을 통해 평균 합의금 2,000만 원 기준 건당 300만 원의 추가 합의금을 도출하며, 변호사 성공 수수료 20% 적용 시 건당 60만 원의 직접적인 매출 증대 효과를 얻습니다. 또한, 금융 빅데이터 플랫폼의 연령대별 가입 현황 등 외부 데이터를 결합하여 더욱 정교한 협상 전략 수립이 가능합니다.
수치적 가정 3(도입 비용): Standard 플랜 기준 월 290,000원(부가세 별도)의 구독료를 지불하며, 이는 월 10건의 사건 처리 시 건당 비용이 29,000원에 불과하여 사무장 고용 비용(월 300만 원 이상) 대비 약 90% 이상의 고정비 절감 효과를 제공합니다.
민감도 분석 및 하방 시나리오: 비정형 수기 기록의 가독성 문제로 OCR 인식률이 70% 이하로 떨어져 수동 재검토 시간이 예상보다 3배 증가하고 합의금 증액 효과가 5%에 그치는 최악의 시나리오에서도, 월간 총 편익은 약 350만 원 수준으로 유지되어 월 구독료 대비 약 1,100%의 ROI를 방어할 수 있습니다.
투자 회수 기간(Payback Period): 본 솔루션 도입 후 단 1건의 사건에서 합의금 증액 수수료(60만 원)가 발생하거나, 약 2시간의 업무 시간만 절감되어도 월 구독료를 상회하는 편익이 발생하여 즉각적인 투자 회수가 가능합니다.

7. 시각 자료 (프로토타입/와이어프레임)

프로토타입 (멀티페이지)

프로토타입 산출물이 없습니다.

8. 검증 메모 및 한계

핵심 가정 점검(반대 시나리오 포함)

핵심 가정

변호사가 자동화된 산정 결과의 법적 책임을 감수하면서까지 외부 툴의 데이터를 신뢰하고 구매할 것이다. (분류: 관성)
보험사의 비공개 지급 관행 데이터를 외부에서 유의미한 수준으로 구조화하여 독점적 해자를 구축할 수 있다. (분류: 법제)
비정형 의료 기록의 OCR 추출 및 수동 검수 프로세스가 4주라는 단기간 내에 법적 분쟁에 사용될 수준의 정확도를 확보할 수 있다. (분류: 물리)

전복 관점

변호사는 자동화 툴의 오류로 인한 의뢰인 배상 책임 리스크를 회피하기 위해 도입을 거부하거나 수동 재검증에 더 많은 비용을 쓴다.
보험사는 데이터 기반의 전략적 접근을 감지하는 즉시 지급 가이드라인을 변경하거나 알고리즘 기반 협상을 원천 차단한다.
변호사 커뮤니티는 폐쇄적이며 검증되지 않은 기술을 사용하는 동료를 전문성 부족으로 간주하여 시장 진입 장벽을 높인다.

재구성

변호사가 데이터를 무기로 보험사와 협상한다는 관성을 제거하면, 이 솔루션은 변호사를 보조하는 도구가 아니라 변호사의 중개 역할을 제거하는 ‘피해자 직접 합의 엔진’으로 전복된다. 데이터 해자는 변호사의 전문성을 강화하는 것이 아니라, 보험사가 제시하는 금액의 허점을 즉각 폭로하는 ‘대중용 반박 시스템’으로 재정의되어 변호사 수임 시장 자체를 붕괴시키는 구조로 재편된다.

자주 묻는 질문(FAQ)

Q1. 이 아이디어의 첫 유료 고객은 누구인가요?

핵심 타겟 페르소나: 매월 10건 이상의 교통사고 및 산재 사건을 신규 수임하며, 별도의 사무장 없이 직접 의료 기록을 검토하고 합의금을 산정해야 하는 1인 또는 5인 이하 소규모 법률 사무소의 대표 변호사.

Q2. 4주 최소 기능 버전(MVP)에서 반드시 구현할 범위는 어디까지인가요?

MVP의 핵심 목표는 비정형 의료 기록의 데이터화와 상해 급수 자동 산정의 정확도를 95% 이상 확보하여 변호사의 초기 검토 시간을 90% 단축하는 데 집중한다.

Q3. 1인 개발자가 단독으로도 실행 가능한가요?

주차: 개발 환경 구축 및 OCR 파이프라인 최적화. AWS Textract를 기반으로 진단서, 소견서, 진료비 세부내역서 등 3종 핵심 문서의 텍스트 추출 엔진을 구축하며, 수기 기록 인식률 향상을 위한 이미지 전처리(Denoising, Deskewing) 로직을 개발합니다. (담당자: 1인 풀스택 엔지니어 / 산출물: OCR 처리 백엔드 API / 종료 조건: 샘플 의료 문서 50장 대상 텍스트 추출 정확도 85% 이상 달성)

Q4. 가격과 수익화 가설은 어떻게 검증하나요?

본 솔루션은 소규모 법률 사무소의 운영 효율성을 극대화하기 위해 ‘구독형 SaaS(Software as a Service)’ 모델을 채택하며, 사건 처리량에 따른 계층형 요금제를 운영한다.

Q5. 실패 가능성이 가장 큰 지점은 무엇인가요?

핵심 리스크는 ‘비정형 수기 의료 기록의 OCR 인식률 저하 시 수동 검수 인력 비용으로 인한 마진율 하락 가능성’이며, 이 항목을 먼저 검증하지 않으면 빌드 성공률이 급격히 떨어집니다.

Q6. 지금 바로 개발해도 되나요?

현재 판정은 PASS(94점)이며, 4주 MVP 착수 가능한 실행 스펙이 포함되어 있습니다.