lolodex 이메일 인텐트 분류 기능 PR 리뷰 및 보안·성능 개선 사항 요약

LOLODEX 이메일 인텐트 분류 기능 PR 리뷰 및 보안·성능 개선 사항 요약

December 12, 2025 5 min read

Executive Summary

PR는 이메일 인텐트 분류/처리 기능을 추가하며 전반적으로 구조는 우수함.
미등록 사용자 이메일을 처리하는 치명적 보안 문제가 발견되어 머지 전 수정이 필요함.
태스크 정렬 순서 레이스 컨디션, 입력 검증 부재, 비효율 쿼리, 레이트 리밋 부재 등 성능·안전성 이슈가 있음.
OpenAI API 사용 방식, JSON 파싱 등에서 잠재적 버그가 있음.
전반 평가는 긍정적이나, 보안/테스트/에러 처리 표준화 보완이 요구됨.

Key Points

PR 개요

기능: 이메일 인텐트 분류 및 처리 (save_note, ask_question, add_todo).
아키텍처: classifier, actions, questionAnswerer, taskExtractor, emailSender 등 서비스로 분리.
모델 구성: gpt-5-nano(분류/선택) + gpt-5.1(답변) 2단계 처리로 비용 효율성 확보.
보안: userId 기반 소유권 체크, OpenAI/Postmark 미설정 시 기본 동작으로 폴백.
비동기 처리: queueMicrotask 사용으로 웹훅 응답 블로킹 방지.
테스트: 3가지 인텐트 타입을 모두 커버하는 수동 통합 테스트 스크립트 제공.

강점

관심사의 명확한 분리와 서비스 구조화가 잘 되어 있음.
보안 의식 있는 설계(사용자 소유권 필터링, PII 미노출 로그).
OpenAI/Postmark 사용 불가 시에도 서비스가 깨지지 않는 폴백 처리.

치명적 이슈 (Must Fix)

1. Postmark 라우트 사용자 인증 누락 (HIGH)

위치: backend/src/routes/postmark.js:48-60.
현재 동작:
- getUserIdByEmail(fromEmail) 호출 후 userId가 없어도 계속 처리 진행.
- 미등록 사용자의 이메일도 AI 처리 로직을 통과함.
위험:
- 미등록 사용자가 OpenAI 크레딧을 소모.
- Abuse/DoS 공격 벡터 가능.
- 권한 없는 발신자의 이메일까지 처리.
권장 수정:
- userId가 없으면 조기 리턴:

2. 태스크 정렬 순서 레이스 컨디션 (MEDIUM)

위치: backend/src/services/emailActions.js:159-173.
현재 로직:
문제:
- 여러 이메일이 동시에 도착하면 동일한 maxSortOrder 기준으로 생성되어 sort_order 중복 발생 가능.
권장 수정:
- 트랜잭션 + 행 단위 락 사용.
- 혹은 루프 내부에서 최신 max 값 재조회.
- 또는 DB 시퀀스 사용.

3. 입력 검증 부족 (MEDIUM)

위치: backend/src/services/emailActions.js:128-130.
현재:
문제:
- 태스크 제목 길이, 내용에 대한 명시적 검증 없음.
- 악성/비정상 데이터가 그대로 저장될 수 있음.
권장 수정:

성능 및 효율성 이슈

4. Question Answerer의 N+1 쿼리 패턴

위치: backend/src/services/questionAnswerer.js:78-84.
현재:
- 최대 500개 노트 조회 후, 관련 노트 id에 대해 다시 DB 조회:
문제:
- 동일 데이터에 대해 중복 쿼리 발생.
권장:
- 최초 조회 결과를 메모리에 캐싱하고, 그 안에서 필터링.

5. 레이트 리밋 부재

문제:
- 웹훅 엔드포인트에 레이트 리밋이 없어 다음 위험 존재:
  - 과도한 OpenAI API 호출.
  - 이메일 폭탄 공격.
  - 리소스 고갈.
권장:
- 사용자 단위 레이트 리밋 도입.

6. 토큰 오버플로우 위험

위치: backend/src/services/questionAnswerer.js:44 (limit: 500).
현재:
- 최대 500개 노트, 각 요약 최대 300자 전송.
- 상황에 따라 컨텍스트 윈도우 초과 가능.
권장:
- 토큰 수 대략 계산 후 제한 조정.
- 페이지네이션/청킹 전략 도입.
- 모든 노트를 보내기보다 의미 기반 검색(semantic search) 고려.

잠재적 버그

7. OpenAI API 사용 방식 오류 가능성

위치: backend/src/services/emailClassifier.js:37.
현재:
문제:
- 표준 OpenAI SDK는 chat.completions.create({ messages }) 패턴 사용.
- responses.create와 input 사용은 커스텀/구버전 API가 아닌 이상 실패 가능.
조치:
- 실제 사용하는 클라이언트/SDK 사양 재확인.
- 표준 SDK 사용 시 적절한 메서드로 수정.

8. 취약한 JSON 파싱 폴백 로직

위치: backend/src/services/emailClassifier.js:104-113.
현재:
- 응답 텍스트에 intent 문자열이 포함되어 있는지만 검사:
문제:
- 모델의 설명/추론 부분에 단어가 등장하는 것만으로 잘못 분류될 수 있음.
권장:
- 구조화된 JSON 포맷을 모델에게 강제.
- 명확한 키 기반 파싱 사용.

코드 품질 및 베스트 프랙티스

9. 에러 처리 패턴 불일치

예:
- extractTasksFromEmail: { tasks, error } 반환.
- sendEmail: { success, error } 반환.
- answerQuestion: 항상 answer만 반환, 에러 필드 없음.
문제:
- 서비스 간 에러 처리 방식이 통일되어 있지 않아 유지보수성 저하.
권장:
- 공통 에러 처리 패턴(throw vs. result object) 정하고 서비스 전반에 적용.

10. 매직 넘버 상수화 필요

현재 하드코딩 예:
- limit: 500 (노트 수).
- slice(0, 300) (요약 프리뷰 길이).
- slice(0, 10) (관련 노트 최대 개수).
- slice(0, 20) (이메일당 태스크 최대 개수).
권장:
- 파일 상단에 명명된 상수로 추출:

11. 타입 문서화 부족

문제:
- JSDoc는 존재하나, 특히 AI 응답 구조 등 복잡 객체 타입이 불완전.
권장:
- AI 응답 스키마, 내부 DTO 등에 대한 JSDoc/타입 정의 보강.

12. 테스트 커버리지 한계

현재:
- 수동 통합 테스트 스크립트 위주.
부족한 부분:
- 개별 서비스 단위 테스트.
- OpenAI/Postmark 모킹.
- 엣지 케이스(빈 응답, 잘못된 JSON 등) 테스트.
권장:
- 단위 테스트 추가.
- 주요 외부 의존성 모킹/스텁 도입.

CLAUDE.md 보안 가이드라인 정합성

잘 지켜진 부분

인증된 세션에서 유도한 userId 사용.
question answerer에서 userId 기반 필터링.
로그에 ID/메타데이터만 기록하고 PII 노출 없음.

개선 필요한 부분

“기본 거부(deny by default)” 원칙 위반:
- userId 없이도 이메일 처리 진행.
발신자 이메일과 인증된 사용자 일치 여부 검증 누락.
queueMicrotask로 처리되는 백그라운드 작업에서 재인증/재검증 없음.

종합 권장 사항

머지 전 반드시 수정해야 할 사항

미등록 사용자 이메일 거부 및 명확한 인가 체크 추가.
태스크 sort_order 레이스 컨디션 해결.
OpenAI API 사용 방식/엔드포인트가 실제 SDK와 일치하는지 검증 및 수정.

높은 우선순위 개선

사용자 단위 레이트 리밋 도입.
태스크 제목 등 입력 값 검증/정제 로직 추가.
노트 조회 중복 쿼리 제거 및 성능 최적화.

있으면 좋은 개선

매직 넘버를 명명된 상수로 추출.
외부 의존성을 모킹한 단위 테스트 추가.
서비스 간 에러 처리 패턴 표준화.
자주 묻는 질문/노트에 대한 캐싱 전략 검토.

최종 평가

코드 품질: 7.5 / 10.
보안: 6 / 10 (인가 누락이 큰 감점 요인).
성능: 7 / 10.
테스트 커버리지: 5 / 10 (수동 테스트 위주).
결론: 변경 요청 필요(⚠️ Request changes).
- 아키텍처와 기능 설계는 탄탄하나, 인가 관련 보안 문제가 해결되기 전에는 머지 불가.
- 주요 보안/경합 조건/버그 이슈를 해결하면 코드베이스에 큰 도움이 될 기능으로 평가됨.