Actions
기능 #672
진행중기능 #696: 더한섬 ingestion 및 snapshot 기준 구현
더한섬 수집 Job 설계 및 정규화 로직 구현
기능 #672:
더한섬 수집 Job 설계 및 정규화 로직 구현
시작일:
2026/06/30
완료일:
진척도:
0%
추정시간:
설명
목적
- 더한섬 EP를 읽어 신규 인덱스용 canonical payload로 변환하는 독립 수집 경로를 구현한다.
범위
- 더한섬 feed URL/env 이름 분리
- TSV 파서 및 인코딩 처리
- 가격, URL, 이미지, 카테고리, gender, productType, keyword 정규화
- 더한섬 고유 필드 보존 여부 반영
- Hmall ingestion 코드와 충돌하지 않는 별도 job 구성
산출물
- 더한섬 ingestion job 코드
- 정규화 단위 테스트
- 실행 설정 및 환경 변수 문서
수용 기준
- 샘플 TSV 기준 정상 행이 canonical payload로 변환된다.
- 필수 필드 누락, 가격 0, 비정상 URL 등 예외 정책이 테스트로 검증된다.
- Hmall 수집 경로와 별개로 실행 가능하다.
선행/의존 관계
- 더한섬 EP 데이터 프로파일링 및 필드 매핑 정의
- 더한섬 신규 Search index schema 설계
Actions