Actions
기능 #673
완료됨기능 #696: 더한섬 ingestion 및 snapshot 기준 구현
더한섬 snapshot diff 및 run metadata 분리 구현
기능 #673:
더한섬 snapshot diff 및 run metadata 분리 구현
시작일:
2026/06/30
완료일:
2026/07/02
진척도:
100%
추정시간:
설명
목적
- Hmall과 독립적인 더한섬 증분 업데이트 기준을 확보한다.
범위
- 더한섬 전용 snapshot storage/container/blob prefix 적용
- content_hash 대상 필드 확정 및 계산
- 이전 snapshot 대비 UPSERT/DELETE 산출
- run metadata 저장 및 실패 metadata 기록
산출물
- 더한섬 snapshot diff 구현
- run metadata schema
- 최초 실행/동일 데이터 재실행/삭제 감지 테스트
수용 기준
- 최초 실행 시 전체 유효 데이터가 UPSERT로 산출된다.
- 동일 데이터 재실행 시 변경 이벤트가 발생하지 않는다.
- 이전 snapshot에는 있고 현재 feed에는 없는 id가 DELETE로 산출된다.
- snapshot과 metadata가 Hmall 저장 위치와 분리된다.
선행/의존 관계
- 더한섬 수집 Job 설계 및 정규화 로직 구현
minho lee이(가) 약 12시간 전에 변경
참고: snapshot diff·run metadata 구현 본체는 #672 커밋(https://ap-northeast-2.console.aws.amazon.com/codesuite/codecommit/repositories/aisearch-ms/commit/d54f5e870bdeacbe13f5dcc96a2e66d253b05a4b?region=ap-northeast-2)에 선반영되었으며, 본 일감에서는 수용 기준 검증 테스트 3건(최초 실행 전건 UPSERT, 동일 데이터 재실행 무이벤트·hash 결정성, 실패 metadata blob 이름 규칙)과 run metadata schema 문서화를 보완함. 검증: test_thehandsome_ingestion.py 12건, 전체 스위트 43건 통과.
Actions