프로젝트

일반

사용자정보

Actions

기능 #673

완료됨

기능 #696: 더한섬 ingestion 및 snapshot 기준 구현

더한섬 snapshot diff 및 run metadata 분리 구현

기능 #673: 더한섬 snapshot diff 및 run metadata 분리 구현

minho lee이(가) 2일 전에 추가함. 약 12시간 전에 수정됨.

상태:
완료
우선순위:
보통
담당자:
시작일:
2026/06/30
완료일:
2026/07/02
진척도:

100%

추정시간:

설명

목적

  • Hmall과 독립적인 더한섬 증분 업데이트 기준을 확보한다.

범위

  • 더한섬 전용 snapshot storage/container/blob prefix 적용
  • content_hash 대상 필드 확정 및 계산
  • 이전 snapshot 대비 UPSERT/DELETE 산출
  • run metadata 저장 및 실패 metadata 기록

산출물

  • 더한섬 snapshot diff 구현
  • run metadata schema
  • 최초 실행/동일 데이터 재실행/삭제 감지 테스트

수용 기준

  • 최초 실행 시 전체 유효 데이터가 UPSERT로 산출된다.
  • 동일 데이터 재실행 시 변경 이벤트가 발생하지 않는다.
  • 이전 snapshot에는 있고 현재 feed에는 없는 id가 DELETE로 산출된다.
  • snapshot과 metadata가 Hmall 저장 위치와 분리된다.

선행/의존 관계

  • 더한섬 수집 Job 설계 및 정규화 로직 구현

minho lee이(가) 2일 전에 변경 Actions #1

  • 상위 일감을(를) #696(으)로 지정되었습니다.

minho lee이(가) 약 13시간 전에 변경 Actions #2

  • 담당자을(를) minho lee(으)로 지정되었습니다.

minho lee이(가) 약 12시간 전에 변경 Actions #3

  • 완료일을(를) 2026/07/02(으)로 지정되었습니다.
  • 상태을(를) 신규에서 완료(으)로 변경되었습니다.
  • 진척도을(를) 0에서 100(으)로 변경되었습니다.

minho lee이(가) 약 12시간 전에 변경 Actions #4

main 반영 커밋: https://ap-northeast-2.console.aws.amazon.com/codesuite/codecommit/repositories/aisearch-ms/commit/0b42c0bb4f6e14ce238ee4e2563574d08e9c1e4a?region=ap-northeast-2

참고: snapshot diff·run metadata 구현 본체는 #672 커밋(https://ap-northeast-2.console.aws.amazon.com/codesuite/codecommit/repositories/aisearch-ms/commit/d54f5e870bdeacbe13f5dcc96a2e66d253b05a4b?region=ap-northeast-2)에 선반영되었으며, 본 일감에서는 수용 기준 검증 테스트 3건(최초 실행 전건 UPSERT, 동일 데이터 재실행 무이벤트·hash 결정성, 실패 metadata blob 이름 규칙)과 run metadata schema 문서화를 보완함. 검증: test_thehandsome_ingestion.py 12건, 전체 스위트 43건 통과.

Actions

내보내기 PDF Atom