python, pyspark에서 bulk나 many 등으로 100행을 한 번에, 혹은 동시다발적으로 insert 시킬 때 중간 하나의 행만 update시킬 수 있는 방법이 있을까요?
조회수 389회
실제로는 몇 천 행정도 되는데 예를 들어 100행을 bulk insert나 pyspark sql context 등으로 한 번에 insert 시킨다 했을 때 중간에 pk 값 중복으로 insert가 아닌 update해야한다고 했을 때 100행을 for문으로 하나씩 insert시키다가 중복 되는 것만 update하는 방법 말고 더 좋은 방법은 뭐가 있을까요?
댓글 입력