-
힙_이중우선순위큐_Python프로그래머스 문제풀이 2021. 6. 16. 11:50728x90
문제 설명
이중 우선순위 큐는 다음 연산을 할 수 있는 자료구조를 말합니다.
명령어수신 탑(높이)
이중 우선순위 큐가 할 연산 operations가 매개변수로 주어질 때, 모든 연산을 처리한 후 큐가 비어있으면 [0,0] 비어있지 않으면 [최댓값, 최솟값]을 return 하도록 solution 함수를 구현해주세요.
제한사항
- operations는 길이가 1 이상 1,000,000 이하인 문자열 배열입니다.
- operations의 원소는 큐가 수행할 연산을 나타냅니다.
- 원소는 “명령어 데이터” 형식으로 주어집니다.- 최댓값/최솟값을 삭제하는 연산에서 최댓값/최솟값이 둘 이상인 경우, 하나만 삭제합니다.
- 빈 큐에 데이터를 삭제하라는 연산이 주어질 경우, 해당 연산은 무시합니다.
입출력 예
operationsreturn
입출력 예 설명
16을 삽입 후 최댓값을 삭제합니다. 비어있으므로 [0,0]을 반환합니다.
7,5,-5를 삽입 후 최솟값을 삭제합니다. 최대값 7, 최소값 5를 반환합니다.
접근방법
heapq로 우선순위 큐를 구현한다.
빈 리스트에 heapq 메소드를 이용해 값을 관리하면 리스트는 heap 속성을 만족하게 된다(defult: min)
주어진 배열은 문자열이기에 명령과 값으로 분류 하고, min_heap이 int 요소를 갖게 하기 위해
str data => int data로 변환해준다.
최댓값을 삭제하는 경우
min_heap의 맨 마지막 인덱스가 최대값임을 이용
최솟값을 삭제하는 경우
heapq 는 기본적으로 min_heap이기에 heappop()로 가장 맨 앞의 인덱스값이 최솟값이다.
이때 data를 str 타입으로 사용하면 ㄱㄴㄷ 순과 같이 사전적 의미로 정렬 + 오름차순이 기본 값이 되기 때문에
-45 보다 -645가 더 큰값으로 인식하게 된다.
우선순위 큐에 데이터 삽입
만약 heap이 비어있는 경우를 고려해주었다.
2, 4, 6테스트 케이스 실패
import heapq def solution(operations): answer = [] min_heap = [] for value in operations: order, data = value.split() data = int(data) if order == "D" and data == 1: if min_heap: # print('===555') min_heap.pop(-1) elif order == "D" and data == -1: heapq.heappop(min_heap) else: heapq.heappush(min_heap, data) if not min_heap: return [0,0] return min_heap[-1], min_heap[0]
개선
먼저 테스트 케이스 2, 4의 경우
질문을 참고하여 보니
- 빈 큐에 데이터를 삭제하라는 연산이 주어질 경우, 해당 연산은 무시합니다.
라는 조건을 최댓값 삭제하는 경우만 적용해주었었다. 최솟값도 어짜피 삭제인데 말이다.
# 최댓값 삭제 if order == "D" and data == 1: if min_heap: min_heap.pop(-1) # 최솟값 삭제 elif order == "D" and data == -1: if min_heap: heapq.heappop(min_heap)
개선_2
여기서 굉장히 중요한 내용을 학습할 수 있었다.
힙 구조는 우선순위가 높은 값이 루트 노드에 위치하게 되는 것을 보장하는 자료구조이다.
여기서는 어디에도 맨 마지막 리프 노드(요소)가 최댓값임을 보장하지 않는다는 것이었다.
힙 구조는 가장 우선순위가 높은 값이 먼저 pop 되는 것을 보장하는 자료구조이다.
pq[0]가 가장 우선순위가 높은 값(가장 작은값)인 것은 맞지만, 나머지 값에 대한 정렬은 보장하지 않는다는 의미이다. (프로그래머스 질문 답변: softmare님)그냥 당연하게 맨 마지막 요소가 최댓값이지라는 생각을 가지고 있었었다.
힙 속성을 되새겨보면 (참고: 힙_1 :: muntari Log (tistory.com))
1. 형태 속성 : 힙은 완전 이진 트리여야 한다.
2. 힙 속성 : 모든 노드의 데이터는 자식 노드들의 데이터보다 크거나 작아야 한다.import heapq pq = [] heapq.heappush(pq, 1) heapq.heappush(pq, 3) heapq.heappush(pq, 5) heapq.heappush(pq, 2) heapq.heappush(pq, 4) print(pq) # [1, 2, 5, 3, 4]
루트 노드 1은 최솟값임이 확실히 보장되나 모든 노드의 데이터는 자식 노드보다 작기만 하면 된다.
즉, 완전 이진 트리이면서 위 조건을 만족해야하기에 아래와 같은 트리 구조를 갖는다.
마지막 인덱스 4는 최댓값이라는 보장이 없다.
1 2 5 3 4
1. min_heap[-1]이 항상 최대값이라는 보장이 없다 =>
따라서 최댓값 삭제부분도 수정하고 리턴 값도 수정하였다.
import heapq def solution(operations): min_heap = [] for value in operations: order, data = value.split() data = int(data) # 최댓값 삭제 if order == "D" and data == 1: if min_heap: max_value = max(min_heap) min_heap.remove(max_value) # 최솟값 삭제 elif order == "D" and data == -1: if min_heap: heapq.heappop(min_heap) # 큐 데이터 삽입 else: heapq.heappush(min_heap, data) # heap이 비어있는 경우 if not min_heap: return [0, 0] return max(min_heap), min_heap[0]
시간복잡도
배열의 길이를 N이라 할때
힙은 N개의 노드와 lgN의 높이를 갖는다.
배열은 큐가 수행할 연산을 나타냄 => O(N)
split() => 주어진 문자열 모두 탐색 O(N)
max() => O(N)
remove() => O(N)
heappop() => O(lgN)
heappush() => O(lgN)
총시간복잡도는 O(N^2)?
우선순위 큐를 사용하는 이유는 삽입과 삭제를 O(N)이 아닌 O(lgN)의 효율로 사용하기 위함이다.
종합해볼때 N^2로 예상되는데.. 보시다시피 효율이 굉장히 좋다.
그냥 문제에서 원한 답을 찾아서 그런건지 모르겠다.
추후 질문 답변을 확인해보도록 하자
728x90'프로그래머스 문제풀이' 카테고리의 다른 글
기능개발_2LV_스택/큐(Python/JavaScript) (0) 2021.06.26 완주하지 못한 선수(Python, Js) (0) 2021.06.22 정렬_H Index_Python (0) 2021.06.13 힙_디스크 컨트롤러_Python (1) 2021.06.12 해시_베스트 앨범_Python (0) 2021.06.11