ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 해시_전화번호 목록_python
    프로그래머스 문제풀이 2021. 4. 19. 18:01
    728x90

    문제 설명

    전화번호부에 적힌 전화번호 중, 한 번호가 다른 번호의 접두어인 경우가 있는지 확인하려 합니다.
    전화번호가 다음과 같을 경우, 구조대 전화번호는 영석이의 전화번호의 접두사입니다.

    • 구조대 : 119
    • 박준영 : 97 674 223
    • 지영석 : 11 9552 4421

    전화번호부에 적힌 전화번호를 담은 배열 phone_book 이 solution 함수의 매개변수로 주어질 때, 어떤 번호가 다른 번호의 접두어인 경우가 있으면 false를 그렇지 않으면 true를 return 하도록 solution 함수를 작성해주세요.

    제한 사항

    • phone_book의 길이는 1 이상 1,000,000 이하입니다.
      • 각 전화번호의 길이는 1 이상 20 이하입니다.
      • 같은 전화번호가 중복해서 들어있지 않습니다.

     

     


    문제 접근 방법

    가능한 카테고리에 맞는 방법으로 해시를 이용해 문제를 풀고자 하였다.

    1. collections의 Counter 객체를 이용해하려 하였으나 순서에 상관없이 데이터를 저장하고 불러오면 될 것 같았기에 set를 사용하였다.

    in 연산자를 이용해 포함 여부를 확인하려 하였으나 테스트 케이스를 통과하지 못해 startswith() 메서드를 사용해 특정 문자열이 포함돼있는지로 확인하였다.

    2. 해시 값을 굳이 비교할 필요가 없어서 로직 수정

    3. for 반복문 로직 수정

    4. 해시를 이용한 풀이가 아닌 배열을 이용한 풀이.


    1번 접근 => 효율성 테스트 통과 X

    def solution(phone_book):
        answer = True
        my_set = set(phone_book)
    
        for phone in phone_book:
            for key in my_set:
                hash_phone = hash(phone)
                hash_key = hash(key)
                if phone.startswith(key) and hash_phone != hash_key: 
                    answer = False # return False 로 바꾸면 효율이 좋아지긴 하나 효율성 테스트2개 탈락이다.
    
        return answer


    2. 로직 수정 => 효율성 테스트 2개 통과 X

    def solution(phone_book):
        answer = True
        my_set = set(phone_book)
    
        for phone in phone_book:
            for key in my_set:
                if phone.startswith(key) and phone != key: 
                    return False
                    
        return answer


    3. 같은 반복문인데 startswith를 사용하지 않고 문자열을 추가하며 비교하는 방식으로 하니 효율이 굉장히 좋았다.

    def solution(phone_book):
        answer = True
        hash_map = set(phone_book)
        for phone_number in phone_book:
            temp = ""
            for number in phone_number:
                temp += number
                if temp in hash_map and temp != phone_number:
                    answer = False
        return answer


    4. 해시를 사용하지 않은 풀이 (개인적으로 해시로 풀고싶었지만 이 방법도 찾았다!)

    def solution(phone_book):
        phone_book.sort()
        answer = True
        
        for number in range(0, len(phone_book)-1):
            if phone_book[number+1].startswith(phone_book[number]):
                return False
    
        return answer


    시간 복잡도 비교

    같은 2중 반복문을 사용했는데 왜이렇게 효율 차이가 나는 걸까

    그 이유는 startswith() 라는 메서드에 이지 않을까 짐작했었다.

    아래 표의 경우 O(n) + O(2n) => O(n^2)으로 추측된다. 여기서 중요한 점은 제한 사항에서 전화번호의 길이는 1 ~ 20으로 제한한다는 것이다. 따라서 phone_book의 1 ~ 1000000까지 주어지는 것에 비해 20으로 제한되는 점을 미루어 O(n)으로 생각할 수 있다고 한다.

    만약 20이라는 제한이 없었다면 시간 복잡도가 더 커지지 않았을까 생각한다.

    해당 메서드 또한 문자열 2가지 파라미터를 받아 반복하는 형태로 구현이 되어있어 O(n)의 시간 복잡도를 갖기 때문인데

    굳이 따지자면 in / not in 연산자 또한 O(n)이 아닌가.. 그렇다면 이유가 뭘까

    내 의견이 답이 아닐수도있다. 프로그래머스 커뮤니티 답글에 따른 나의 추측이지만

    for 반복문에서의 차이가 답이라고 생각한다.

    def solution(phone_book):
        answer = True
        my_set = set(phone_book)
    
        for phone in phone_book:
            for key in my_set:
                if phone.startswith(key) and phone != key: 
                    return False
                    
        return answer

     

    해당 경우가 특별한 케이스인데 보통 중첩 반복문은 O(n^2)으로 알고 있었다.

    하나 for 반복문이 O(n)이 아니라 특정 데이터에서 값을 가지고 오는 방식 때문에 O(n)이 었던 것이다.

    즉, for 반복문 =  O(n)이 아니라, 특정 데이터에서 값을 가져오는데 O(n)이었던 것이다.

    for 반복문 = O(n)이라 생각해오고 있었으며, 실제로 대다수가 O(n)이었다.

    하지만 아래는 phone_book 배열에서 가져오는데 O(n)이 걸리고 위의 식과는 다르게 가져온 phone_number라는 값을 이터레이터로 사용하여 문자열을 추가하는 방식으로 phone_number를 가지고 오는데 최악의 경우 20n (20글자 제한)이지 않을까 싶다.

    사실 이게 아니라고 한다면 800 -> 4~5로 줄어드는 이유를 찾기 어렵다..

    외부 반복문에서 가져온 값과 내부 반복문에서 또 다른 값을 가져오는 방식과

    외부 반복문에서 가져온 값을 내부 반복문에서 다시 사용할 때의 시간 복잡도 차이가 아닐까 생각한다.

    def solution(phone_book):
        answer = True
        hash_map = set(phone_book)
        for phone_number in phone_book:
            temp = ""
            for number in phone_number:
                temp += number
                if temp in hash_map and temp != phone_number:
                    answer = False
        return answer
    728x90
Designed by Tistory.