Data Structure Part1

통계학을 전공한 직후 데이터 분석 직군에서 일을 시작하면서 엄밀한 프로그래밍에 필요한 자료 구조와 알고리즘에 관하여 갈증 을 항상 느끼고 있었습니다. 이와 관련하여 반드시 알아야 할 자료 구조와 알고리즘을 차근히 사색하면서 정리하는 시간을 가지겠습니다. 이번 포스트에는 {Array, Queue, Stack, Linked List}에 대해 생각해보았습니다. 구체적인 구현 코드는 파이썬으로 작성하였습니다.

Queue

큐(Queue)는 데이터가 들어온 순서대로 접근 가능합니다. 즉 FIFO(First in, First Out) 구조입니다.
다음의 이미지를 통해 큐에 대하여 알 수 있습니다.

Queue https://www.baeldung.com/cs/types-of-queues¹

큐(Queue)의 다음 기능을 구현하면 다음과 같습니다.

dequeue : 큐 앞쪽의 값을 반환한 뒤 제거합니다.
enqueue : 큐 뒤쪽에 값을 추가합니다.
front : 큐 앞쪽의 값을 조회합니다.
Isempty : 큐 값이 Null인지 확인합니다.

class Queue(object):    
    def __init__(self):
        self.objs = []
    def __len__(self):
        return len(self.objs)
    def __repr__(self):
        return repr(self.objs)    
    def enqueue(self,item):
        self.objs.insert(0,item)
    def dequeue(self):
        value = self.objs.pop()
        if value is not None:
            return value
        else:
            print('Queue가 비워 있습니다.')
    def front(self):
        if self.objs:
            return self.objs[-1]
        else:
            print('Queue가 비워 있습니다.')
    def isEmpty(self):
        return not bool(self.objs)

예시를 통해 Class Queue가 잘 구현되었는지 확인해보겠습니다.

if __name__ == "__main__":
    queue = Queue()
    print('큐가 비워있나요? : {}'.format(queue.isEmpty()))
    print('큐에 11부터 19까지 순서대로 추가합니다.')
    for i in range(11,20,1):
        queue.enqueue(i)
    print('큐의 크기는 다음과 같습니다 : {}'.format(len(queue)))
    print('한 값을 큐에서 뽑습니다 : {}'.format(queue.dequeue()))
    print('다음에 뽑힐 값을 확인합니다 : {}'.format(queue.front()))
    print('최종적인 큐의 값은 다음과 같습니다 : {}'.format(queue))

결과값은 다음과 같습니다.

큐가 비워있나요? : True
큐에 11부터 19까지 순서대로 추가합니다.
큐의 크기는 다음과 같습니다 : 9
한 값을 큐에서 뽑습니다 : 11
다음에 뽑힐 값을 확인합니다 : 12
최종적인 큐의 값은 다음과 같습니다 : [19, 18, 17, 16, 15, 14, 13, 12]

Stack

스택(Stack)은 큐와 마찬가지로 데이터를 제한적으로 접근할 수 있습니다.
하지만 큐와 다르게 LIFO(Last In, First Out) 구조입니다.
스택의 이미지는 다음과 같습니다.

Stack https://www.tutorialspoint.com/data_structures_algorithms/stack_algorithm.htm²

스택의 다음 기능을 구현하면 다음과 같습니다.

push : 스택 맨 위에 값을 추가합니다.
pop : 스택 맨 아래 값을 반환하면서 제거합니다.
top : 스택 맨 아래 값을 조회합니다.
isempty : 스택의 값들이 비어 있는지 확인합니다.

class Stack:
    def __init__(self):
        self.objs = []
    def __len__(self):
        return len(self.objs)
    def __repr__(self):
        return repr(self.objs)
    def isempty(self):
        return not bool(self.objs)
    def push(self,item):
        self.objs.append(item)
    def pop_(self):
        val = self.objs.pop()
        if val is not None:
            return val
        else:
            print('스틱이 비워 있습니다.')
    def top(self):
        if self.objs:
            return self.objs[-1]
        else:
            print('스틱이 비워 있습니다.')

예시를 통해 Class Stack이 잘 구현되었는지 확인해보겠습니다.

if __name__ == "__main__":
    stack = Stack()
    print('스택이 비워있나요? : {}'.format(stack.isempty()))
    print('스택에 20부터 29까지 순서대로 추가합니다.')
    for i in range(20,30,1):
        stack.push(i)
    print('현재 스택의 값들은 다음과 같습니다 : {}'.format(stack))
    print('한 값을 스택에서 뽑습니다 : {}'.format(stack.pop_()))
    print('현재 남아 있는 스택의 값들은 다음과 같습니다 : {}'.format(stack))
    print('다음에 뽑힐 값을 확인합니다 : {}'.format(stack.top()))
    print('현재 남아 있는 스택의 크기는 다음과 같습니다 : {}'.format(len(stack)))

결과값은 다음과 같습니다.

스택이 비워있나요? : True
스택에 20부터 29까지 순서대로 추가합니다.
현재 스택의 값들은 다음과 같습니다 : [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]
한 값을 스택에서 뽑습니다 : 29
현재 남아 있는 스택의 값들은 다음과 같습니다 : [20, 21, 22, 23, 24, 25, 26, 27, 28]
다음에 뽑힐 값을 확인합니다 : 28
현재 남아 있는 스택의 크기는 다음과 같습니다 : 9

위의 예시를 통해 우리는 스택 구조가 LIFO(Last-in,First-out) Queue와 같은 구조임을 확인할 수 있습니다.
흥미로운 점은 프로세스를 실행할 때 기본적으로 스택 구조로 진행된다는 점입니다.
간단한 재귀 함수(Recursive Function)를 만들어 프로세스의 스택 구조를 확인해 보겠습니다.

Array

배열은 나열된 데이터를 인덱스에 대응하도록 구성한 데이터 구조입니다.
그래서 데이터를 순차적으로 저장할 수 있고 빠른 접근이 가능하지만, 데이터가 가변적일 경우 데이터 구조 특성상 미리 최대 길이를 지정해야 하므로 데이터의 추가 및 삭제가 어렵습니다.

Linked List

미리 길이를 지정해야 하는 Array와 다르게 연결 리스트(Linked List)는 산발적으로 분포되어 있는 데이터를 화살표로 연결하여 관리하는 데이터 구조입니다.
본래 연결 리스트는 C언어에서 사용한 주요한 데이터 구조입니다. 하지만 파이썬은 리스트 타입이 연결 리스트의 기능을 모두 지원합니다.
연결 리스트는 크게 노드(Node)들로 구성되어 있습니다.
노드는 다시 데이터 저장 단위로 구체적인 데이터값과 각 노드 안에서, 다음의 노드와의 연결 정보를 함축하고 있는 공간인 포인터(Pointer)로 이루어져 있습니다.
- 구조상 당연히 리스트의 마지막 포인터는 Null값입니다.

연결 리스트의 이미지를 살펴보면 다음과 같습니다.

Linked_List https://www.geeksforgeeks.org/data-structures/linked-list/³

먼저 포인터를 활용해 Node와 Node를 연결해 보겠습니다.

class Node:
    # 인자를 데이터 하나만 쓰면 next값은 'None'입니다.
    # 만약 인자에 data와 next를 넣어 주면 데이터와 주소값이 들어갑니다.
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
def add(data):
    # 가장 앞에 있는 노드를 head 객체에 담습니다.
    node = head
    while node.next:
        node = node.next
    node.next = Node(data)   

링크드 리스트로 데이터를 추가한 함수(add())가 정상 작동하는지 확인해보겠습니다.

node1 = Node(1)

for idx in range(2,15):
	add(idx) # 2부터 14까지의 데이터를 추가합니다.
node = head
while node.next:
	print(node.data)
	node = node.next
print(node.data)

해당 예시에서 결과는 다음과 같습니다.

자연스럽게 다음의 상황을 생각할 수 있습니다.

insert_into_sorted_list https://engineering.purdue.edu/~milind/ece264/2017spring/assignments/pa09/⁴

만약 위와 같이 링크드 리스트 구조인 [10,20,30,40] 에서 20과 30 사이에 25를 넣기 위해서 어떻게 해야할까요? 이를 해결하기 위한 코드를 만들기 전에 링크드 리스트 데이터에 어떤 값을 추가할 경우 더할 수 있는 경우의 수를 고려해 보면 다음과 같습니다.

첫번째 노드 전에 추가하는 경우.
중간 노드들 사이에 추가하는 경우.
마지막 노드 다음에 추가하는 경우.

위의 이미지는 두번째 케이스(중간 노드들 사이에 추가하는 경우)에 속합니다. 이를 우선 간단히 코드화 해보겠습니다.

node1 = Node(10)
head = node1
for index in range(20,50,10):
    add(index)    
  
node = head
while node.next:
    print(node.data)
    node = node.next
node3 = Node(25)

node = head
node_search = True
while node_search:
    if node.data == 20:
        node_search = False
    else:
        node = node.next

node_next = node.next
node.next = node3
node3.next = node_next

node = head
while node.next:
    print(node.data)
    node = node.next
print(node.data)

다행히 원하는 결과값이 나옵니다.

다음으로 위의 세 가지 경우를 모두 충족할 수 있도록 코드화해보면 다음과 같습니다.

class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
    
class NodeConnect:
    def __init__(self, data):
        self.head = Node(data)
    
    def add(self, data):
        if self.head == '':
            self.head = Node(data)
        else:
            node = self.head
            while node.next:
                node = node.next
            node.next = Node(data)

    # 해당 링크드 리스트 데이터를 출력하는 함수
    def print_node(self):
        node = self.head
        while node:
            print(node.data)
            node = node.next

처음의 노드값을 0으로 준 뒤 1부터 9까지의 값을 링크드 리스트로 연결해 보면 다음과 같이 출력됨을 확인할 수 있습니다.

linkedlist1 = NodeConnect(0)
for data in range(1, 10):
    linkedlist1.add(data)
linkedlist1.print_node()

그렇다면 특정 노드를 삭제하기 위해서는 어떻게 해야 할까요?
삭제도 다음의 세 가지 경우가 있습니다.

첫번째 노드를 삭제할 경우.
중간 노드를 삭제할 경우.
마지막 노드를 삭제할 경우.

이를 고려하여 구현해보겠습니다.

class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
    
class NodeConnect:
    def __init__(self, data):
        self.head = Node(data)
        
    def add(self, data):
        if self.head == '':
            self.head = Node(data)
        else:
            node = self.head
            while node.next:
                node = node.next
            node.next = Node(data)
        
    def print_node(self):
        node = self.head
        while node:
            print (node.data)
            node = node.next
    
    def delete(self, data):
        if self.head == '':
            print("해당 값을 가진 노드가 없습니다.")
            return False
        
        # 첫번째 노드를 삭제할 경우
        if self.head.data == data:
            temp = self.head
            self.head = self.head.next
            del temp
        # 중간 노드와 마지막 노드를 삭제할 경우
        else:
            node = self.head
            while node.next:
                if node.next.data == data:
                    temp = node.next
                    node.next = node.next.next
                    del temp
                    return
                else:
                    node = node.next

지금까지 다양한 자료 구조들 중에서 {Array, Queue, Stack, Linked List}를 코드를 통해 생각해 보았습니다. 처음에는 쉬운 참고 자료⁵를 통해 직관적으로 자료구조들을 공부할 수 있었습니다. 하지만 위의 자료 구조들을 직접 구현해 보면서 다음의 명제를[“각각의 데이터 자료 구조별로 장단점이 존재하기 때문에 프로그래밍을 할 때 맥락에 맞는 자료 구조를 선택하는 것이 중요하다” ]를 보다 분명하게 발견할 수 있었습니다. 무엇보다 프로그래밍 관련된 부분을 공부하고 사고할수록 과거의 옳지 못했던 코딩 습관을 되돌아볼 수 있어서 굉장히 재밌습니다. ‘자료 구조’와 ‘알고리즘’ 관련하여 계속해서 공부하고 연결하고 싶은 마음을 간직하면서 짧은 글을 마무리 하겠습니다.

Reference

https://www.baeldung.com/cs/types-of-queues ↩
https://www.tutorialspoint.com/data_structures_algorithms/stack_algorithm.htm ↩
https://www.geeksforgeeks.org/data-structures/linked-list/ ↩
https://engineering.purdue.edu/~milind/ece264/2017spring/assignments/pa09/ ↩
https://visualgo.net/en/list ↩

Data Structure Part1

Queue

Stack

Array

Linked List

Reference

Contents

Trending Tags

Data Structure Part1

Queue

Stack

Array

Linked List

Reference

Contents

Further Reading

Fundamentals of DE - 데이터 엔지니어링이란 무엇인가?

CRM 최적화 프로젝트 - 쿠폰 발급 최적화

이산형 확률 분포

Trending Tags