관리 메뉴

클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

CPU 스케줄링 1 - CPU 스케줄링 개요 본문

알고리즘 및 자료 관리/컴퓨터 구조 & 운영체제

CPU 스케줄링 1 - CPU 스케줄링 개요

huenuri 2024. 10. 17. 23:55

오늘은 밤늦게까지 공부를 할 생각이다. 아직 발행할 포스트가 남아있기도 하고 공부할 내용이 많아서 몇 개는 미리 발행했다가 추후에 수정하는 방식으로 진행해 볼 것이다.

모든 프로세스는 운영체제로부터 자원을 할당받는다. 프로세스마다 필요로 하는 자원은 각기 다르지만, 모든 프로세스가 공통으로 사용하는자원이 있다면 CPU이다. 운영체제가 프로세스에게 분배하는 자원 중 가장 중요한 자원은 CPU라고 볼 수 있다.

 

이번 시간에는 운영체제가 CPU를 어떻게 프로세스에 분배하는지 알아볼 것이다.

 

 

모든 프로세스는 CPU를 필요로 하고 먼저 CPU를 사용하고 싶어한다. 이러한 프로세스들에게 공정하고 합리적으로 CPU 자원을 할당하기 위해 운영체제는 어떤 프로세스에 CPU를 할당할지, 어떤 프로세스를 기다리게 할지를 결정한다.

CPU 스케줄링은 컴퓨터 성능과도 직결되는 대단히 중요한 문제이다. 프로세스들에게 현명하게 CPU를 배분하지 못하면 반드시 실행되어야 할 프로세스들이 실행되지 못하거나, 당장 급하지 않은 프로세스들만 주로 실행되는 등 무질서한 상태가 발생할 수도 있기 때문이다.


 

 

 

 

프로세스 우선순위

 

CPU를 사용하고 싶어하는 프로세스들이 차례대로 돌아가며 CPU를 이용하게 하는 방법이 이 ㅆ다. 언뜻 들으면 합리적인 방법인 것 같지만 사실 이는 좋은 방법이 아니다.

우선순위가 높은 프로세스란 빨리 처리해야 하는 프로세스들을 의미한다. 

 

 

이를 이해하려면 일반적인 프로세스가 어떤 과정을 거치며 실행되는지를 생각해 보아야 한다. 대부분의 프로세스들은 CPU와 입출력장치를 모두 사용하며 실행된다. 달리 말하면 프로세스는 실행 상태와 대기 상태를 반복하며 실행된다. 

예를 들어 워드 프로세서는 CPU를 사용하여 명령어를 실행하고, 사용자로부터 입력받은 내용을 보조기억장치에 저장한다. CPU를 사용하여 명령어를 실행하고, 사용자가 입력한 내용을 화면에 출력하는 과정을 반복하며 실행된다.

 

그런데 프로세스 종류마다 입출력장치를 이용하는 시간과 CPU를 이용하는 시간의 양에는 차이가 있다. 비디오 재생이나 디스크 백업 작업을 담당하는 프로세스와 같이 입출력 작업이 많은 프로세스도 있고, 복잡한 수학 연산, 컴파일 그래픽 처리 작업을 담당하는 프로세스와 같이 CPU 작업이 많은 프로세스도 있다.

전자를 입출력 집중 프로세스라 하고, 후자를 CPU 집중 프로세스라고 한다. 입출력 집중 프로세스는 실행 상태보다는 입출력을 위한 대기 상태에 더 많이 머무르게 된다. 반대로 CPU 집중 프로세스는 대기 상태보다는 실행 상태에 더 많이 머무르게 된다.

 

 

 

CPU 집중 프로세스와 입출력 집중 프로세스가 동시에 CPU 자원을 요구했다고 가정해 보자. 이러한 경우 입출력 집중 프로세스를 가능한 한 빨리 실행시켜 입출력장치를 끊임없이 작동시키고, 그다음 CPU 집중 프로세스에 집중적으로 CPU를 할당하는 것이 더 효율적이다. 

입출력장치가 입출력 작업을 완료하기 전까지는 입출력 집중 프로세스는 어차피 대기 상태가 될 예정이기 때문에 입출력 집중 프로세스를 먼저 처리해버리면 다른 프로세스가 CPU를 사용할 수 있기 때문이다.

이렇듯 모든 프로세스가 CPU를 차례대로 돌아가며 사용하는 것보다 각각의 상황에 맞게 CPU를 배분하는 것이 더 효율적이다.


 

 

 

상황에 맞게 프로세스의 중요도에 맞게 프로세스가 CPU를 이용할 수 있도록 하기 위해 운영체제는 프로세스마다 우선순위를 부여한다.

운영체제는 각 프 로세스의 PCB에 우선순위를 명시하고, PCB에 적힌 우선순위를 기준으로 먼저 처리할 프로세스를 결정한다. 그렇게 자연스레 우선순위가 높은 프로세스는 더 빨리, 더 자주 실행된다.

 

 

 

프로세스 우선순위 직접 확인하기

우선순위가 높은 대표적인 프로세스는 입출력 작업이 많은 프로세스이지만, 이외에도 우선순위가 높은 프로세스로는 실시간 프로세스, 일부 백그라운드 프로세스 등 다양하다. 어떤 프로세스의 우선순위가 높고, 어떤 프로세스의 우선순위가 낮은지 확인할 수 있다.

유닉스, 리눅스, macOS 등의 유닉스 운영체제에서는 ps -el 명령을 통해 확인이 가능하다.

 

 

윈도우에서는 Process Explorer라는 소프트웨어를 통해 우선순위 확인과 변경이 가능하다.

이 소프트웨어는 다운로드를 해야 쓸 수 있어 지금은 실습하기는 어려울 것 같다.


 

 

 

 

스케줄링 큐

PCB에 우선순위가 적혀 있다고는 하지만, CPU를 사용할 다음 프로세스를 찾기 위해 운영체제가 일일이 모든 프로세스의 PCB를 뒤적거리는 것은 비효율적이다. CPU를 원하는 프로세스들은 한두 개가 아니고, CPU를 요구하는 새로운 프로세스는 언제든 생길 수 있기 때문이다.

이는 CPU 자원에만 국한된 상황이 아니다. 메모리에 적재되고 싶어 하는 프로세스도, 특정 입출력장치와 보조기억장치를 사용하길 원하는 프로세스도 여러 개 있을 수 있다.

그래서 운영체제는 프로세스들에게 '줄을 서서 기다릴 것'을 요구한다. CPU를 사용하고 싶은 프로세스들, 메모리에 적재되고 싶은 프로세스들, 특정 입출력장치를 사용하고 싶은 프로세스들을 모두 줄 세운다. 그리고 운영체제는 이 줄을 스케줄링 큐로 구현하고 관리한다.

큐는 자료 구조 관점에서 보았을 때는 먼저 삽입된 데이터가 먼저 나가는 선입선출 자료구조이지만, 스케줄링에서 이야기하는 큐는 반드시 선입선출 방식일 필요는 없다.

 

즉, 운영체제는 메모리로 적재되고 싶은 (새로 생성되는) 프로세스들, CPU를 이용하고 싶은 프로세스들, 입출력장치를 이용하고 싶은 프로세스들을 큐에 삽입하여 줄을 세운다.

 

 

 

운영체제가 관리하는 줄, 즉 큐에는 다양한 종류가 있다. 대표적인 큐로 준비 큐와 대기 큐가 있다. 준비 상태에 있는 프로세스들의 PCB는 준비 큐의 마지막에 삽입되어 CPU를 사용할 차례를 기다린다.

운영체제는 PCB들이 큐에 삽입된 순서대로 프로세스를 하나씩 꺼내어 실행하되, 그중 우선순위가 높은 프로세스를 먼저 실행한다.

 

 

우선순위가 낮은 프로세스들이 먼저 큐에 삽입되어 줄을 섰다고 할지라도 우선순위가 높은 프로세스는 그들보다 먼저 처리될 수 있다. 이런 점에서 봤을 때 높은 우선순위를 가진 프로세스는 마치 VIP와도 같다.

 

 

 

대기 상태에 있는 프로세스도 마찬가지다. 같은 장치를 요구한 프로세스들은 같은 대기 큐에서 기다린다. 예를 들어 하드 디스크 사용을 요구한 프로세스는 하드 디스크 대기 큐에서 입출력 작업이 완료되기를 기다리고, 프린터 사용을 요구한 프로세스는 프린터 대기 큐에서 입출력 작업이 완료되기를 기다린다.

 

입출력이 완료되어 완료 인터럽트가 발생하면 운영체제는 대기 큐에서 작업이 완료된 PCB를 찾고, 이 PCB를 준비 상태로 변경한 뒤 대기 큐에서 제거한다. 당연히 해당 PCB는 준비 큐로 이동한다.

 

 

 

 

앞서 배운 프로세스 상태 다이어그램을 큐에 적용해볼 수 있다.

 

 


 

 

 

 

선점형과 비선점형 스케줄링

우리가 운영체제라고 가정해보자. 프로세스에 CPU를 사용하도록 허락하여, 해당 프로세스는 CPU를 잘 사용하고 있다고 해보자. 그런데 갑자기 다른 급한 프로세스가 CPU를 지금 당장 사용하길 요청한다면 어떻게 해야 할까?

이런 상황에서 우리가 택할 수 있는 방법은 두 가지이다.

 

 

이 방법을 각각 선점형 스케줄링과 비선점형 스케줄링이라고 한다.

 

 

 

선점형은 '남보다 앞서서 차지함'을 의미한다. 선점형 스케줄링은 프로세스가 CPU를 비롯한 자원을 사용하고 있더라도 운영체제가 프로세스로부터 자원을 강제로 빼앗아 다른 프로세스에 할당할 수 있는 스케줄링 방식을 의미한다. 다시 말해 어느 하나의 프 로세스가 자원 사용을 독점할 수 없는 스케줄링 방식이다.

 

 

 

하나의 프로스가 자원을 사용하고 있다면 그 프로세스가 종료되거나 스스로 대기 상태에 접어들기 전까지 다른 프로세스가 끼어들 수 없는 스케줄링 방식을 의미한다. 다시 말해 비선점형 스케줄링은 하나의 프로세스가 자원 사용을 독점할 수 있는 스케줄링 방식이라고 할 수 있다. 만약 비선점형 스케줄링 방식으로 자원을 이용하는 프로세스가 있다면 다른 프로세스들은 그 프로세스의 사용이 모두 끝날 때까지 기다려야 한다.

 

현재 대부분의 운영체제는 선점형 스케줄링 방식을 차용하고 있지만, 각기 장단점을 갖고 있다.


 

 

 

 

단원 마무리하기

 

 

 

 

 

2번은 그림만 주의깊게 살폈다면 충분히 풀 수 있는 문제이다. 준비 큐와 대기 큐이다. 3번은 정말 잘 모르는 문제였다. 오버헤드가 뭔지도 잘 모르겠다. 비선점형은 자원을 빼앗을 수 없다는 건 알겠는데 독점한다는 말이 무엇인지 혼동되었다. 한국말과 용어를 이해하지 못해서 틀린 문제이다.

언어 즉 한국말과 영어를 잘 이해해야 프로그래밍 언어도 잘할 수 있다. 독점을 한다는 건 빼앗을 수 있다는 말이다. 선점형은 자원을 독점할 수 있다. 비선점형은 하나의 프로세스가 이용 중이면 이용이 끝날 때까지 기다려야 하므로 독점을 할 수 없는 방식이다. 

 

그러면 오버헤드는 컴퓨터 시스템의 성능 저하나 추가적인 자원을 소비하게 만드는 추가적인 작업을 의미한다. 운영체제에서는 스케줄링, 메모리 관리, 문맥 전환 등의 과정에서 발생하는 시간적 또는 자원적 부담이 오버헤드로 간주된다. 그러니까 비선점형에서 오버헤드가 더 빈번하게 발생한다. 따라서 답은 2번이다.


 

 

학습을 마치고

CPU 프로세스의 스케줄링에 대해서 공부해 보았다. 그리고 문제를 풀면서 개념이 더 확실히 이해되는 걸 느꼈다. 모든 공부는 서로 연결된다. 앞의 내용을 이해하지 못하면 뒤의 단원 또한 이해하기 힘들다. 여기까지 왔다는 건 앞선 단원을 대부분 이해하며 잘하고 있다는 증거일 것이다.