프로그램 아키텍쳐/소프트웨어공학

개요 - 데이터의 구성 단위

본클라쓰 2010. 6. 17. 10:51

컴퓨터를 이용하여 처리하고자 하는 것을 통틀어 '데이터'라고 한다. 이와 같은 데이터들은 다양한 방법으로 표현되어 컴퓨터에 입력되기도 하고 출력되기도 한다. 그런데 어떠한 형태로 데이터가 입·출력되더라도 모든 데이터는 반드시 기억장치와 산술 논리장치

를 거쳐야 한다. 또한 모든 데이터는 컴퓨터 내부에서 공통의 원칙에 따라 표현되어야 한다. 데이터 표현 단위는 다음과 같다.

 

 

 

처리 목적과 포함된 정보의 양에 따른 분류

 

비트(Bit : Binary digit)

 

비트는 2진수 한 자리를 기억하는 데이터 표현의 최소 단위이다. 즉, 단도체의 회로에 전류가 흐르는 상태와 흐리지 않는 상태, 스위치가  on되어 있는 상태와 Off된 상태 등과 같은 요소를 가지고 있는 소자를 의미한다. n개의 비트는 2^n개의 데이터를 표현할 수 있다. 컴퓨터는 여러 가지 소자를 이용하여 비트를 표현하는데 현재는 주로 반도체 소자를 사용하고 있다.

 

바이트(Byte)

 

8개의 비트가 모여 구성되는 비트의 집합을 의미하는 것으로, 1캐릭터(Character)라고도 한다. 바이트는 기억장치의 주소 단위이자 기억용량의 기본 단위이다. 일반적으로 바이트는 하나의 문자를 표현하는 단위로써 한 바이트로는 2^8개, 즉 256(0~255)개의 데이터를 표현할 수 있으며, 바이트는 하나의 문자나 숫자를 표현하는데 사용된다.

 

워드(Word)

 

워드는 명령이나 수치 표현의 기본 단위로써 일반적으로 2~4개의 바이트를 연결해 사용한다. 특히 컴퓨터의 회로를 하나의 단위로 취급하여 처리하는 문자의 집합인데 하나의 기억 장소를 가진다. 즉, 워드는 컴퓨터와 액세스하는 최소 단위가 되는 것으로 원하는 곳의 데이터를 처리하기 위해서는 해당되는 워드를 액세스하여 원하는 바이트 또는 비트를 찾아야 한다. 기억 장소의 주소 지정의 효율성을 높이기 위해서 2바이트의 하프워드, 4바이트의 풀워드, 8바이트로 더블워드 등으로 구분하여 사용한다.

 

 

 

논리적인 분류

 

필드

 

특정 사물의 어느 한 성질을 나타내는 고유한 이름을 가진 논리적 데이터의 최소 표현 단위를 필드 또는 항목(Item)이라고 한다. 필드는 인간에게 의미가 있는 기본 단위로 필드명과 길이는 사용자가 지정할 수 있으며 프로그램에서 취급하는 기본 단위가 된다.

 

레코드

 

레코드는 입력이나 출력의 기본 단위가 되며 필드가 모여 구성된다. 레코드는 컴퓨터의 입력장치가 한 번의 입력 동작으로 읽어들이거나, 출력장치에 출력시키는 필드의 집합이다.

 

파일

 

파일은 저장장치의 정보 단위로써 같은 형태의 레코드의 집합을 의미한다. 그리고 파일명은 사용자가 명명하며 이는 저장장치의 폴더라고 하는 디렉터리에 등록된다.

 

 

 

 

출처) 스마트 시대를 위한 컴퓨터 과학의 이해, 휴먼싸이언스, 이윤배 저