Bit(Binary digit) Byte 의 고찰

Chase
직방 기술 블로그
4 min readDec 18, 2023

최근 우리가 다루는 용량이 매우 커져서 작은 용량은 무시해도 될 수준이 되었지만, 우리가 누군가.? 우리는 데이터를 다루는 사람이고, 작은 용량의 데이터도 무시할수 없는 전문가다.

그렇다면, 최근 우리의 기억에서 잊혀진 데이터 용량에 대해 다시 한번 고찰해 보고자 한다.

사전적 정의부터 알아보자!

비트(Bit, Binary digit) 는 하나의 비트는 0 이나 1 의 값을 가질수 있고, 각각은 참, 거짓 혹은 서로 배타적인 상태를 나타낸다.

바이트(Byte) 는 일정량의 비트 모음을 정의할때 사용하며, 컴퓨터의 기억장치의 크기를 나타내는 단위로 자주 쓰인다. 실질적인 의미는 ASCII 문자 하나를 나타내는 단위로 최근에는 사실상 1바이트를 8비트로 간주하는 경우가 흔하다.

  • 옥텟(octet): 한데 묶여 쓰이는 2진 이진부호모음. 바이트가 8비트를 가리킬 때 서로 같은 뜻을 갖는다. 전기통신 분야에서는 바이트란 용어 대신 옥텟이란 표현을 사용한다. 팔중수라고도 부른다.
  • 니블(nibble) = 1바이트의 절반으로 보통 4비트를 가리킨다. 이때 바이트 하나는 상위 니블(상위 4비트)과 하위 니블(하위 4비트)로 나눌 수 있다.
  • 워드(word): 전자통신 기기에 따라 2바이트 또는 4바이트를 묶어서 부르는 단위이다.
  • 킬로바이트(kbyte): 1024 바이트는 1 킬로바이트이다.

해묵은 이슈이긴 한데, 시간이 지날수록 컴퓨터 저변 확대와 데이터 용량 단위 증가로 인한 이슈가 발생하게 되었다.

앞서 정의된 바와 같이 용량 표현의 최소 단위인 바이트(byte)는 비트(bit)를 기반으로 한 이진법을 사용하고 있기 때문에 1KB 는 1,024 Byte 이다.
하지만, 우리가 표준으로 사용하는 국제단위계(SI)는 모두 10진법을 기초로 하고, 이를 기반으로 제조사는 표기를 하기 시작하며 문제가 발생하기 시작했다.

1,024 Byte 나 1,000 Byte 나 큰 차이가 없어, 같은 크기로 받아들여졌지만, 용량이 커질 경우 그 차이는 매우 커지게 된다.

십진법과 이진법 표기시의 용량 차이 (출처 : https://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%ED%8A%B8)

이러한 문제를 해결하기 위하여 1998년 IEC(International Electrotechnical Commission)에서 아래와 같은 새로운 표기법을 만들었다.

이제 KB 는 1,000 Byte 이고 새롭게 추가된 표기법인 KiB 는 1,024 Byte 이다.

십진법과 이진법 표기시의 용량 차이 (출처 : https://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%ED%8A%B8)

지금 이 이슈를 다시 고찰할 필요성을 느낀 이유는 AWS 단위 표기의 구분을 명확히 하고 있기 때문이다.
아래와 같이 표기 단위에 따라 다르게 구분하여 사용해야 한다.

--

--