Kategorie
Kopie bezpieczeństwa Porady Zrób to sam

Kilobajt, megabajt, gigabajt, terabajt

Rozmiary plików interesują nas tylko wtedy, gdy trzeba te pliki skopiować albo wysłać przez sieć. Wówczas ma znaczenie, czy taka operacja potrwa dwie sekundy, pięć godzin czy miesiąc. Jeśli jednak pliki leżą sobie na dysku a wolnego miejsca nie brakuje, rzadko kiedy interesuje nas ich dokładny rozmiar.

Niniejszy tekst to rozbiegowy odcinek cyklu o tworzeniu kopii bezpieczeństwa danych w domu i małej firmie. Kilobajt, megabajt, gigabajt, terabajt: jeśli miewasz wątpliwości, jaka jest właściwa kolejność tych jednostek albo nie wiesz, ile kilobajtów mieści się w terabajcie – to jest lektura dla ciebie.

Dlaczego w ogóle zajmować się tematem kopii bezpieczeństwa? Dysk twardy w twoim komputerze może zepsuć się za kilka minut. W wielu przypadkach będzie to oznaczać całkowitą i nieodwracalną utratę wszystkich danych, niezależnie od kwoty którą przeznaczysz na próbę ich odzyskania. Przepadną zdjęcia dzieci, ważne dokumenty, praca magisterska, nieopublikowana powieść, plany wyjazdu na wakacje i WSZYSTKO inne.

Rozmiary plików, których kopie bezpieczeństwa będziemy sporządzać, mogą różnić się nawet miliony razy. Współczesne nośniki są zresztą tak duże, że ciężko jest jednym spojrzeniem rozpoznać, o jakich jednostkach mowa. Przykład – dysk systemowy w moim komputerze ma 444513316864 bajtów wolnego miejsca, zaś dysk dodatkowy – 1970534469632 bajtów. Policzenie, gdzie na miejscach dziesiętnych leżą miliardy a gdzie biliony, zajmuje dłuższą chwilę.

Aby było trudniej, świat nie dogadał się w sprawie nazewnictwa potęg liczby tysiąc i tam, gdzie większość Europy liczy “tysiąc, milion, miliard, bilion, biliard, trylion”, kraje angielskojęzyczne używają wersji “tysiąc, milion, bilion, trylion, kwadrylion, kwintylion”. Na szczęście w przypadku pojemności nośników komputerowych używamy przedrostków układu SI, uniwersalnych dla całego świata.

Jeden bajt to w niewielkim uproszczeniu jedna literka. Wielkość plików zaczniemy liczyć w kilobajtach czyli paczkach po 1024 bajty. W normalnym życiu przedrostek “kilo-” oznacza tysiąc czegoś, np. kilogram albo kilometr. W informatyce jednak bardzo wiele jednostek wiąże się z systemem dwójkowym i “kilo-” to 210 (dwa podniesione do potęgi dziesiątej) czyli właśnie 1024. Kilobajt to w skrócie KB, gdzie duże “K” wskazuje na mnożnik “komputerowy”.

Te liczby są WIELKIE

Zaczęliśmy od jednego bajta a skończyliśmy na jednym terabajcie, na który składa się 1.099.511.627.776 bajtów (jest to ponad bilion czyli ponad tysiąc miliardów bajtów). W normalnym życiu nie mierzymy niczego w jednostkach o tak wielkiej rozpiętości. Przykład: czasem w gospodarstwie domowym odmierzamy pojedyncze gramy różnych substancji, tymczasem bilion gramów (a więc milion ton) to więcej, niż waży Pałac Kultury i Nauki (szacowany na 600 tysięcy ton).

Gdy zechcemy oznaczyć taką rozpiętość na wykresie, zwykła “szkolna” skala liniowa nas zawiedzie. Jeśli jeden kilobajt oznaczymy jednym pikselem, to gigabajt będzie miał rozmiar przeszło miliona pikseli – do ich wyświetlenia potrzebowalibyśmy kilkuset monitorów ustawionych obok siebie. Przy terabajcie rząd monitorów mierzyłby ponad sto… kilometrów. Zamiast tego użyjemy więc skali logarytmicznej, na której jednakowy odstęp oznacza taką samą procentową zmianę wartości.

Powyższy wykres używa właśnie takiej skali – wszystkie kolorowe kreski są tej samej długości i zawsze oznaczają stukrotnie większy rozmiar. Na czerwono oznaczono przejście z 1 do 100 kilobajtów, na zielono z 2 do 200 GB, na niebiesko i różowo stukrotne zwielokrotnienie pojemności dyskietki oraz płyty CD.

Bardziej konkretnie o jednostkach

Jedna strona maszynopisu zajmie jakieś dwa kilobajty. Tekst typowej powieści (ponad 500 tysięcy znaków) to około 500 KB i tak dalej. Kilka kilobajtów zajmie mały obrazek, np. pojedyncza ikonka ekranowa. Jedna sekunda nagrania audio w jakości CD to ponad 100 KB.

Megabajt (MB) to 1024 kilobajty, tej jednostki będziemy potrzebować aby opisać rozmiar zdjęć (od kilku do kilkunastu MB na sztukę) czy muzyki (płyta audio CD zawiera do 650 MB, skompresowany plik MP3 to około megabajta na minutę).

Gigabajt (GB) to 1024 megabajty. Tą jednostką będziemy mierzyli pliki wideo, na przykład zawartość jednowarstwowej płyty DVD z filmem kinowym zajmie do 4.7 gigabajta. Z powodu zaszłości historycznych niektóre programy nie potrafią obsługiwać plików większych niż 2 lub 4 GB. Współczesne komputery mają najczęściej 8 lub 16 GB pamięci operacyjnej (tej ulotnej, której zawartość znika po wyłączeniu maszyny).

Terabajt (TB) to 1024 gigabajty. W niniejszym cyklu artykułów nie będziemy zajmować się większymi jednostkami. Typowy dysk twardy w komputerze ma od 0.5 do 4 TB. Jeden terabajt to przestrzeń składowania w telefonach Samsung Galaxy z najwyższej półki i wystarczy na zapisanie 50 godzin filmów kręconych w rozdzielczości 4K i 60 fps.

Które pliki są “małe” a które są “duże”

Podział na pliki “małe”, “średnie” i “duże” jest całkowicie umowny, ale może pomóc początkującym w wyrobieniu sobie intuicji.

Małe będą pliki tekstowe – zawierające napisy. Może to być faktura, książka elektroniczna czy tekst skopiowany ze strony WWW. Także pliki z niewielką zawartością grafiki będą małe – na przykład instrukcja obsługi z ilustracjami czy karta pokładowa z kodem kreskowym. Małe pliki przeniesiemy w dowolnych ilościach na każdym nośniku, najzwyklejszy pendrive zmieści ich dziesiątki tysięcy. Bez problemu prześlemy je też jako załączniki do e-maila. W naszej klasyfikacji małe pliki zajmują do 1 megabajta.

Pliki średnich rozmiarów to obrazy i muzyka. Średnich rozmiarów będzie zdjęcie, plik audio z piosenką lub podcastem, album z reprodukcjami dzieł sztuki. Pojedyncze pliki średniej wielkości zmieszczą się w e-mailach. Zestaw tysiąca średnich plików (np. zestaw zdjęć z wakacji) wypełni pendrive ale nie zajmie istotnej części dysku twardego. Przesłanie tysiąca średnich plików przez internet potrwa kwadranse lub godziny i będzie wymagało użycia dedykowanej usługi. Nasz umowny średni plik zajmuje do 25 MB.

Do dużych plików zaliczymy materiały wideo – od kilkuminutowych filmów z komórki do pełnometrażowych filmów zapisanych na płycie DVD albo Blu-Ray. Tu e-mail nie wchodzi w grę. Nie każdy duży plik będzie się dało przesłać przez internet (różne protokoły transmisji mają różne limity wielkości) a transmisja zajmie godziny lub dni. Nawet pojedynczy duży plik użytkownika może zająć całego pendrive’a zaś kilkadziesiąt takich plików wypełni w całości niewielki dysk twardy. Za duży uznajemy plik mający do 2 GB.

Większe pliki spotyka się rzadko. W zastosowaniach domowych zdarzy się to niemal wyłącznie wówczas, gdy będziemy mieli do czynienia z tzw. obrazem płyty DVD czyli plikiem zawierającym kompletną zawartość krążka z filmem lub programem.

W następnych odcinkach cyklu określimy, jakiego nośnika potrzebujesz na sporządzenie kopii zapasowych swoich plików.

Jak sprawdzić rozmiar pliku lub folderu

Aby sprawdzić rozmiar pliku lub folderu w systemie Windows, należy w Eksplorerze kliknąć na nim prawym klawiszem i wybrać pozycję “Właściwości”.

W centralnej części okienka znajdziemy rozmiar pliku lub katalogu podany w dwóch wariantach – rozmiar rzeczywisty oraz rozmiar na dysku. Co oznacza ta druga miara? Miejsce dla plików zapisywanych na dysku przydzielane jest w paczkach po 4 KB. Nawet plik przechowujący 1 bajt zajmuje więc 4 KB, plik mający 5000 bajtów zajmie 8 KB i tak dalej.

W następnym odcinku zobaczymy, jak w łatwy sposób utworzyć archiwum czyli jeden plik mieszczący w sobie nawet setki tysięcy innych plików. Zauważymy też, że operacje na jednym dużym pliku są o wiele szybsze, niż na dużej liczbie małych plików.



O autorze: zawodowy programista od 2003 roku, pasjonat bezpieczeństwa informatycznego. Rozwijał systemy finansowe dla NBP, tworzył i weryfikował zabezpieczenia bankowych aplikacji mobilnych, brał udział w pracach nad grą Angry Birds i wyszukiwarką internetową Microsoft Bing.

8 odpowiedzi na “Kilobajt, megabajt, gigabajt, terabajt”

No tak, ale to że ktoś czegoś nie używa nie oznacza że jest to poprawne i należy temu przyklaskiwać. Kilobajt to kilobajt a kibibajt to kibibajt. Linuksy jakoś sobie radzą z odpowiednimi przedrostkami.

To wszystko prawda, ale na poziomie podstawowym (a taki jest ten tekst) trzeba było poświęcić encyklopedyczną precyzję na rzecz terminologii, która jest w powszechnym użyciu.

PS: Kibi-Kibi to stolica Krainy Deszczowców 🙂

W akapicie opisującym megabajt jest zawarta informacja o możliwości zapisu na nośniku audio do 650MB. Na najpojemniejszych nośnikach audio w wersji CD można zapisać 1.4GB danych plus ewentualny overburning.

1.4 GB? Poproszę źródełko, bo to nieprzytomnie dużo. Nawet XA Mode 2 Form 2 na płycie 99 minut to około gigabajta (no i wtedy nie ma żadnej korekcji)

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *