Tavu (tietotekniikka)

Wikipediasta
Siirry navigaatioon Siirry hakuun
Tämä artikkeli käsittelee tietoteknistä mittayksikköä. Luonnollisen kielen tavu on äänteistä muodostuva sanan rakenneosa.
Tavun monikerrat
Binäärijärjestelmä
JEDEC IEC  Arvo 
kilotavu - KB kibitavu - KiB 210
megatavu - MB mebitavu - MiB 220
gigatavu - GB gibitavu - GiB 230
- tebitavu - TiB 240
- pebitavu - PiB 250
- eksbitavu - EiB 260
- tsebitavu - ZiB 270
- jobitavu - YiB 280
Kymmenjärjestelmä (SI)
Nimi Lyhenne  Arvo 
 kilotavu kB, kt 103
 megatavu MB, Mt 106
 gigatavu GB, Gt 109
 teratavu TB, Tt 1012
 petatavu PB, Pt 1015
 eksatavu EB, Et 1018
 tsettatavu ZB 1021
 jottatavu YB 1024
Binäärisen ja desimaalisen tavun ero kasvaa yksiköiden kasvaessa

Tavu (engl. byte) on tietotekniikassa käytettävä mittayksikkö sellaiselle tallennuskapasiteetille, joka on riippumaton tallennetun datan tyypistä. Tavua kerrannaisineen käytetään ilmoittamaan tietokoneen keskusmuistin tai massamuistin tallennuskapasiteetin määrä. Tavu on pienin tietokoneen muistiosoitteella suoraan osoitettava yksikkö.[1] Se on myös yleinen tietotyyppi ohjelmointikielissä.

Tavun koko on de facto kahdeksan bittiä. IEC standardissa IEC 80000-13:2008 käytäntö on myös kirjattu.[2]

Aiemmissa tietokonejärjestelmien arkkitehtuureissa käytettiin myös kuuden, seitsemän, yhdeksän, kymmenen ja kahdentoista bitin tavuja.[3] IBM S/360 vaikutti tavun standardoimiseen kahdeksaksi bitiksi.[4] Epäselvyyksien ehkäisemiseksi kahdeksan bitin tavusta käytetään muun muassa tietoliikenteessä nimeä oktetti (lyh. o).[5] Termi puolitavu (engl. nibble) tarkoittaa nimensä mukaisesti puolikasta tavua eli käytännössä neljän bitin jonoa.

Kahdeksan bitin tavuun voidaan tallentaa kokonaisluku väliltä 0–255 (28 arvoa). Tavun sisällön merkitys voidaan tulkita usealla tavalla, esimerkiksi yhtenä kirjaimena tietyssä merkistössä. Tavun sisältö ilmoitetaan usein heksadesimaalijärjestelmässä.

Tavu lyhennetään tyypillisesti t[6] (vain suomenkielinen lyhenne), mutta toinen yleinen ja täysin pätevä tapa, myös suomenkielisessä tekstissä, on kansainvälinen tavun yksikkö B[6] (varsin usein käytetään virheellisesti lyhennettä b, joka on bitin lyhenne).

Englanniksi tavua kutsutaan nimellä byte, joka on muunnos sanasta engl. bite (suom. ”haukkaisu”). Puolitavu sen sijaan on englanniksi nibble (suom. ”näykkäisy”). Suomessa termiksi on muodostunut tavu lähinnä siksi, että kahdesta tai useammasta tavusta muodostuu – tietokoneen tyypistä riippuen – sana (engl. word).

Tavun monikerrat

[muokkaa | muokkaa wikitekstiä]

Tavun monikertoina ei tulisi käyttää SI-järjestelmän mukaisia kymmenkantaisia kerrannaisyksiköitä kuten kilo-, mega- ja giga-, vaan binäärijärjestelmän mukaisia kahden potensseja kibi-, mebi-, gibi- ja niin edelleen, koska ne ovat yksiselitteisiä.

Binäärikantaisten yksiköiden lyhenteet ovat Ki, Mi, Gi ja niin edelleen. Kibitavu (KiB) on 210 = 1 024 tavua, mebitavu (MiB) 220 = 1 048 576 tavua ja gibitavu (GiB) 230 = 1 073 741 824 tavua. Binäärikerrannaisyksiköt sisältyvät IEC:n vuonna 1998 hyväksymään standardiin.[7]

Eri kerrannaisyksiköitä käytetään laajasti sekaisin: yleensä tietokoneiden keskusmuistin kapasiteetti ilmoitetaan kahden potensseina sekä kiintolevyjen kapasiteetti ja tiedonsiirron nopeudet kymmenen potensseina, mutta tästäkin säännöstä on paljon poikkeuksia. Lisäksi kilotavusta käytetään tavallisesti lyhennettä k. Uusien binääripohjaisten monikertojen lyhenteiden käyttö ei ole levinnyt laajalle.

JEDEC-standardissa on lisäys käytössä olevan käytännön dokumentoimiseksi.[8]

Lisäksi eräissä tapauksissa jälkiliite B on jätetty pois ja käytetään vain lyhenteitä K, M ja G.

  • Jaakohuhta, Hannu: Tietotekniikan sanakirja. Helsinki: Readme.fi, 2011. ISBN 978-952-220-456-1 (suomeksi, englanniksi)
  1. Bitwise Operators cs.fsu.edu. Viitattu 16.2.2020. (englanniksi)
  2. IEC 80000-13:2008, sivu 13:

    »In English, the name byte, symbol B, is used as a synonym for octet. Here byte means an eight-bit byte. However, byte has been used for numbers of bits other than eight. To avoid the risk of confusion, it is strongly recommended that the name byte and the symbol B be used only for eight-bit bytes.»

  3. Built-in / Intrinsic / Primitive Data Types isocpp.org. Viitattu 25.1.2017.
  4. Gordon Bell: Rise and Fall of Minicomputers ethw.org. Viitattu 22.1.2020. (englanniksi)
  5. Binary Information and Representation: Bits, Bytes, Nibbles, Octets and Characters tcpipguide.com. Viitattu 26.8.2021. (englanniksi)
  6. a b Lyhenneluettelo: T Kotimaisten kielten keskus. Viitattu 25.1.2017.
  7. http://physics.nist.gov/cuu/Units/binary.html
  8. JEDEC Standard 100B.01, sivu 8:

    »The definitions of kilo, giga, and mega based on powers of two are included only to reflect common usage. IEEE/ASTM SI 10-1997 states "This practice frequently leads to confusion and is deprecated." Further confusion results from the popular use of the megabyte representing 1 024 000 bytes to define the capacity of the 1.44-MB high-density diskette. An alternative system is found in Amendment 2 to IEC 60027-2: Letter symbols to be used in electrical technology – Part 2

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]