Tietojenkäsittelytieteessä suuri määrä tietoprosesseja tapahtuu käyttämällä tietojen koodaus. Siksi tämän prosessin ymmärtäminen on erittäin tärkeää tämän tieteen perusteiden ymmärtämisessä. Tietojen koodaus tarkoittaa prosessia, jossa eri luonnollisilla kielillä (venäjä, englanti jne.) kirjoitetut symbolit muunnetaan digitaaliseksi merkinnöiksi.

Tämä tarkoittaa, että tekstiä koodattaessa jokaiselle merkille annetaan tietty arvo nollien ja ykkösten muodossa - .

Miksi koodata tietoa?

Ensin sinun on vastattava kysymykseen miksi koodata tietoa? Tosiasia on, että tietokone pystyy käsittelemään ja tallentamaan vain yhden tyyppistä dataesitystä - digitaalista. Siksi kaikki siihen sisältyvät tiedot on käännettävä kielelle digitaalinen näkymä.

Tekstin koodausstandardit

Jotta kaikki tietokoneet ymmärtäisivät yksiselitteisesti tämän tai toisen tekstin, on käytettävä yleisesti hyväksyttyä tekstin koodausstandardit. Muissa tapauksissa tarvitaan ylimääräistä uudelleenkoodausta tai tietojen yhteensopimattomuutta.



ASCII

Ensimmäinen tietokoneen merkkikoodausstandardi oli ASCII (koko nimi - American Standard Code for Information Interchange). Minkä tahansa merkin koodaamiseen käytettiin vain 7 bittiä. Kuten muistat, voit koodata vain 27 merkkiä tai 128 merkkiä käyttämällä 7 bittiä. Tämä riittää koodaamaan latinalaisten aakkosten isot ja pienet kirjaimet, arabialaiset numerot, välimerkit sekä tietty joukko erikoismerkkejä, esimerkiksi dollarimerkki - “$”. Kuitenkin muiden kansojen aakkosten merkkien koodaamiseksi (mukaan lukien venäjän aakkosten merkit), koodi oli tarpeen täydentää 8-bittisiksi (28=256 merkkiä). Samaan aikaan jokainen kieli käytti omaa erillistä koodausta.

UNICODE

Tilanne oli pelastettava yhteensopivuuden kannalta koodaustaulukot. Siksi ajan myötä kehitettiin uusia päivitettyjä standardeja. Tällä hetkellä suosituin koodaus on ns UNICODE. Siinä jokainen merkki on koodattu 2 tavulla, mikä vastaa 216=62536 eri koodia.



Grafiikkakoodausstandardit

Kuvan koodaamiseen kuluu paljon enemmän tavuja kuin merkkien koodaamiseen. Useimmat tietokoneen muistiin tallennetut luodut ja käsitellyt kuvat on jaettu kahteen pääryhmään:

  • rasterigrafiikkakuvat;
  • vektorigrafiikka kuvia.

Rasterigrafiikka

Rasterigrafiikassa kuvaa edustaa joukko värillisiä pisteitä. Tällaisia ​​pisteitä kutsutaan pikseleiksi. Kun kuvaa suurennetaan, tällaiset pisteet muuttuvat neliöiksi.


Mustavalkoisen kuvan koodaamiseksi jokainen pikseli on koodattu yhdellä bitillä. Esimerkiksi musta on 0 ja valkoinen on 1)


Aiempi kuvamme voidaan koodata seuraavasti:

Ei-värikuvien koodauksessa käytetään useimmiten 256 harmaan sävyn palettia valkoisesta mustaan. Siksi tällaisen gradation koodaamiseen riittää yksi tavu (28=256).


Värikuvakoodauksessa käytetään useita väriteemoja.




Käytännössä niitä käytetään useammin RGB värimalli, jossa käytetään kolmea pääväriä: punainen, vihreä ja sininen. Muita värisävyjä saadaan sekoittamalla näitä päävärejä.


Siten kolmen värin mallin koodaamiseksi 256 sävyyn saadaan yli 16,5 miljoonaa eri värisävyä. Toisin sanoen koodaukseen käytetään 3⋅8=24 bittiä, mikä vastaa 3 tavua.


Luonnollisesti värikuvien koodaamiseen voidaan käyttää minimimäärää bittejä, mutta silloin voidaan muodostaa pienempi määrä värisävyjä, jolloin kuvanlaatu heikkenee merkittävästi.


Kuvan koon määrittämiseksi sinun on kerrottava leveyspikseleiden määrä pituisten pikselien lukumäärällä ja kerrottava uudelleen itse pikselin koolla tavuina.


  • A- pikselien lukumäärä leveydellä;
  • b- pituisten pikselien lukumäärä;
  • minä– yhden pikselin koko tavuina.

Esimerkiksi värikuva, jonka koko on 800⋅600 pikseliä, vie 60 000 tavua.

Vektorigrafiikka

Vektorigrafiikkaobjektit koodataan täysin eri tavalla. Tässä kuva koostuu viivoista, joilla voi olla omat kaarevuuskertoimensa.



Äänen koodausstandardit

Äänet, joita ihminen kuulee, ovat ilmavärähtelyjä. Äänen värähtelyt ovat aallon etenemisprosessia.

Äänellä on kaksi pääominaisuutta:

  • värähtelyn amplitudi - määrittää äänenvoimakkuuden;
  • värähtelytaajuus - määrittää äänen tonaalisuuden.


Ääni voidaan muuntaa sähköiseksi signaaliksi mikrofonin avulla. Ääni koodataan tietyllä, ennalta määrätyllä aikavälillä. Tässä tapauksessa sähköisen signaalin koko mitataan ja sille annetaan binääriarvo. Mitä useammin näitä mittauksia tehdään, sitä korkeampi äänenlaatu on.




700 Mt:n CD-levylle mahtuu noin 80 minuuttia CD-laatuista ääntä.

Videokoodausstandardit

Kuten tiedät, videojaksot koostuvat nopeasti muuttuvista fragmenteista. Kehysmuutokset tapahtuvat nopeudella 24-60 kuvaa sekunnissa.

Videosekvenssin koko tavuina määräytyy kehyskoon (pikseleiden määrä näyttöä kohti korkeudessa ja leveydessä), käytettyjen värien lukumäärän ja kehysten määrän sekunnissa mukaan. Mutta tämän lisäksi voi olla myös ääniraita.

Samat tiedot voidaan esittää useissa eri muodoissa. Peruskoodausmenetelmät mahdollistavat tämän tekemisen nykymaailmassa. Tietotekniikan tulon jälkeen syntyi tarve koodata kaiken tyyppistä tietoa, jonka kanssa henkilö työskentelee. Mutta tämäntyyppisten ongelmien ratkaiseminen alkoi kauan ennen tietokoneiden tuloa.

Navigaattori menetelmien mukaan

1 tapa. Binäärinen koodaus.

Binaarikoodausta pidetään yhtenä suosituimmista ja yleisimmistä tiedon esittämismenetelmistä. Kun työskentelet tietokoneiden, robottien ja numeerisesti ohjattujen koneiden kanssa, tiedot koodataan useimmiten binääriaakkosten sanojen muodossa.

Mielenkiintoista: 10 tapaa puhdistaa asema C

Menetelmä 2. Pikakirjoitus.

Tämä menetelmä on luokiteltu menetelmäksi tekstitietojen koodaamiseksi erikoismerkkejä käyttämällä. Tämä menetelmä on nopein äänitettäessä puhuttua kieltä. Vain joillakin erikoiskoulutetuilla henkilöillä, joita kutsutaan pikakirjoittajiksi, on stenografiataitoja. Tällaiset ihmiset onnistuvat kirjoittamaan tekstin synkronisesti puhuvan henkilön puheen kanssa.

3 tapaa. Synkronointi.

Digitaalisen tiedon kanssa työskentelyssä synkronointi on erityisen tärkeää. Tietoa luettaessa tai tallennettaessa on tärkeää määrittää tarkasti jokaisen merkin muutoksen aika. Jos synkronointia ei ole, etumerkin vaihtojakso voi olla määritetty väärin. Seurauksena on väistämättä tietojen menetys tai korruptio.

4 tapaa. Run Length Limited - RLL.

Nykyään yksi suosituimmista menetelmistä on tietojen koodaus tallennuskentän pituuden rajoituksella. Tämän menetelmän ansiosta levylle voidaan sijoittaa puolitoista kertaa enemmän tietoa kuin MFM-menetelmällä tallennettaessa. Tällä menetelmällä ei koodata yhtä bittiä, vaan koko ryhmä.

Mielenkiintoista: 10 tapaa suojata tiedostoja varkauksilta

5 tapaa. Muunnostaulukot.

Muunnostaulukko on taulukko, joka sisältää luettelon koodatuista merkeistä, jotka on järjestetty erityisellä tavalla. Vastaavasti symboli muunnetaan sen binäärikoodiksi ja päinvastoin.

6 tapaa. Matriisimenetelmä.

Graafisten kuvien koodauksen matriisiperiaate on, että kuva jaetaan tiettyyn määrään sarakkeita ja rivejä. Tämän jälkeen tuloksena olevan ruudukon jokainen elementti koodataan valitun säännön mukaisesti.

Kirjoita nyt kommentti!

Koodi on joukko sopimuksia (tai signaaleja) joidenkin ennalta määritettyjen käsitteiden tallentamiseksi (tai viestimiseksi).

Tiedon koodaus on prosessi, jossa muodostetaan tiedosta erityinen esitys. Suppeammassa merkityksessä termi "koodaus" ymmärretään usein siirtymäksi yhdestä tiedon esitysmuodosta toiseen, joka on helpompi tallentaa, siirtää tai käsitellä.

Yleensä jokaista kuvaa koodattaessa (jota kutsutaan joskus salaukseksi) edustaa erillinen merkki.

Merkki on osa äärellisestä joukosta elementtejä, jotka eroavat toisistaan.

Suppeammassa merkityksessä termi "koodaus" ymmärretään usein siirtymäksi yhdestä tiedon esitysmuodosta toiseen, joka on helpompi tallentaa, siirtää tai käsitellä.

Tietokone pystyy käsittelemään vain numeerisessa muodossa esitettyä tietoa. Kaikki muu tieto (esim. äänet, kuvat, instrumenttien lukemat jne.) on muutettava numeeriseen muotoon tietokoneella käsiteltäväksi. Esimerkiksi musiikillisen äänen kvantifioimiseksi voidaan mitata äänen intensiteetti tietyillä taajuuksilla lyhyin väliajoin, mikä edustaa kunkin mittauksen tuloksia numeerisessa muodossa. Tietokoneohjelmien avulla voit muunnella vastaanotettua tietoa esimerkiksi ”päällekkäin” eri lähteistä tulevia ääniä päällekkäin.

Vastaavasti tekstitietoja voidaan käsitellä tietokoneella. Kun kirjain syötetään tietokoneeseen, jokainen kirjain on koodattu tietyllä numerolla, ja kun se tulostetaan ulkoisille laitteille (näyttö tai tuloste), kirjainten kuvat muodostetaan näistä numeroista ihmisen havaitsemista varten. Kirjainten ja numeroiden välistä vastaavuutta kutsutaan merkkikoodaukseksi.

Yleensä kaikki tietokoneen luvut esitetään nollien ja ykkösten avulla (ei kymmentä numeroa, kuten ihmisille tavallista). Toisin sanoen tietokoneet toimivat yleensä binäärilukujärjestelmässä, koska tämä yksinkertaistaa niitä huomattavasti. Numeroiden syöttäminen tietokoneeseen ja tulostaminen ihmisen luettavaksi voidaan tehdä tavanomaisessa desimaalimuodossa ja kaikki tarvittavat muunnokset suoritetaan tietokoneella käynnissä olevilla ohjelmilla.

Tietojen koodausmenetelmät.

Samat tiedot voidaan esittää (koodata) useissa eri muodoissa. Tietokoneiden myötä syntyi tarve koodata kaikentyyppistä tietoa, jota sekä yksilö että koko ihmiskunta käsittelevät. Mutta ihmiskunta alkoi ratkaista tiedon koodausongelmaa kauan ennen tietokoneiden tuloa. Ihmiskunnan suuret saavutukset - kirjoittaminen ja aritmetiikka - eivät ole muuta kuin puheen ja numeerisen tiedon koodausjärjestelmä. Tieto ei koskaan esiinny puhtaassa muodossaan, se esitetään aina jotenkin, koodataan jotenkin.

Binäärikoodaus on yksi yleisimmistä tavoista esittää tietoa. Tietokoneissa, roboteissa ja numeerisesti ohjatuissa koneissa pääsääntöisesti kaikki laitteen käsittelemä tieto on koodattu binääriaakkosten sanojen muodossa.

Symbolisen (teksti)informaation koodaus.

Päätoiminto yksittäisille tekstin merkeille on merkkien vertailu.

Merkkejä verrattaessa tärkeimpiä näkökohtia ovat kunkin merkin koodin ainutlaatuisuus ja tämän koodin pituus, ja itse koodausperiaatteen valinnalla ei ole käytännössä merkitystä.

Tekstien koodaamiseen käytetään erilaisia ​​muunnostaulukoita. On tärkeää, että samaa taulukkoa käytetään samaa tekstiä koodattaessa ja dekoodattaessa.

Muunnostaulukko on taulukko, joka sisältää luettelon jollain tavalla järjestetyistä koodatuista merkeistä, jonka mukaan merkki muunnetaan binäärikoodikseen ja takaisin.

Suosituimmat muunnostaulukot: DKOI-8, ASCII, CP1251, Unicode.

Historiallisesti merkkikoodauksen koodipituudeksi valittiin 8 bittiä tai 1 tavu. Siksi useimmiten yksi tietokoneelle tallennetun tekstin merkki vastaa yhtä muistitavua.

8-bittisellä koodilla voi olla 28 = 256 erilaista 0:n ja 1:n yhdistelmää, joten yhdellä muunnostaulukolla voidaan koodata enintään 256 merkkiä. 2 tavun (16 bitin) koodilla voidaan koodata 65536 merkkiä.

Numeeristen tietojen koodaus.

Numeeristen ja tekstitietojen koodauksen samankaltaisuus on seuraava: tämän tyyppisten tietojen vertaamiseksi eri numeroilla (sekä eri merkeillä) on oltava eri koodi. Suurin ero numeerisen datan ja symbolisen datan välillä on se, että vertailuoperaation lisäksi luvuille suoritetaan erilaisia ​​matemaattisia operaatioita: yhteenlasku, kertolasku, juuripoimiminen, logaritmin laskenta jne. Näiden operaatioiden suorittamista matematiikassa koskevat säännöt on kehitetty yksityiskohtaisesti paikkalukujärjestelmässä esitetyille numeroille.

Peruslukujärjestelmä numeroiden esittämiseen tietokoneessa on binääripaikkalukujärjestelmä.

Tekstitietojen koodaus

Tällä hetkellä useimmat käyttäjät käyttävät tietokonetta tekstitietojen käsittelyyn, joka koostuu symboleista: kirjaimista, numeroista, välimerkeistä jne. Lasketaan kuinka monta symbolia ja kuinka monta bittiä tarvitsemme.

10 numeroa, 12 välimerkkiä, 15 aritmeettista symbolia, venäjän ja latinalaisen aakkoston kirjaimia, YHTEENSÄ: 155 merkkiä, mikä vastaa 8 bittiä tietoa.

Tiedon mittayksiköt.

1 tavu = 8 bittiä

1 kt = 1024 tavua

1 Mt = 1024 kt

1 Gt = 1024 Mt

1 Tt = 1024 Gt

Koodauksen ydin on, että jokaiselle merkille annetaan binäärikoodi 00000000 - 11111111 tai vastaava desimaalikoodi välillä 0 - 255.

On muistettava, että tällä hetkellä venäläisten kirjainten koodaukseen käytetään viittä eri kooditaulukkoa (KOI - 8, CP1251, CP866, Mac, ISO), ja yhdellä taulukolla koodatut tekstit eivät näy oikein toisessa.

Merkkikoodauksen päänäyttö on ASCII-koodi - American Standard Code for Information Interchange, joka on 16 x 16 taulukko, jossa merkit on koodattu heksadesimaalilukujärjestelmään.

Graafisten tietojen koodaus.

Tärkeä vaihe graafisen kuvan koodauksessa on sen jakaminen erillisiin elementteihin (näytteenotto).

Tärkeimmät tavat esittää grafiikkaa tallennettavaksi ja prosessoitavaksi tietokoneella ovat rasteri- ja vektorikuvat

Vektorikuva on graafinen objekti, joka koostuu geometrisista alkeismuodoista (useimmiten segmenteistä ja kaarista). Näiden alkeisosien sijainti määräytyy pisteiden koordinaattien ja säteen mukaan. Jokaiselle riville ilmoitetaan binäärikoodit viivan tyypille (yhtenäinen, katkoviiva, katkoviiva), paksuus ja väri.

Rasterikuva on joukko pisteitä (pikseleitä), jotka on saatu matriisiperiaatteen mukaisen kuvan näytteistyksen tuloksena.

Graafisten kuvien koodauksen matriisiperiaate on, että kuva jaetaan tiettyyn määrään rivejä ja sarakkeita. Sitten tuloksena olevan ruudukon jokainen elementti koodataan valitun säännön mukaisesti.

Pikseli (kuvaelementti) on kuvan vähimmäisyksikkö, jonka väri ja kirkkaus voidaan asettaa muusta kuvasta riippumatta.

Matriisiperiaatteen mukaisesti kuvat muodostetaan, tulostetaan tulostimelle, näytetään näytöllä ja saadaan skannerin avulla.

Mitä korkeampi kuvanlaatu on, sitä tiheämpiä pikselit ovat, eli sitä korkeampi on laitteen resoluutio ja sitä tarkemmin kunkin niistä väri on koodattu.

Mustavalkokuvassa kunkin pikselin värikoodi määritetään yhdellä bitillä.

Jos kuva on värillinen, jokaiselle pisteelle määritetään sen värin binäärikoodi.

Koska värit on koodattu binäärikoodilla, jos esimerkiksi haluat käyttää 16-väristä kuvaa, tarvitset 4 bittiä (16=24) jokaisen pikselin koodaamiseen ja jos on mahdollista käyttää 16 bittiä (2 tavua) koodataksesi värin yhden pikselin, voit lähettää 216 = 65536 eri väriä. Kolmen tavun (24 bitin) käyttäminen yhden pisteen värin koodaamiseen mahdollistaa 16 777 216 (noin 17 miljoonan) eri värisävyn heijastuksen - niin sanotun "todellisen värin" -tilan. Huomaa, että niitä käytetään tällä hetkellä, mutta ne ovat kaukana nykyaikaisten tietokoneiden enimmäisominaisuuksista.

Äänitietojen koodaus.

Fysiikkakurssiltasi tiedät, että ääni on ilmavärähtelyä. Ääni on luonteeltaan jatkuva signaali. Jos muunnamme äänen sähköiseksi signaaliksi (esimerkiksi käyttämällä mikrofonia), näemme jännitteen muuttuvan tasaisesti ajan myötä.

Tietokonekäsittelyä varten analoginen signaali on jollain tapaa muutettava binäärilukujonoksi, ja tätä varten se on näytteitettävä ja digitoitava.

Voit tehdä seuraavasti: mitata signaalin amplitudi säännöllisin väliajoin ja kirjoittaa tuloksena saadut numeroarvot tietokoneen muistiin.

Koodaustiedot. Tietojen muuntamisessa esitysmuodosta (merkkijärjestelmästä) toiseen suoritetaan koodaus. Koodaustyökalu on vastaavuustaulukko, joka määrittää kahden eri merkkijärjestelmän merkkien tai merkkiryhmien välisen vastaavuuden.

Tiedonvaihtoprosessissa on usein tarpeen suorittaa tiedon koodaus- ja dekoodaustoimintoja. Kun syötät aakkosmerkin tietokoneeseen painamalla vastaavaa näppäimistön näppäintä, se koodataan, eli muunnetaan tietokonekoodiksi. Kun merkki näytetään näyttöruudulla tai tulostimella, tapahtuu käänteinen prosessi - dekoodaus, kun merkki muunnetaan tietokonekoodista graafiseksi kuvaksi.

Kuvan ja äänen koodaus. Tiedot, mukaan lukien grafiikka ja ääni, voidaan esittää analogisessa tai erillisessä muodossa. Analogisessa esityksessä fyysinen suure saa äärettömän määrän arvoja ja sen arvot muuttuvat jatkuvasti. Diskreetissä esityksessä fyysinen suure saa rajallisen arvojoukon ja sen arvo muuttuu äkillisesti.

Esimerkki graafisen tiedon analogisesta esityksestä on esimerkiksi maalaus, jonka väri muuttuu jatkuvasti, ja diskreetti esitys on mustesuihkutulostimella tulostettu kuva, joka koostuu yksittäisistä erivärisistä pisteistä.

Esimerkki äänitiedon analogisesta tallentamisesta on vinyylilevy (ääniraita muuttaa muotoaan jatkuvasti), ja diskreetti on audio-CD (jonka ääniraita sisältää alueita, joilla on erilainen heijastavuus).

Graafinen ja ääniinformaatio analogisesta diskreettimuodosta muunnetaan näytteistyksellä, eli jakamalla jatkuva graafinen kuva ja jatkuva (analoginen) äänisignaali erillisiksi elementeiksi. Näytteenottoprosessiin kuuluu koodaus, ts. jokaiselle elementille annetaan tietty arvo koodin muodossa.

Näytteenotto on jatkuvien kuvien ja äänen muuntamista erillisiksi arvoiksi, joille kullekin on määritetty koodinsa arvo.

Tietojen koodaus elävissä organismeissa. Geneettinen tieto määrää elävien organismien rakenteen ja kehityksen ja periytyy. Geneettinen informaatio on tallennettu organismien soluihin DNA (deoksiribonukleiinihappo) molekyylien rakenteeseen. DNA-molekyylit koostuvat neljästä eri komponentista (nukleotidistä), jotka muodostavat geneettisen aakkoston.

Ihmisen DNA-molekyyli sisältää noin kolme miljardia nukleotidiparia, ja se koodaa kaiken tiedon ihmiskehosta: sen ulkonäöstä, terveydentilasta tai alttiudesta sairastua, kykyjä jne.

6. Aiheen "Tieto ja hallinta" peruskäsitteet: tiedon numeerinen ja symbolinen koodaus

Numeeristen tietojen koodaus.

Numeeristen ja tekstitietojen koodauksen samankaltaisuus on seuraava: tämän tyyppisten tietojen vertaamiseksi eri numeroilla (sekä eri merkeillä) on oltava eri koodi. Suurin ero numeerisen datan ja symbolisen datan välillä on se, että vertailuoperaation lisäksi luvuille suoritetaan erilaisia ​​matemaattisia operaatioita: yhteenlasku, kertolasku, juuripoimiminen, logaritmin laskenta jne. Näiden operaatioiden suorittamista matematiikassa koskevat säännöt on kehitetty yksityiskohtaisesti paikkalukujärjestelmässä esitetyille numeroille.

Peruslukujärjestelmä numeroiden esittämiseen tietokoneessa on binääripaikkalukujärjestelmä.

Tekstitietojen koodaus

Tällä hetkellä useimmat käyttäjät käyttävät tietokonetta tekstitietojen käsittelyyn, joka koostuu symboleista: kirjaimista, numeroista, välimerkeistä jne. Lasketaan kuinka monta symbolia ja kuinka monta bittiä tarvitsemme.

10 numeroa, 12 välimerkkiä, 15 aritmeettista symbolia, venäjän ja latinalaisen aakkoston kirjaimia, YHTEENSÄ: 155 merkkiä, mikä vastaa 8 bittiä tietoa.

Tiedon mittayksiköt.

1 tavu = 8 bittiä

1 kt = 1024 tavua

1 Mt = 1024 kt

1 Gt = 1024 Mt

1 Tt = 1024 Gt

Koodauksen ydin on, että jokaiselle merkille annetaan binäärikoodi 00000000 - 11111111 tai vastaava desimaalikoodi välillä 0 - 255.

On muistettava, että tällä hetkellä venäläisten kirjainten koodaukseen käytetään viittä eri kooditaulukkoa (KOI - 8, CP1251, CP866, Mac, ISO), ja yhdellä taulukolla koodatut tekstit eivät näy oikein toisessa.

Merkkikoodauksen päänäyttö on ASCII-koodi - American Standard Code for Information Interchange, joka on 16 x 16 taulukko, jossa merkit on koodattu heksadesimaalilukujärjestelmään.

symbolisen (teksti) tiedon oding.

Päätoiminto yksittäisille tekstin merkeille on merkkien vertailu.

Merkkejä verrattaessa tärkeimpiä näkökohtia ovat kunkin merkin koodin ainutlaatuisuus ja tämän koodin pituus, ja itse koodausperiaatteen valinnalla ei ole käytännössä merkitystä.

Tekstien koodaamiseen käytetään erilaisia ​​muunnostaulukoita. On tärkeää, että samaa taulukkoa käytetään samaa tekstiä koodattaessa ja dekoodattaessa.

Muunnostaulukko on taulukko, joka sisältää luettelon jollain tavalla järjestetyistä koodatuista merkeistä, jonka mukaan merkki muunnetaan binäärikoodikseen ja takaisin.

Suosituimmat muunnostaulukot: DKOI-8, ASCII, CP1251, Unicode.

Historiallisesti merkkikoodauksen koodipituudeksi valittiin 8 bittiä tai 1 tavu. Siksi useimmiten yksi tietokoneelle tallennetun tekstin merkki vastaa yhtä muistitavua.

8-bittisellä koodilla voi olla 28 = 256 erilaista 0:n ja 1:n yhdistelmää, joten yhdellä muunnostaulukolla voidaan koodata enintään 256 merkkiä. 2 tavun (16 bitin) koodilla voidaan koodata 65536 merkkiä.

7. Aiheen ”Tieto ja hallinta” peruskäsitteet: tiedon graafinen koodaus.

Graafisten tietojen koodaus.

Tärkeä vaihe graafisen kuvan koodauksessa on sen jakaminen erillisiin elementteihin (näytteenotto).

Tärkeimmät tavat esittää grafiikkaa tallennettavaksi ja prosessoitavaksi tietokoneella ovat rasteri- ja vektorikuvat

Vektorikuva on graafinen objekti, joka koostuu geometrisista alkeismuodoista (useimmiten segmenteistä ja kaarista). Näiden alkeisosien sijainti määräytyy pisteiden koordinaattien ja säteen mukaan. Jokaiselle riville ilmoitetaan binäärikoodit viivan tyypille (yhtenäinen, katkoviiva, katkoviiva), paksuus ja väri.

Rasterikuva on joukko pisteitä (pikseleitä), jotka on saatu matriisiperiaatteen mukaisen kuvan näytteistyksen tuloksena.

Graafisten kuvien koodauksen matriisiperiaate on, että kuva jaetaan tiettyyn määrään rivejä ja sarakkeita. Sitten tuloksena olevan ruudukon jokainen elementti koodataan valitun säännön mukaisesti.

Pikseli (kuvaelementti) on kuvan vähimmäisyksikkö, jonka väri ja kirkkaus voidaan asettaa muusta kuvasta riippumatta.

Matriisiperiaatteen mukaisesti kuvat muodostetaan, tulostetaan tulostimelle, näytetään näytöllä ja saadaan skannerin avulla.

Mitä korkeampi kuvanlaatu on, sitä tiheämpiä pikselit ovat, eli sitä korkeampi on laitteen resoluutio ja sitä tarkemmin kunkin niistä väri on koodattu.

Mustavalkokuvassa kunkin pikselin värikoodi määritetään yhdellä bitillä.

Jos kuva on värillinen, jokaiselle pisteelle määritetään sen värin binäärikoodi.

Koska värit on koodattu binäärikoodilla, jos esimerkiksi haluat käyttää 16-väristä kuvaa, tarvitset 4 bittiä (16=24) jokaisen pikselin koodaamiseen ja jos on mahdollista käyttää 16 bittiä (2 tavua) koodataksesi värin yhden pikselin, voit lähettää 216 = 65536 eri väriä. Kolmen tavun (24 bitin) käyttäminen yhden pisteen värin koodaamiseen mahdollistaa 16 777 216 (noin 17 miljoonan) eri värisävyn heijastuksen - niin sanotun "todellisen värin" -tilan. Huomaa, että niitä käytetään tällä hetkellä, mutta ne ovat kaukana nykyaikaisten tietokoneiden enimmäisominaisuuksista.

8 Tiedonhallinta-aiheen peruskäsitteet: aakkoset, koodi

Aakkoset ovat järjestettyjä merkkejä, joita käytetään viestien koodaamiseen jollakin kielellä.

Aakkosten teho on aakkosten merkkien lukumäärä.
Binääriaakkosissa on 2 merkkiä, sen teho on kaksi.
ASCII-merkeillä kirjoitetuissa viesteissä käytetään 256-merkkistä aakkostoa. UNICODE-kielellä kirjoitetut viestit käyttävät 65 536 merkin pituista aakkostoa.

Tietojenkäsittelytieteen näkökulmasta tiedonvälittäjät ovat mitä tahansa symbolisarjaa, joka tallennetaan, siirretään ja käsitellään tietokoneen avulla. Kolmogorovin mukaan symbolisarjan informaatiosisältö ei riipu viestin sisällöstä, vaan aakkosellinen lähestymistapa on objektiivinen, ts. se ei riipu viestin vastaanottavasta aiheesta.

9 Tiedon mittauksen peruskäsitteet: bitti, tavu, kilotavu, megatavu

Bitti, tavu, kilotavu, megatavu, gigatavu– Nämä ovat tiedon mittayksiköitä.

Totta, tietokonelaskelmissa 1 kilotavu ei ole 1000 tavua, vaan 1024. Miksi niin paljon? Tietokoneessa oleva tieto esitetään binäärimuodossa ja yleisesti on hyväksytty, että kilotavu on tavun 2:sta kymmenesosaan eli 1024 tavua.
Yleiset yksiköt on esitetty alla.

10 Tiedon kvantitatiivinen ja laadullinen mittaaminen.

11 Aakkosellinen ja sisältöllinen lähestymistapa tiedon mittaamiseen

Nykyaikainen tietokone pystyy käsittelemään numeerista, tekstiä, grafiikkaa, ääntä ja videoinformaatiota. Kaikki tämän tyyppiset tiedot tietokoneessa esitetään binäärikoodina, eli käytetään aakkosia, joiden kapasiteetti on kaksi merkkiä (0 ja 1). Tämä johtuu siitä, että on kätevää esittää tietoa sähköisten impulssien sarjan muodossa: impulssia ei ole (0), impulssi on (1). Tällaista koodausta kutsutaan yleensä binääriksi, ja itse nollien ja ykkösten loogisia sekvenssejä kutsutaan konekieleksi.

Jokainen koneen binaarikoodin numero kuljettaa yhden bitin verran tietoa.

Tämä johtopäätös voidaan tehdä pitämällä koneen aakkosten numeroita yhtä todennäköisinä tapahtumina. Kun kirjoitat binäärinumeroa, voit valita vain yhden kahdesta mahdollisesta tilasta, mikä tarkoittaa, että se kuljettaa 1 bitin verran tietoa. Siksi kaksi numeroa kuljettaa 2 bittiä tietoa, neljä numeroa 4 bittiä jne. Tietomäärän määrittämiseksi bitteinä riittää, että määritetään numeroiden lukumäärä binäärikonekoodissa.

Tekstitietojen koodaus

Tällä hetkellä useimmat käyttäjät käyttävät tietokonetta tekstitietojen käsittelyyn, joka koostuu symboleista: kirjaimista, numeroista, välimerkeistä jne.

Yhden solun, jonka tietokapasiteetti on 1 bitti, perusteella voidaan koodata vain 2 eri tilaa. Jotta jokainen latinalaisessa tapauksessa näppäimistöltä syötettävä merkki saisi oman ainutlaatuisen binaarikoodinsa, tarvitaan 7 bittiä. 7 bitin sekvenssin perusteella Hartleyn kaavan mukaisesti voidaan saada N = 2 7 = 128 erilaista nollien ja ykkösten yhdistelmää, ts. binäärikoodit. Määrittämällä jokaiselle merkille sen binäärikoodin, saamme koodaustaulukon. Ihminen toimii symboleilla, tietokone niiden binäärikoodeilla.

Latinalaisessa näppäimistöasettelussa on vain yksi koodaustaulukko koko maailmalle, joten latinalaisasettelulla kirjoitettu teksti näkyy riittävästi kaikilla tietokoneilla. Tätä taulukkoa kutsutaan nimellä ASCII (American Standard Code of Information Interchange) englanniksi se äännetään [éski], venäjäksi se lausutaan [áski]. Alla on koko ASCII-taulukko, jonka koodit on merkitty desimaalimuodossa. Siitä voit päätellä, että kun näppäilet näppäimistöltä esimerkiksi symbolin “*”, tietokone näkee sen koodina 42(10), puolestaan ​​42(10) = 101010(2) - tämä on koodin binäärikoodi. symboli "* " Tässä taulukossa ei käytetä koodeja 0-31.

ASCII-merkkitaulukko

Yhden merkin koodaamiseksi käytetään 1 tavua vastaavaa informaatiomäärää, eli I = 1 tavu = 8 bittiä. Käyttämällä kaavaa, joka yhdistää mahdollisten tapahtumien määrän K ja tiedon määrän I, voit laskea kuinka monta erilaista symbolia voidaan koodata (olettaen, että symbolit ovat mahdollisia tapahtumia):

K = 2 I = 2 8 = 256,

eli aakkosia, joiden kapasiteetti on 256 merkkiä, voidaan käyttää esittämään tekstiinformaatiota.

Koodauksen ydin on, että jokaiselle merkille annetaan binäärikoodi 00000000 - 11111111 tai vastaava desimaalikoodi välillä 0 - 255.

On muistettava, että tällä hetkellä Venäläisten kirjainten koodaamiseen käytetään viittä erilaista kooditaulukkoa(KOI - 8, SR1251, SR866, Mac, ISO), ja yhdellä taulukolla koodatut tekstit eivät näy oikein toisessa koodauksessa. Tämä voidaan visuaalisesti esittää katkelmana yhdistetystä merkkikoodaustaulukosta.

Samalle binäärikoodille on määritetty eri symboleja.

Binäärikoodi

Desimaalikoodi

Useimmissa tapauksissa käyttäjä ei kuitenkaan vastaa tekstidokumenttien transkoodaamisesta, vaan sovelluksiin sisäänrakennetut erikoisohjelmat - muuntimet.

Vuodesta 1997 lähtien Microsoft Officen uusimmat versiot ovat tukeneet uutta koodausta. Sitä kutsutaan Unicodeksi. Unicode on koodaustaulukko, joka käyttää 2 tavua jokaisen merkin koodaamiseen, ts. 16-bittinen. Tällaisen taulukon perusteella voidaan koodata N=2 16 =65 536 merkkiä.

Unicode sisältää lähes kaikki nykyaikaiset kirjaimet, mukaan lukien: arabia, armenia, bengali, burma, kreikka, georgia, devanagari, heprea, kyrillinen, kopti, khmeri, latina, tamili, hangul, han (Kiina, Japani, Korea), Cherokee, Etiopia, japanilaiset (katakana, hiragana, kanji) ja muut.

Akateemisiin tarkoituksiin on lisätty monia historiallisia kirjoituksia, mukaan lukien: antiikin kreikkalaiset, egyptiläiset hieroglyfit, nuolenpääkirjoitus, maya-kirjoitus ja etruskien aakkoset.

Unicode tarjoaa laajan valikoiman matemaattisia ja musiikillisia symboleja ja kuvakkeita.

Unicodessa on kaksi koodialuetta kyrillisille merkeille:

Kyrillinen (#0400 - #04FF)

Kyrillinen lisäosa (#0500 - #052F).

Mutta Unicode-taulukon toteutusta puhtaassa muodossaan hidastaa se, että jos yhden merkin koodi ei vie yhden tavun vaan kaksi tavua, tekstin tallentamiseen kuluu kaksi kertaa enemmän levytilaa ja kaksi kertaa enemmän levytilaa. niin paljon aikaa lähettää se viestintäkanavien kautta.

Siksi käytännössä nykyään Unicode-esitys UTF-8 (Unicode Transformation Format) on yleisempi. UTF-8 tarjoaa parhaan yhteensopivuuden 8-bittisiä merkkejä käyttävien järjestelmien kanssa. Teksti, jossa on vain alle 128 numeroituja merkkejä, muunnetaan tavalliseksi ASCII-tekstiksi, kun se kirjoitetaan UTF-8:ssa. Muut Unicode-merkit esitetään 2–4 tavun pituisina sarjoina. Yleisesti ottaen, koska maailman yleisimmät merkit, latinalaiset aakkoset, vievät edelleen yhden tavun UTF-8:ssa, tämä koodaus on taloudellisempaa kuin pelkkä Unicode.

Voit määrittää merkin numeerisen koodin joko kooditaulukon avulla. Voit tehdä tämän valitsemalla valikosta "Lisää" - "Symboli", jonka jälkeen Symboli-valintaikkuna ilmestyy näytölle. Valitun fontin merkkitaulukko tulee näkyviin valintaikkunaan. Tämän taulukon merkit on järjestetty rivi riviltä, ​​peräkkäin vasemmalta oikealle alkaen välilyönnistä.