Bilgisayar bilimlerinde çok sayıda bilgi süreci bilgisayar kullanılarak gerçekleştirilir. veri kodlama. Dolayısıyla bu bilimin temellerini kavrarken bu süreci anlamak çok önemlidir. Bilgi kodlama, farklı doğal dillerde (Rusça, İngilizce vb.) yazılan sembollerin dijital gösterime dönüştürülmesi işlemini ifade eder.

Bu, metni kodlarken her karaktere sıfırlar ve birler biçiminde belirli bir değer atandığı anlamına gelir - .

Neden bilgiyi kodlayalım?

Öncelikle soruyu cevaplamanız gerekiyor neden bilgiyi kodla? Gerçek şu ki, bir bilgisayar yalnızca bir tür veri temsilini (dijital) işleyebilir ve saklayabilir. Bu nedenle, içerdiği her türlü bilginin tercüme edilmesi gerekmektedir. dijital görünüm.

Metin kodlama standartları

Tüm bilgisayarların bunu veya bu metni açıkça anlayabilmesi için genel kabul görmüş yöntemlerin kullanılması gerekir. metin kodlama standartları. Diğer durumlarda ek kayıt veya veri uyumsuzluğu gerekli olacaktır.



ASCII

İlk bilgisayar karakter kodlama standardı ASCII'dir (tam ad - Bilgi Değişimi için Amerikan Standart Kodu). Herhangi bir karakteri kodlamak için yalnızca 7 bit kullanıldı. Hatırlayacağınız gibi 7 bit kullanarak yalnızca 27 karakteri veya 128 karakteri kodlayabiliyorsunuz. Bu, Latin alfabesinin büyük ve küçük harflerini, Arap rakamlarını, noktalama işaretlerini ve ayrıca dolar işareti - “$” gibi belirli bir dizi özel karakteri kodlamak için yeterlidir. Ancak diğer ulusların alfabelerindeki karakterleri (Rus alfabesindeki karakterler dahil) kodlamak için kodun 8 bit (28=256 karakter) ile tamamlanması gerekiyordu. Aynı zamanda her dil kendi ayrı kodlamasını kullanıyordu.

UNICODE

Uyumluluk açısından durumu kurtarmak gerekiyordu kodlama tabloları. Bu nedenle zamanla yeni güncellenen standartlar geliştirildi. Şu anda en popüler kodlamaya denir UNICODE. İçinde her karakter 2 byte kullanılarak kodlanmıştır, bu da 216=62536 farklı koda karşılık gelir.



Grafik Kodlama Standartları

Bir görüntüyü kodlamak, karakterleri kodlamaktan çok daha fazla bayt alır. Bilgisayar belleğinde saklanan, oluşturulan ve işlenen görüntülerin çoğu iki ana gruba ayrılır:

  • raster grafik görüntüleri;
  • vektör grafik görüntüleri.

Raster grafikler

Raster grafiklerde, bir görüntü bir dizi renkli noktayla temsil edilir. Bu tür noktalara piksel denir. Görüntü büyütüldüğünde bu noktalar karelere dönüşür.


Siyah beyaz bir görüntüyü kodlamak için her piksel bir bit ile kodlanır. Örneğin siyah 0, beyaz ise 1'dir)


Geçmiş görselimiz şu şekilde kodlanabilir:

Renkli olmayan görüntüleri kodlarken çoğunlukla beyazdan siyaha kadar 256 gri tondan oluşan bir palet kullanılır. Dolayısıyla böyle bir derecelendirmeyi kodlamak için bir byte yeterlidir (28=256).


Renkli görüntü kodlamasında çeşitli renk şemaları kullanılır.




Pratikte daha sık kullanılırlar RGB renk modeli sırasıyla üç ana rengin kullanıldığı yer: kırmızı, yeşil ve mavi. Bu ana renklerin karıştırılmasıyla diğer renk tonları elde edilir.


Böylece üç renkten oluşan bir modelin 256 tona kodlanmasıyla 16,5 milyonun üzerinde farklı renk tonu elde ediliyor. Yani kodlama için 3 byte'a karşılık gelen 3⋅8=24 bit kullanılır.


Doğal olarak, renkli görüntüleri kodlamak için minimum sayıda bit kullanabilirsiniz, ancak daha sonra daha az sayıda renk tonu oluşturulabilir ve dolayısıyla görüntü kalitesi önemli ölçüde düşecektir.


Bir görüntünün boyutunu belirlemek için genişlikteki piksel sayısını uzunluktaki piksel sayısıyla çarpmanız ve tekrar pikselin bayt cinsinden boyutuyla çarpmanız gerekir.


  • A- genişlikteki piksel sayısı;
  • B- uzunluktaki piksel sayısı;
  • BEN– bayt cinsinden bir pikselin boyutu.

Örneğin 800⋅600 piksel boyutundaki renkli bir görüntü 60.000 bayt yer kaplar.

Vektör grafikleri

Vektör grafik nesneleri tamamen farklı şekilde kodlanmıştır. Burada görüntü kendi eğrilik katsayılarına sahip olabilen çizgilerden oluşmaktadır.



Ses kodlama standartları

Bir kişinin duyduğu sesler hava titreşimleridir. Ses titreşimleri dalga yayılım sürecidir.

Sesin iki temel özelliği vardır:

  • titreşim genliği - sesin seviyesini belirler;
  • titreşim frekansı - sesin tonalitesini belirler.


Ses, mikrofon kullanılarak elektrik sinyaline dönüştürülebilir. Ses belirli, önceden belirlenmiş bir zaman aralığında kodlanır. Bu durumda elektrik sinyalinin boyutu ölçülür ve ikili bir değer atanır. Bu ölçümler ne kadar sık ​​yapılırsa ses kalitesi de o kadar yüksek olur.




700 MB'lık bir CD, yaklaşık 80 dakikalık CD kalitesinde ses tutar.

Video Kodlama Standartları

Bildiğiniz gibi video dizileri hızla değişen parçalardan oluşuyor. Çerçeve değişiklikleri saniyede 24-60 kare aralığında bir hızda gerçekleşir.

Video dizisinin bayt cinsinden boyutu, çerçeve boyutuna (ekran başına yükseklik ve genişlikteki piksel sayısı), kullanılan renk sayısına ve saniyedeki kare sayısına göre belirlenir. Ancak bununla birlikte bir ses bandı da olabilir.

Aynı bilgi çeşitli şekillerde sunulabilir. Temel kodlama yöntemleri modern dünyada bunun yapılmasına olanak sağlar. Bilgisayar teknolojisinin ortaya çıkışından sonra, kişinin çalıştığı her türlü bilgiyi kodlama ihtiyacı ortaya çıktı. Ancak bu tür problemlerin çözümü bilgisayarların ortaya çıkışından çok önce başladı.

Yöntemlere göre gezgin

1 yol. İkili kodlama.

İkili kodlama, bilgi sunmanın en popüler ve yaygın yöntemlerinden biri olarak kabul edilir. Bilgisayarlarla, robotlarla ve sayısal olarak kontrol edilen makinelerle çalışırken bilgi çoğunlukla ikili alfabedeki kelimeler biçiminde kodlanır.

İlginç: C sürücüsünü temizlemenin 10 yolu

Yöntem 2. Kısa gösterim.

Bu yöntem, metin bilgilerinin özel karakterler kullanılarak kodlanmasına yönelik bir yöntem olarak sınıflandırılır. Bu yöntem, konuşulan dili kaydederken en hızlı yöntemdir. Yalnızca stenograf adı verilen özel eğitimli bazı kişiler stenografi becerisine sahiptir. Bu tür kişiler, konuşan kişinin konuşmasıyla eşzamanlı olarak metni yazmayı başarırlar.

3 yollu. Senkronizasyon.

Dijital bilgilerle çalışma sürecinde senkronizasyon özellikle önemlidir. Bilgilerin okunması veya kaydedilmesi sırasında, her burç değişikliğinin zamanının doğru bir şekilde belirlenmesi önemlidir. Senkronizasyon olmazsa işaret değişikliğinin süresi yanlış belirlenebilir. Sonuç olarak, kaçınılmaz olarak veri kaybı veya bozulması meydana gelecektir.

4 yol. Çalışma Uzunluğu Sınırlı - RLL.

Günümüzde en popüler yöntemlerden biri, kayıt alanı uzunluğu sınırlaması ile bilginin kodlanmasıdır. Bu yöntem sayesinde diske, MFM yöntemi kullanılarak yapılan kayıt işlemine göre bir buçuk kat daha fazla veri yerleştirilebilir. Bu yöntemi kullanarak tek bir bit değil, grubun tamamı kodlanır.

İlginç: Dosyaları hırsızlığa karşı korumanın 10 yolu

5 yollu. Dönüşüm tabloları.

Dönüştürme tablosu, özel bir şekilde sıralanmış, kodlanmış karakterlerin bir listesini içeren tablodur. Buna göre sembol, ikili koda dönüştürülür ve bunun tersi de geçerlidir.

6 yollu. Matris yöntemi.

Grafik görüntüleri kodlamanın matris ilkesi, resmin belirli sayıda sütun ve satıra bölünmesidir. Bundan sonra ortaya çıkan ızgaranın her bir öğesi seçilen kurala göre kodlanır.

Şimdi bir yorum yaz!

Kod, önceden tanımlanmış bazı kavramları kaydetmeye (veya iletmeye) yönelik bir dizi kuraldır (veya sinyaldir).

Bilgi kodlama, bilginin belirli bir temsilini oluşturma sürecidir. Daha dar anlamda, "kodlama" terimi genellikle bir bilgi temsili biçiminden depolama, iletim veya işleme için daha uygun olan diğerine geçiş olarak anlaşılır.

Genellikle, kodlama sırasındaki her görüntü (bazen şifreleme olarak da adlandırılır) ayrı bir işaretle temsil edilir.

İşaret, birbirinden farklı sonlu öğeler kümesinin bir öğesidir.

Daha dar anlamda, "kodlama" terimi genellikle bir bilgi temsili biçiminden depolama, iletim veya işleme için daha uygun olan diğerine geçiş olarak anlaşılır.

Bir bilgisayar yalnızca sayısal biçimde sunulan bilgileri işleyebilir. Diğer tüm bilgilerin (örneğin sesler, görüntüler, enstrüman okumaları vb.) bilgisayarda işlenmek üzere sayısal forma dönüştürülmesi gerekir. Örneğin, bir müzik sesini ölçmek için, her ölçümün sonuçları sayısal biçimde temsil edilerek, sesin belirli frekanslardaki yoğunluğu kısa aralıklarla ölçülebilir. Bilgisayar programlarını kullanarak, alınan bilgileri dönüştürebilirsiniz, örneğin farklı kaynaklardan gelen sesleri üst üste "üst üste bindirebilirsiniz".

Benzer şekilde metin bilgisi bilgisayarda işlenebilir. Bilgisayara girildiğinde her harf belirli bir sayı ile kodlanır ve harici cihazlara (ekran veya çıktı) çıktısı alındığında bu sayılardan insan algısı için harf görüntüleri oluşturulur. Bir dizi harf ve sayı arasındaki yazışmalara karakter kodlaması denir.

Kural olarak, bir bilgisayardaki tüm sayılar sıfırlar ve birler kullanılarak temsil edilir (insanlarda yaygın olduğu gibi on rakam değil). Başka bir deyişle, bilgisayarlar genellikle ikili sayı sisteminde çalışır, çünkü bu, onları işleyen cihazları çok daha basit hale getirir. Sayıların bir bilgisayara girilmesi ve bunların insan tarafından okunması için çıktısı alınması olağan ondalık biçimde yapılabilir ve gerekli tüm dönüşümler bilgisayarda çalışan programlar tarafından gerçekleştirilir.

Bilgiyi kodlama yöntemleri.

Aynı bilgi çeşitli şekillerde sunulabilir (kodlanabilir). Bilgisayarların ortaya çıkışıyla birlikte hem bireyin hem de bir bütün olarak insanlığın uğraştığı her türlü bilgiyi kodlama ihtiyacı ortaya çıktı. Ancak insanlık, bilgisayarların ortaya çıkmasından çok önce bilgiyi kodlama sorununu çözmeye başladı. İnsanlığın görkemli başarıları - yazma ve aritmetik - konuşmayı ve sayısal bilgileri kodlamak için bir sistemden başka bir şey değildir. Bilgi hiçbir zaman saf haliyle ortaya çıkmaz, her zaman bir şekilde sunulur, bir şekilde kodlanır.

İkili kodlama, bilgiyi temsil etmenin yaygın yollarından biridir. Bilgisayarlarda, robotlarda ve sayısal olarak kontrol edilen makinelerde, kural olarak, cihazın ilgilendiği tüm bilgiler ikili alfabedeki kelimeler biçiminde kodlanır.

Sembolik (metin) bilgilerin kodlanması.

Bireysel metin karakterleri üzerinde gerçekleştirilen ana işlem karakter karşılaştırmasıdır.

Karakterleri karşılaştırırken en önemli hususlar, her karakter için kodun benzersizliği ve bu kodun uzunluğudur ve kodlama ilkesinin seçiminin kendisi pratikte önemsizdir.

Metinleri kodlamak için çeşitli dönüşüm tabloları kullanılır. Aynı metni kodlarken ve çözerken aynı tablonun kullanılması önemlidir.

Dönüştürme tablosu, karakterin ikili koduna dönüştürüldüğü ve buna göre bir şekilde sıralanmış kodlanmış karakterlerin bir listesini içeren bir tablodur.

En popüler dönüşüm tabloları: DKOI-8, ASCII, CP1251, Unicode.

Geçmişte, karakter kodlaması için kod uzunluğu olarak 8 bit veya 1 bayt seçilmişti. Bu nedenle, çoğu zaman bilgisayarda saklanan bir metin karakteri, bir bayt belleğe karşılık gelir.

8 bitlik kod uzunluğuyla, 0 ve 1'in 28 = 256 farklı kombinasyonu olabilir, yani bir dönüşüm tablosu kullanılarak 256'dan fazla karakter kodlanamaz. 2 byte (16 bit) kod uzunluğu ile 65536 karakter kodlanabilmektedir.

Sayısal bilgilerin kodlanması.

Sayısal ve metin bilgilerinin kodlanmasındaki benzerlik şu şekildedir: Bu türdeki verileri karşılaştırmak için farklı sayıların (farklı karakterlerin yanı sıra) farklı bir koda sahip olması gerekir. Sayısal veriler ile sembolik veriler arasındaki temel fark, karşılaştırma işlemine ek olarak sayılar üzerinde çeşitli matematiksel işlemlerin yapılmasıdır: toplama, çarpma, kök çıkarma, logaritma hesaplama vb. Matematikte bu işlemleri gerçekleştirmeye yönelik kurallar ayrıntılı olarak geliştirilmiştir. konumsal sayı sisteminde temsil edilen sayılar için.

Bilgisayardaki sayıları temsil eden temel sayı sistemi, ikili konumsal sayı sistemidir.

Metin bilgilerini kodlama

Şu anda çoğu kullanıcı, sembollerden oluşan metin bilgilerini işlemek için bir bilgisayar kullanıyor: harfler, sayılar, noktalama işaretleri vb. Kaç sembole ve kaç bit'e ihtiyacımız olduğunu hesaplayalım.

10 sayı, 12 noktalama işareti, 15 aritmetik sembol, Rus ve Latin alfabesinin harfleri, TOPLAM: 155 karakter, 8 bit bilgiye karşılık gelir.

Bilgi ölçüm birimleri.

1 bayt = 8 bit

1 KB = 1024 bayt

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Kodlamanın özü, her karaktere 00000000 ila 11111111 arasında bir ikili kod veya 0 ila 255 arasında karşılık gelen bir ondalık kod atanmasıdır.

Şu anda Rusça harfleri kodlamak için beş farklı kod tablosunun kullanıldığı (KOI - 8, CP1251, CP866, Mac, ISO) ve bir tablo kullanılarak kodlanan metinlerin diğerinde doğru şekilde görüntülenmeyeceği unutulmamalıdır.

Karakter kodlamanın ana ekranı, karakterlerin onaltılık gösterimle kodlandığı 16'ya 16'lık bir tablo olan ASCII kodu - Bilgi Değişimi için Amerikan Standart Kodu'dur.

Grafik bilgilerinin kodlanması.

Bir grafik görüntüyü kodlamanın önemli bir adımı, onu ayrı öğelere bölmektir (örnekleme).

Bilgisayar kullanarak depolama ve işleme için grafikleri temsil etmenin ana yolları raster ve vektör görüntülerdir

Bir vektör görüntüsü, temel geometrik şekillerden (çoğunlukla bölümler ve yaylar) oluşan bir grafik nesnesidir. Bu temel bölümlerin konumu, noktaların koordinatları ve yarıçap tarafından belirlenir. Her çizgi için çizgi türü (düz, noktalı, kesikli noktalı), kalınlık ve renk için ikili kodlar belirtilir.

Raster görüntü, matris ilkesine uygun olarak görüntü örneklemesi sonucunda elde edilen noktaların (piksellerin) bir koleksiyonudur.

Grafik görüntüleri kodlamanın matris ilkesi, görüntünün belirli sayıda satır ve sütuna bölünmesidir. Daha sonra ortaya çıkan ızgaranın her bir öğesi seçilen kurala göre kodlanır.

Piksel (resim öğesi), rengi ve parlaklığı görüntünün geri kalanından bağımsız olarak ayarlanabilen minimum görüntü birimidir.

Matris ilkesine uygun olarak görüntüler oluşturulur, yazıcıya gönderilir, ekranda görüntülenir ve bir tarayıcı kullanılarak elde edilir.

Görüntü kalitesi ne kadar yüksek olursa pikseller o kadar yoğun olur, yani cihazın çözünürlüğü o kadar yüksek olur ve her birinin rengi o kadar doğru kodlanır.

Siyah beyaz bir görüntü için her pikselin renk kodu bir bitle belirtilir.

Resim renkliyse, her nokta için rengine ilişkin bir ikili kod belirtilir.

Renkler ikili kodla kodlandığından, örneğin 16 renkli bir resim kullanmak istiyorsanız, her pikseli kodlamak için 4 bit'e (16=24) ihtiyacınız olacaktır; eğer mümkünse 16 bit (2) kullanmak mümkün olacaktır. Bayt) rengi bir piksel kodlamak için 216 = 65536 farklı renk iletebilirsiniz. Tek bir noktanın rengini kodlamak için üç bayt (24 bit) kullanmak, 16.777.216 (veya yaklaşık 17 milyon) farklı renk tonunu - sözde "gerçek renk" modunu yansıtmanıza olanak tanır. Bunların şu anda kullanıldığını ancak modern bilgisayarların maksimum yeteneklerinden uzak olduğunu unutmayın.

Ses bilgilerinin kodlanması.

Fizik dersinizden sesin hava titreşimleri olduğunu biliyorsunuz. Doğası gereği ses sürekli bir sinyaldir. Sesi bir elektrik sinyaline dönüştürürsek (örneğin bir mikrofon kullanarak), voltajın zaman içinde düzgün bir şekilde değiştiğini göreceğiz.

Bilgisayarda işlem yapmak için, bir analog sinyalin bir şekilde bir ikili sayı dizisine dönüştürülmesi ve bunu yapmak için de örneklenmesi ve sayısallaştırılması gerekir.

Şunları yapabilirsiniz: Sinyal genliğini düzenli aralıklarla ölçün ve elde edilen sayısal değerleri bilgisayar belleğine yazın.

Bilgilerin kodlanması. Bilginin bir temsil biçiminden (işaret sistemi) diğerine dönüştürülmesi sürecinde kodlama gerçekleştirilir. Kodlama aracı, iki farklı işaret sisteminin işaretleri veya işaret grupları arasında bire bir yazışmalar kuran bir yazışma tablosudur.

Bilgi alışverişi sürecinde, bilgilerin kodlanması ve kodunun çözülmesi işlemlerinin gerçekleştirilmesi sıklıkla gereklidir. Klavyedeki ilgili tuşa basarak bilgisayara bir alfabe karakteri girdiğinizde kodlanır, yani bilgisayar koduna dönüştürülür. Bir monitör ekranında veya yazıcıda bir işaret görüntülendiğinde, işaretin bir bilgisayar kodundan grafik bir görüntüye dönüştürülmesiyle ters işlem gerçekleşir - kod çözme.

Görüntü ve ses kodlaması. Grafik ve ses dahil bilgiler analog veya ayrık biçimde sunulabilir. Analog gösterimle fiziksel bir nicelik sonsuz sayıda değer alır ve değerleri sürekli değişir. Ayrık bir gösterimle, fiziksel bir nicelik sonlu bir değerler kümesi alır ve değeri aniden değişir.

Grafik bilginin analog temsilinin bir örneği, örneğin rengi sürekli değişen bir tablodur ve ayrık bir temsil, mürekkep püskürtmeli yazıcı kullanılarak basılan ve farklı renklerde ayrı noktalardan oluşan bir görüntüdür.

Ses bilgisinin analog olarak depolanmasına bir örnek, bir vinil kayıttır (ses bandının şekli sürekli olarak değişir) ve ayrı bir örnek ise bir ses CD'sidir (ses parçası farklı yansıtıcılığa sahip alanlar içerir).

Analogdan ayrık forma grafik ve ses bilgisi örnekleme yoluyla, yani sürekli bir grafik görüntüyü ve sürekli (analog) bir ses sinyalini ayrı öğelere bölerek dönüştürülür. Örnekleme süreci kodlamayı, yani her öğeye kod biçiminde belirli bir değer atamayı içerir.

Örnekleme, sürekli görüntülerin ve sesin, her birine kendi kodunun bir değeri atanan bir dizi ayrık değere dönüştürülmesidir.

Canlı organizmalarda bilginin kodlanması. Genetik bilgi, canlı organizmaların yapısını ve gelişimini belirler ve kalıtsal olarak aktarılır. Genetik bilgi organizmaların hücrelerinde DNA (deoksiribonükleik asit) moleküllerinin yapısında depolanır. DNA molekülleri genetik alfabeyi oluşturan dört farklı bileşenden (nükleotid) oluşur.

İnsan DNA molekülü yaklaşık üç milyar nükleotid çifti içerir ve insan vücudu hakkındaki tüm bilgileri kodlar: görünümü, sağlığı veya hastalığa duyarlılığı, yetenekleri vb.

6. “Bilgi ve Yönetim” konusunun temel kavramları: bilginin sayısal ve sembolik kodlanması

Sayısal bilgilerin kodlanması.

Sayısal ve metin bilgilerinin kodlanmasındaki benzerlik şu şekildedir: Bu türdeki verileri karşılaştırmak için farklı sayıların (farklı karakterlerin yanı sıra) farklı bir koda sahip olması gerekir. Sayısal veriler ile sembolik veriler arasındaki temel fark, karşılaştırma işlemine ek olarak sayılar üzerinde çeşitli matematiksel işlemlerin yapılmasıdır: toplama, çarpma, kök çıkarma, logaritma hesaplama vb. Matematikte bu işlemleri gerçekleştirmeye yönelik kurallar ayrıntılı olarak geliştirilmiştir. konumsal sayı sisteminde temsil edilen sayılar için.

Bilgisayardaki sayıları temsil eden temel sayı sistemi, ikili konumsal sayı sistemidir.

Metin bilgilerini kodlama

Şu anda çoğu kullanıcı, sembollerden oluşan metin bilgilerini işlemek için bir bilgisayar kullanıyor: harfler, sayılar, noktalama işaretleri vb. Kaç sembole ve kaç bit'e ihtiyacımız olduğunu hesaplayalım.

10 sayı, 12 noktalama işareti, 15 aritmetik sembol, Rus ve Latin alfabesinin harfleri, TOPLAM: 155 karakter, 8 bit bilgiye karşılık gelir.

Bilgi ölçüm birimleri.

1 bayt = 8 bit

1 KB = 1024 bayt

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Kodlamanın özü, her karaktere 00000000 ila 11111111 arasında bir ikili kod veya 0 ila 255 arasında karşılık gelen bir ondalık kod atanmasıdır.

Şu anda Rusça harfleri kodlamak için beş farklı kod tablosunun kullanıldığı (KOI - 8, CP1251, CP866, Mac, ISO) ve bir tablo kullanılarak kodlanan metinlerin diğerinde doğru şekilde görüntülenmeyeceği unutulmamalıdır.

Karakter kodlamanın ana ekranı, karakterlerin onaltılık gösterimle kodlandığı 16'ya 16'lık bir tablo olan ASCII kodu - Bilgi Değişimi için Amerikan Standart Kodu'dur.

sembolik (metin) bilgilerin düzenlenmesi.

Bireysel metin karakterleri üzerinde gerçekleştirilen ana işlem karakter karşılaştırmasıdır.

Karakterleri karşılaştırırken en önemli hususlar, her karakter için kodun benzersizliği ve bu kodun uzunluğudur ve kodlama ilkesinin seçiminin kendisi pratikte önemsizdir.

Metinleri kodlamak için çeşitli dönüşüm tabloları kullanılır. Aynı metni kodlarken ve çözerken aynı tablonun kullanılması önemlidir.

Dönüştürme tablosu, karakterin ikili koduna dönüştürüldüğü ve buna göre bir şekilde sıralanmış kodlanmış karakterlerin bir listesini içeren bir tablodur.

En popüler dönüşüm tabloları: DKOI-8, ASCII, CP1251, Unicode.

Geçmişte, karakter kodlaması için kod uzunluğu olarak 8 bit veya 1 bayt seçilmişti. Bu nedenle, çoğu zaman bilgisayarda saklanan bir metin karakteri, bir bayt belleğe karşılık gelir.

8 bitlik kod uzunluğuyla, 0 ve 1'in 28 = 256 farklı kombinasyonu olabilir, yani bir dönüşüm tablosu kullanılarak 256'dan fazla karakter kodlanamaz. 2 byte (16 bit) kod uzunluğu ile 65536 karakter kodlanabilmektedir.

7. “Bilgi ve Yönetim” konusunun temel kavramları: bilginin grafik kodlaması.

Grafik bilgilerinin kodlanması.

Bir grafik görüntüyü kodlamanın önemli bir adımı, onu ayrı öğelere bölmektir (örnekleme).

Bilgisayar kullanarak depolama ve işleme için grafikleri temsil etmenin ana yolları raster ve vektör görüntülerdir

Bir vektör görüntüsü, temel geometrik şekillerden (çoğunlukla bölümler ve yaylar) oluşan bir grafik nesnesidir. Bu temel bölümlerin konumu, noktaların koordinatları ve yarıçap tarafından belirlenir. Her çizgi için çizgi türü (düz, noktalı, kesikli noktalı), kalınlık ve renk için ikili kodlar belirtilir.

Raster görüntü, matris ilkesine uygun olarak görüntü örneklemesi sonucunda elde edilen noktaların (piksellerin) bir koleksiyonudur.

Grafik görüntüleri kodlamanın matris ilkesi, görüntünün belirli sayıda satır ve sütuna bölünmesidir. Daha sonra ortaya çıkan ızgaranın her bir öğesi seçilen kurala göre kodlanır.

Piksel (resim öğesi), rengi ve parlaklığı görüntünün geri kalanından bağımsız olarak ayarlanabilen minimum görüntü birimidir.

Matris ilkesine uygun olarak görüntüler oluşturulur, yazıcıya gönderilir, ekranda görüntülenir ve bir tarayıcı kullanılarak elde edilir.

Görüntü kalitesi ne kadar yüksek olursa pikseller o kadar yoğun olur, yani cihazın çözünürlüğü o kadar yüksek olur ve her birinin rengi o kadar doğru kodlanır.

Siyah beyaz bir görüntü için her pikselin renk kodu bir bitle belirtilir.

Resim renkliyse, her nokta için rengine ilişkin bir ikili kod belirtilir.

Renkler ikili kodla kodlandığından, örneğin 16 renkli bir resim kullanmak istiyorsanız, her pikseli kodlamak için 4 bit'e (16=24) ihtiyacınız olacaktır; eğer mümkünse 16 bit (2) kullanmak mümkün olacaktır. Bayt) rengi bir piksel kodlamak için 216 = 65536 farklı renk iletebilirsiniz. Tek bir noktanın rengini kodlamak için üç bayt (24 bit) kullanmak, 16.777.216 (veya yaklaşık 17 milyon) farklı renk tonunu - sözde "gerçek renk" modunu yansıtmanıza olanak tanır. Bunların şu anda kullanıldığını ancak modern bilgisayarların maksimum yeteneklerinden uzak olduğunu unutmayın.

8 “Bilgi ve Yönetim” konusunun temel kavramları: alfabe, kod

Alfabe, bir dildeki mesajları kodlamak için kullanılan sıralı bir karakter kümesidir.

Alfabenin gücü, alfabedeki karakter sayısıdır.
İkili alfabe 2 karakter içerir, gücü ikidir.
ASCII karakterleri kullanılarak yazılan mesajlarda 256 karakterlik bir alfabe kullanılır. UNICODE ile yazılan mesajlarda 65.536 karakterlik bir alfabe kullanılır.

Bilgisayar bilimi açısından bilgi taşıyıcıları, bir bilgisayar kullanılarak saklanan, iletilen ve işlenen herhangi bir sembol dizisidir. Kolmogorov'a göre bir sembol dizisinin bilgi içeriği mesajın içeriğine bağlı değildir; alfabetik yaklaşım nesneldir, yani. mesajı alan kişiye bağlı değildir.

9 Bilgi ölçümüne ilişkin temel kavramlar: bit, bayt, kilobayt, megabayt

Bit, Bayt, Kilobayt, Megabayt, Gigabayt– bunlar bilgi ölçüm birimleridir.

Doğru, bilgisayar hesaplamalarında 1 kilobayt 1000 bayt değil 1024'tür. Neden bu kadar çok? Bilgisayardaki bilgiler ikili biçimde sunulur ve genel olarak bir kilobaytın baytın onda biri veya 1024 bayt olduğu kabul edilir.
Ortak birimler aşağıda gösterilmiştir.

10 Bilginin niceliksel ve niteliksel ölçümü.

11 Bilgiyi ölçmeye alfabetik ve içeriksel yaklaşımlar

Modern bir bilgisayar sayısal, metin, grafik, ses ve video bilgilerini işleyebilir. Bir bilgisayarda tüm bu tür bilgiler ikili kodla sunulur, yani iki karakter (0 ve 1) kapasiteli bir alfabe kullanılır. Bunun nedeni, bilgiyi bir dizi elektriksel impuls şeklinde temsil etmenin uygun olmasıdır: impuls (0) yoktur, bir impuls (1) vardır. Bu tür kodlamaya genellikle ikili kod adı verilir ve sıfırların ve birlerin mantıksal dizilerine makine dili adı verilir.

Makine ikili kodunun her basamağı, bir bit'e eşit miktarda bilgi taşır.

Bu sonuca, makine alfabesindeki sayıların eşit derecede olası olaylar olarak kabul edilmesiyle ulaşılabilir. İkili bir rakam yazarken, iki olası durumdan yalnızca birini seçebilirsiniz; bu, 1 bit'e eşit miktarda bilgi taşıdığı anlamına gelir. Bu nedenle iki basamak 2 bit bilgi taşır, dört basamak 4 bit vb. taşır. Bit cinsinden bilgi miktarını belirlemek için ikili makine kodundaki basamak sayısını belirlemek yeterlidir.

Metin bilgilerini kodlama

Şu anda çoğu kullanıcı, sembollerden oluşan metin bilgilerini işlemek için bir bilgisayar kullanıyor: harfler, sayılar, noktalama işaretleri vb.

1 bitlik bilgi kapasitesine sahip bir hücre baz alınarak yalnızca 2 farklı durum kodlanabilmektedir. Latin alfabesinde klavyeden girilebilen her karakterin kendine özgü ikili kodunu alabilmesi için 7 bit gereklidir. Hartley formülüne göre 7 bitlik bir diziye dayanarak, N = 2 · 7 = 128 farklı sıfır ve bir kombinasyonu elde edilebilir; ikili kodlar. Her karaktere ikili kodunu atayarak bir kodlama tablosu elde ederiz. Bir kişi sembollerle, bir bilgisayar ise onların ikili kodlarıyla çalışır.

Latin klavye düzeni için tüm dünya için yalnızca bir kodlama tablosu vardır, dolayısıyla Latin düzeni kullanılarak yazılan metin herhangi bir bilgisayarda yeterli şekilde görüntülenecektir. Bu tabloya ASCII (Amerikan Standart Bilgi Değişim Kodu) denir, İngilizce'de [éski] olarak telaffuz edilir, Rusça'da [áski] olarak telaffuz edilir. Aşağıda, kodları ondalık biçimde gösterilen ASCII tablosunun tamamı bulunmaktadır. Buradan, örneğin klavyeden “*” sembolünü girdiğinizde, bilgisayarın bunu 42(10) kodu olarak algıladığını, sırasıyla 42(10)=101010(2) olduğunu belirleyebilirsiniz - bu, ikili koddur. sembol "* " Bu tabloda 0'dan 31'e kadar olan kodlar kullanılmamaktadır.

ASCII karakter tablosu

Bir karakteri kodlamak için 1 bayta eşit miktarda bilgi kullanılır, yani I = 1 bayt = 8 bit. Olası olayların sayısı K ile bilgi miktarı I arasında ilişki kuran bir formül kullanarak, kaç farklı sembolün kodlanabileceğini hesaplayabilirsiniz (sembollerin olası olaylar olduğunu varsayarak):

K = 2 ben = 2 8 = 256,

yani, metin bilgisini temsil etmek için 256 karakter kapasiteli bir alfabe kullanılabilir.

Kodlamanın özü, her karaktere 00000000 ila 11111111 arasında bir ikili kod veya 0 ila 255 arasında karşılık gelen bir ondalık kod atanmasıdır.

Şu anda şunu unutmamak gerekir Rusça harfleri kodlamak için beş farklı kod tablosu kullanılıyor(KOI - 8, SR1251, SR866, Mac, ISO) ve bir tablo kullanılarak kodlanan metinler, başka bir kodlamada doğru şekilde görüntülenmez. Bu görsel olarak birleştirilmiş karakter kodlama tablosunun bir parçası olarak temsil edilebilir.

Aynı ikili koda farklı semboller atanır.

İkili kod

Ondalık kod

Bununla birlikte, çoğu durumda, metin belgelerinin kodunun dönüştürülmesiyle ilgilenen kullanıcı değil, uygulamalara yerleşik dönüştürücüler olan özel programlar olur.

1997'den beri Microsoft Office'in en son sürümleri yeni kodlamayı desteklemektedir. Buna Unicode denir. Unicode, her karakteri kodlamak için 2 bayt kullanan bir kodlama tablosudur; 16 bit. Böyle bir tabloya göre N=2 16 =65.536 karakter kodlanabilir.

Unicode, Arapça, Ermenice, Bengalce, Burmaca, Yunanca, Gürcüce, Devanagari, İbranice, Kiril, Kıpti, Khmer, Latince, Tamilce, Hangul, Han (Çin, Japonya, Kore), Cherokee, Etiyopyaca dahil olmak üzere hemen hemen tüm modern alfabeleri içerir. Japonca (katakana, hiragana, kanji) ve diğerleri.

Akademik amaçlar için, antik Yunan, Mısır hiyeroglifleri, çivi yazısı, Maya yazıları ve Etrüsk alfabesi gibi pek çok tarihi yazı eklenmiştir.

Unicode, çok çeşitli matematiksel ve müzikal semboller ve piktogramlar sağlar.

Unicode'da Kiril karakterleri için iki kod aralığı vardır:

Kiril (#0400 - #04FF)

Kiril Ek (#0500 - #052F).

Ancak Unicode tablosunun saf haliyle uygulanması, bir karakterin kodunun bir bayt değil iki bayt kaplaması durumunda, metni depolamak için iki kat daha fazla disk alanı ve iki kat daha fazla disk alanı gerektireceği gerçeği nedeniyle geri kalıyor. iletişim kanalları üzerinden iletmek için çok zaman var.

Bu nedenle, pratikte artık Unicode gösterimi UTF-8 (Unicode Dönüşüm Formatı) daha yaygındır. UTF-8, 8 bit karakterleri kullanan sistemlerle en iyi uyumluluğu sağlar. Yalnızca 128'den küçük karakterlerden oluşan metin, UTF-8'de yazıldığında düz ASCII metne dönüştürülür. Diğer Unicode karakterler, uzunluğu 2 ila 4 bayt olan diziler olarak temsil edilir. Genel olarak dünyanın en yaygın karakterleri olan Latin alfabesi UTF-8'de hala 1 bayt yer kapladığından, bu kodlama saf Unicode'dan daha ekonomiktir.

Bir karakterin sayısal kodunu belirlemek için kod tablosunu kullanabilirsiniz. Bunu yapmak için menüden “Ekle” - “Sembol” seçeneğini seçin, ardından Sembol iletişim paneli ekranda belirir. Seçilen yazı tipi için bir karakter tablosu iletişim kutusunda görünür. Bu tablodaki karakterler, Boşluk karakterinden başlayarak soldan sağa doğru satır satır düzenlenmiştir.