اسکی (ASCII) چیست؟
http://bytegate.ir/%d8%a7%d8%b3%da%a9%db%8c-ascii-%da%86%db%8c%d8%b3%d8%aa%d8%9f/
اسکی (ASCII) استانداردی برای نوشتن و نمایش دادن کاراکترهای انگلیسی به علاوه برخی از کاراکترهای رایج است. (+ جدول کامل اسکی و نحوه نوشن کاراکترهای اسکی)
قبل از آن که به سراغ بحث "اسکی (ASCII)" برویم، بهتر است با مفهوم کدگذاری نویسه یا Character Encoding آشنا شویم. کدگذاری نویسه که به آن کدبندی نویسه، رمزنگاری نویسه و رمزنگاری نوشته نیز گفته میشود، نوعی قرارداد برای درک نوشته در تبادل اطلاعات است. با استفاده از یک کدگذاری نویسه، طرفین مبادله کننده داده یا نوشته میتوانند داده دریافتی خود را به صورت صحیح درک کنند. برای درک بهتر رمزنگاری نویسه، دو نفر را فرض کنید که به زبانهای مختلف حرف میزنند. حال درصورتی که این دو فرد به یکدیگر برسند، هیچ یک از طرفین سخن دیگری را نخواهد فهمید. برای حل این مشکل میتوان هر دو طرف را مجبور به یادگرفتن یک زبان واحد کرد. درحالی که هر دو میتوانند به زبان خود حرف بزنند، این امکان نیز بوجود میآید یه با استفاده از آن زبان واحد با یکدیگر نیز صحبت کنند.
بگذارید یک مثال عملی برای لزوم وجود یک کدگذاری نوشته بزنیم؛ فرض کنید دو کامپیوتر X و Y قرار است اطلاعاتی را رد و بدل کنند درحالی که هیچ یک از آنها از یک کدگذاری نویسه واحد پیروی نکنند درک اطلاعات در طرف دیگر غیرممکن خواهد بود. مثلاً در کامپیوتر X حرف A برابر با 0001 حرف B برابر با 0010 و حرف C برابر با 0100 باشد. در کامپیوتر Y نیز حرف A برابر 1111 حرف B برابر 1110 و حرف C برابر 1100 باشد. در این صورت عبارت CAB در دو کامپیوتر با استفاده از بیتهای زیر شناخته خواهد شد:
X: ۰۱۰۰۰۰۰۱۰۰۱۰
Y: ۱۱۰۰۱۱۱۱۱۱۱۰
بنابراین امکان درک دادهها ارسالی از طرف کامپیوتر X به Y در کامپیوتر Y غیرقابل فهم خواهد بود و برعکس. اما درصورتی که این دو کامپیوتر از یک کدگذاری نویسه واحد استفاده کنند (حداقل در هنگام ارسال و دریافت دادهها)، این مشکل رفع خواهد شد. فرض کنید در کدگذاری نویسه واحد حرف A برابر 0001 حرف B برابر 1111 و حرف C برابر 1010 باشد در این حالت عبارت CAB در هر دوی این کامپیوترها به شکل زیر خواهد بود:
X: ۱۰۱۰۰۰۰۱۱۱۱۱
Y: ۱۰۱۰۰۰۰۱۱۱۱۱
بنابراین هردو طرف میتوانند به صورت کاملاً صحیح اطلاعات دریافتی را درک کنند.
به گفته سایت ویکیدات (WikiDot)؛ ایده طراحی کاراکتر اینکدینگ اسکی (ASCII) در ماه مه سال 1961 توسط Bob Bemer به ANSI (مخفف American National Standards Institute به معنای "موسسه استانداردهای ملی آمریکا) فرستاده شد و در همان سال کمیتهای با عنوان X3.4 (که زیرگروه X3 بوده) به رهبری John Auwaerter به نمایندگی اکثر سازندگان تشکیل شده و به کار کردن روی این ایده مشغول شدند. گروه X3.4 بیش از دو سال بر روی این ایده کار کردند که بیشتر این مدت طی بحثهای بیهوده سپری شد و درنهایت در سال 1963 اسکی بوجود آمد.
در سال 1964 اولین سیستم عاملی که قرار بود توسط IBM با نام Operating System/360 از استاندارد ASCII استفاده کند به دلیل عدم تطابق کاراکتر ست ASCII با استاندارد پرینترها و دستگاههای پانچ (EBCDIC) کنسل شد. به خاطر مشکلات موجود، اسکی تا سال 1981 بدون استفاده ماند و طی این مدت تنها کامپیوتر UNIVAC 1050 محصول IBM بود که از استاندارد اسکی استفاده میکرد تا اینکه در سال 1981 نیاز به اسکی بیشتر شد و کامپیوترها تا جایی که میتوانستند به این استاندارد مجهز شدند.
منبع تاریخچه اسکی: Wikidot.com
کلمه اسکی (ASCII) مخفف عبارت "American Standard Code for Information Interchange" به معنای "استاندارد کدگذاری آمریکایی برای تبادل اطلاعات" بوده و تلفظ آن /ˈæski/ است. اسکی یکی از کدبندیهای نوشته (Character Encoding) است که به وسیله آن طرفین مبادله کننده اطلاعات میتوانند به طور صحیح دادهها را دریافت و تشخیص بدهند. به عبارت بهتر؛ ASCII نوعی قرارداد برای تشخیص نوشتههاست.
کاراکتر ست اسکی خود به دو نوع تقسیم میشود. نوع 7 بیتی که با نام اسکی استاندارد (Standard ASCII) شناخته شده و دارای 2 به توان 7 یعنی 128 کاراکتر مختلف است که از 0 تا 127 استفاده میشوند.
نوع دیگر آن حالت 8 بیتی است که با نام اسکی توسعه یافته (Extended ASCII) شناخته شده و دارای 2 به توان 8 یعنی 256 کاراکتر مختلف است که از 0 تا 255 استفاده میشود. حالت توسعه یافته جدا از حالت استاندارد نیست بلکه از 0 تا 127 کاراکتر اول آن درست مانند حالت استاندارد بوده و فقط بقیه کاراکترها به بعد از آن (از 128 تا 255) اضافه شده است. کاراکترهای اضافی دارای هیچ استانداردی نبوده و ممکن است در دستگاهها و کامپیوترهای مختلف فرق داشته باشد مثلاً در کامپیوتر X کاراکتر اسکی 150 معادل حرف û و در کامپیوتر Y معادل حرف ب باشد اما کاراکترهای قبل از 128 همگی ثابت هستند. برای مثال، کاراکترهای فارسی در اینکدینگ Iranian System شرکت ایرانیان سیستم که یکی از قدیمی ترین اینکدینگهای ASCII فارسی است را میتوانید در این لینک ببینید.
در هر دو نوع ذکر شده (7 و 8 بیتی) تعداد 32 کاراکتر اول (یعنی از 0 تا 31) و آخرین کاراکتر (127) با عنوان کاراکترهای کنترلی (Control Characters) شناخته میشود. این کاراکترها غیرقابل چاپ بوده و فقط برای کنترل متن مورد استفاده قرار میگیرد (مثلاً مشخص کننده ابتدای هدر، حذف، کنسل و ...). بقیه کاراکترها یعنی از 32 تا 126 قابل چاپ هستند. این کاراکترها شامل نمادها، حروف و اعداد انگلیسی هستند. در حالت توسعه یافته، از کاراکترهای 128 تا 255 نیز قابل چاپ هستند.
در جدول زیر میتوانید کاراکترهای اسکی استاندارد (از 0 تا 127) را ببینید. همانطور که گفته شد به دلیل این که در اسکی توسعه یافته کاراکترهای اضافی اختیاری هستند، از نوشتن آنها خودداری میکنیم. لیستها از سایت ویکیپدیا کپی شده اند.
معادل باینری | معادل اکتال | معادل دسیمال | معادل هگزادسیمال | مخفف | در یونیکد | با کلید کنترل | در زبان C | نام کاراکتر کنترلی |
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^@ | \0 | کاراکتر Null یا پوچ |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^A | کاراکتر آغازین هدر (Header) | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^B | کاراکتر آغازین متن و جداکننده هدر از متن | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^C | کاراکتر پایانی متن | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^D | سیگنال پایان انتقال - خاتمه دادن به ارتباط | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^E | سیگنال پرس و جو برای اتمام انتقال | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^F | Acknowledge | |
000 0111 | 007 | 7 | 07 | BEL | ␇ | ^G | \a | سیگنال بیپ (صدای کوتاه) |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^H | \b | Backspace |
000 1001 | 011 | 9 | 09 | HT | ␉ | ^I | \t | تغییر مکان به کاراکتر تب (TAB) بعدی |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^J | \n | تغییر مکان به خط جدید |
000 1011 | 013 | 11 | 0B | VT | ␋ | ^K | \v | تغییر مکان به کاراکتر تب خب بعدی |
000 1100 | 014 | 12 | 0C | FF | ␌ | ^L | \f | صفحه بعدی - کاراکتر فضای خالی |
000 1101 | 015 | 13 | 0D | CR | ␍ | ^M | \r | Carriage return |
000 1110 | 016 | 14 | 0E | SO | ␎ | ^N | تغییر به کاراکتر ست دیگر | |
000 1111 | 017 | 15 | 0F | SI | ␏ | ^O | تغییر به کاراکتر ست اولیه | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^P | Data Link Escape | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | ^Q | کنترل 1 قراردادی دستگاه | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | ^R | کنترل 2 قراردادی دستگاه | |
001 0011 | 023 | 19 | 13 | DC3 | ␓ | ^S | کنترل 3 قراردادی دستگاه | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^T | کنترل 4 قراردادی دستگاه | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^U | Negative Acknowledgment | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^V | Synchronous idle | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^W | انتهای بلوک انتقال | |
001 1000 | 030 | 24 | 18 | CAN | ␘ | ^X | لغو | |
001 1001 | 031 | 25 | 19 | EM | ␙ | ^Y | تمام شدن منبع ذخیره یا کاغذ | |
001 1010 | 032 | 26 | 1A | SUB | ␚ | ^Z | Substitute | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^[ | \e | Escape |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^\ | جداکننده فایل | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | جداکننده گروه | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ |
جداکننده رکورد | |
001 1111 | 037 | 31 | 1F | US | ␟ | ^_ | جداکننده واحد | |
کاراکترهای قابل چاپ از 32 تا 126 | ||||||||
111 1111 | 177 | 127 | 7F | DEL | ␡ | ^? | Delete |
معادل بایتری | معادل اوکتال | معادل دسیمال | معادل هگزادسیمال | کاراکتر |
---|---|---|---|---|
010 0000 | 040 | 32 | 20 | (space) |
010 0001 | 041 | 33 | 21 | ! |
010 0010 | 042 | 34 | 22 | " |
010 0011 | 043 | 35 | 23 | # |
010 0100 | 044 | 36 | 24 | $ |
010 0101 | 045 | 37 | 25 | % |
010 0110 | 046 | 38 | 26 | & |
010 0111 | 047 | 39 | 27 | ' |
010 1000 | 050 | 40 | 28 | ( |
010 1001 | 051 | 41 | 29 | ) |
010 1010 | 052 | 42 | 2A | * |
010 1011 | 053 | 43 | 2B | + |
010 1100 | 054 | 44 | 2C | , |
010 1101 | 055 | 45 | 2D | - |
010 1110 | 056 | 46 | 2E | . |
010 1111 | 057 | 47 | 2F | / |
011 0000 | 060 | 48 | 30 | 0 |
011 0001 | 061 | 49 | 31 | 1 |
011 0010 | 062 | 50 | 32 | 2 |
011 0011 | 063 | 51 | 33 | 3 |
011 0100 | 064 | 52 | 34 | 4 |
011 0101 | 065 | 53 | 35 | 5 |
011 0110 | 066 | 54 | 36 | 6 |
011 0111 | 067 | 55 | 37 | 7 |
011 1000 | 070 | 56 | 38 | 8 |
011 1001 | 071 | 57 | 39 | 9 |
011 1010 | 072 | 58 | 3A | : |
011 1011 | 073 | 59 | 3B | ; |
011 1100 | 074 | 60 | 3C | < |
011 1101 | 075 | 61 | 3D | = |
011 1110 | 076 | 62 | 3E | > |
011 1111 | 077 | 63 | 3F | ? |
100 0000 | 100 | 64 | 40 | @ |
100 0001 | 101 | 65 | 41 | A |
100 0010 | 102 | 66 | 42 | B |
100 0011 | 103 | 67 | 43 | C |
100 0100 | 104 | 68 | 44 | D |
100 0101 | 105 | 69 | 45 | E |
100 0110 | 106 | 70 | 46 | F |
100 0111 | 107 | 71 | 47 | G |
100 1000 | 110 | 72 | 48 | H |
100 1001 | 111 | 73 | 49 | I |
100 1010 | 112 | 74 | 4A | J |
100 1011 | 113 | 75 | 4B | K |
100 1100 | 114 | 76 | 4C | L |
100 1101 | 115 | 77 | 4D | M |
100 1110 | 116 | 78 | 4E | N |
100 1111 | 117 | 79 | 4F | O |
101 0000 | 120 | 80 | 50 | P |
101 0001 | 121 | 81 | 51 | Q |
101 0010 | 122 | 82 | 52 | R |
101 0011 | 123 | 83 | 53 | S |
101 0100 | 124 | 84 | 54 | T |
101 0101 | 125 | 85 | 55 | U |
101 0110 | 126 | 86 | 56 | V |
101 0111 | 127 | 87 | 57 | W |
101 1000 | 130 | 88 | 58 | X |
101 1001 | 131 | 89 | 59 | Y |
101 1010 | 132 | 90 | 5A | Z |
101 1011 | 133 | 91 | 5B | [ |
101 1100 | 134 | 92 | 5C | \ |
101 1101 | 135 | 93 | 5D | ] |
101 1110 | 136 | 94 | 5E | ^ |
101 1111 | 137 | 95 | 5F | _ |
110 0000 | 140 | 96 | 60 | ` |
110 0001 | 141 | 97 | 61 | a |
110 0010 | 142 | 98 | 62 | b |
110 0011 | 143 | 99 | 63 | c |
110 0100 | 144 | 100 | 64 | d |
110 0101 | 145 | 101 | 65 | e |
110 0110 | 146 | 102 | 66 | f |
110 0111 | 147 | 103 | 67 | g |
110 1000 | 150 | 104 | 68 | h |
110 1001 | 151 | 105 | 69 | i |
110 1010 | 152 | 106 | 6A | j |
110 1011 | 153 | 107 | 6B | k |
110 1100 | 154 | 108 | 6C | l |
110 1101 | 155 | 109 | 6D | m |
110 1110 | 156 | 110 | 6E | n |
110 1111 | 157 | 111 | 6F | o |
111 0000 | 160 | 112 | 70 | p |
111 0001 | 161 | 113 | 71 | q |
111 0010 | 162 | 114 | 72 | r |
111 0011 | 163 | 115 | 73 | s |
111 0100 | 164 | 116 | 74 | t |
111 0101 | 165 | 117 | 75 | u |
111 0110 | 166 | 118 | 76 | v |
111 0111 | 167 | 119 | 77 | w |
111 1000 | 170 | 120 | 78 | x |
111 1001 | 171 | 121 | 79 | y |
111 1010 | 172 | 122 | 7A | z |
111 1011 | 173 | 123 | 7B | { |
111 1100 | 174 | 124 | 7C | | |
111 1101 | 175 | 125 | 7D | } |
111 1110 | 176 | 126 | 7E | ~ |
برای نوشتن کاراکترهای اسکی (ASCII) کافیست کلید Alt را نگه داشته سپس عدد دسیمال کاراکتر مورد نظر را از سمت راست کیبورد (نامبر پد) زده و کلید Alt را رها کنید. برای مثال، برای نوشتن کاراکتر R کلید Alt را نگه دارید، عدد 82 را زده سپس کلید Alt را ها کنید.
امروزه کاراکترهای کنترلی اسکی به دلیل این که دیگر کاربردی در ارتباطات
امروزی ندارند، تبدیل به اشکال و سمبلهای مختلفی شده اند. مثلاً کد اسکی 1
برابر نماد است.
جالب است بدانیداستفاده از کاراکترهای اسکی برای طراحی تصاویر نیز به یک هنر تبدیل شده است. برای مثال تصویر زیر که کوچک شده یک تصویر با ابعاد 8115x5515 است (تصویر کامل)، با استفاده از کاراکترهای ASCII طراحی شده است. البته ممکن است این تصاویر به صورت خودکار یا دستی تولید شده باشند:
http://bytegate.ir/%d8%a7%d8%b3%da%a9%db%8c-ascii-%da%86%db%8c%d8%b3%d8%aa%d8%9f/