07/09/2018, 14:58

Mã hóa (bộ ký tự) trong HTML

Để hiển thị trang HTML chính xác, trình duyệt web phải biết bộ ký tự (mã hóa ký tự) để sử dụng. Thuật ngữ mã hóa ký tự ASCII là chuẩn mã hoá ký tự đầu tiên (còn gọi là bộ ký tự). ASCII xác định 128 ký tự chữ và số khác nhau có thể được sử dụng trên internet: số ...

Để hiển thị trang HTML chính xác, trình duyệt web phải biết bộ ký tự (mã hóa ký tự) để sử dụng.

Thuật ngữ mã hóa ký tự

ASCII là chuẩn mã hoá ký tự đầu tiên (còn gọi là bộ ký tự). ASCII xác định 128 ký tự chữ và số khác nhau có thể được sử dụng trên internet: số (0-9), chữ cái tiếng Anh (a-z) và một số ký tự đặc biệt như! $ + – () @ <>.

ANSI (Windows-1252) là bộ ký tự gốc của Windows, hỗ trợ 256 mã ký tự khác nhau.

ISO-8859-1 là bộ ký tự mặc định cho HTML 4. Bộ ký tự này cũng hỗ trợ 256 mã ký tự khác nhau. Vì ANSI và ISO-8859-1 còn nhiều hạn chế, HTML 4 cũng hỗ trợ UTF-8.

UTF-8 (Unicode) bao gồm gần như tất cả các ký tự và biểu tượng trên thế giới.

Mã hoá ký tự mặc định cho HTML5 là UTF-8.

Thuộc tính charset trong HTML

Để hiển thị đúng trang HTML, một trình duyệt web phải hiểu bộ ký tự được sử dụng trong trang. Điều này được chỉ định trong thẻ <meta>:

Cho HTML 4

<meta http-equiv=”Content-Type” content=”text/html;charset=ISO-8859-1″>

Cho HTML5

<meta charset=”UTF-8″>

Nếu một trình duyệt phát hiện ISO-8859-1 trong một trang web, nó mặc định là ANSI, bởi vì ANSI giống hệt ISO-8859-1 ngoại trừ việc ANSI có 32 ký tự phụ.

Sự khác biệt giữa các bộ ký tự

Bảng sau đây thể hiện sự khác biệt giữa các bộ ký tự được mô tả ở trên:

Numb ASCII  ANSI 8859 UTF-8 Mô tả
 32  dấu cách
 33  !  !  !  !  dấu chấm than
 34  “  “  “  “  ngoặc kép
 35  #  #  #  #  dấu thăng
 36  $  $  $  $  dollar
 37  %  %  %  %  phần trăm
 38  &  &  &  &  ký hiệu và
 39  ‘  ‘  ‘  ‘  ngoặc đơn
 40  (  (  (  (  mở ngoặc
 41  )  )  )  )  đóng ngoặc
 42  *  *  *  *  dấu sao
 43  +  +  +  +  dấu cộng
 44  ,  ,  ,  ,  dấu phẩy
 45  –  –  –  –  dấu trừ.
 46  .  .  .  .  dấu chấm
 47  /  /  /  /  gạch chéo
 48  0  0  0  0  số 0
 49  1  1  1  1  số 1
 50  2  2  2  2  số 2
 51  3  3  3  3  số 3
 52  4  4  4  4  số 4
 53  5  5  5  5  số 5
 54  6  6  6  6  số 6
 55  7  7  7  7  số 7
 56  8  8  8  8  số 8
 57  9  9  9  9  số 9
 58  :  :  :  :  hai chấm
 59  ;  ;  ;  ;  chấm phẩy
 60  <  <  <  <  dấu nhỏ hơn
 61  =  =  =  =  dấu bằng
 62  >  >  >  >  dấu lớn hơn
 63  ?  ?  ?  ?  dấu hỏi chấm
 64  @  @  @  @  ký hiệu a còng
 65  A  A  A  A  chữ A hoa
 66  B  B  B  B  chữ B hoa
 67  C  C  C  C  chữ C hoa
 68  D  D  D  D  chữ D hoa
 69  E  E  E  E  chữ E hoa
 70  F  F  F  F  chữ F hoa
 71  G  G  G  G  chữ G hoa
 72  H  H  H  H  chứ H hoa
 73  I  I  I  I  chữ I hoa
 74  J  J  J  J  chữ J hoa
 75  K  K  K  K  chữ K hoa
 76  L  L  L  L  chữ L hoa
 77  M  M  M  M  chữ M hoa
 78  N  N  N  N  chữ N hoa
 79  O  O  O  O  chữ O hoa
 80  P  P  P  P  chữ P hoa
 81  Q  Q  Q  Q  chữ Q hoa
 82  R  R  R  R  chữ R hoa
 83  S  S  S  S  chữ S hoa
 84  T  T  T  T  chữ T hoa
 85  U  U  U  U  chữ U hoa
 86  V  V  V  V  chữ V hoa
 87  W  W  W  W  chữ W hoa
 88  X  X  X  X  chữ X hoa
 89  Y  Y  Y  Y  chữ Y hoa
 90  Z  Z  Z  Z  chữ Z hoa
 91  [ [  [  [  mở ngoặc vuông
 92          gạch chéo ngược
 93  ]  ]  ]  ]  đóng ngoặc vuông
 94  ^  ^  ^  ^  dấu mũ
 95  _  _  _  _  gạch dưới
 96  `  `  `  `  dấu huyền
 97  a  a  a  a  chữ a thường
 98  b  b  b  b  chữ b thường
 99  c  c  c  c  chữ c thường
 100  d  d  d  d  chữ d thường
 101  e  e  e  e  chữ e thường
 102  f  f  f  f  chữ f thường
 103  g  g  g  g  chữ g thường
 104  h  h  h  h  chữ h thường
 105  i  i  i  i  chữ i thường
 106  j  j  j  j  chữ j thường
 107  k  k  k  k  chữ k thường
 108  l  l  l  l  chữ l thường
 109  m  m  m  m  chữ m thường
 110  n  n  n  n  chữ n thường
 111  o  o  o  o  chữ o thường
 112  p  p  p  p  chữ p thường
 113  q  q  q  q  chữ q thường
 114  r  r  r  r  chữ r thường
 115  s  s  s  s  chữ s thường
 116  t  t  t  t  chữ t thường
 117  u  u  u  u  chữ u thường
 118  v  v  v  v  chữ v thường
 119  w  w  w  w  chữ w thường
 120  x  x  x  x  chữ x thường
 121  y  y  y  y  chữ y thường
 122  z  z  z  z  chữ z thường
 123  {  {  {  {  mở ngoặc nhọn
 124  |  |  |  |  dấu sọc
 125  }  }  }  }  đóng ngoặc nhọn
 126  ~  ~  ~  ~  dấu ngã
 127  DEL
 128  €  euro
 129        không sử dụng
 130  ‚  dấu ngoặc đơn dưới
 131  ƒ  chữ f theo kiểu Latin
 132  „  dấu ngoặc kép dưới
 133  …  dấu ba chấm
 134  †
 135  ‡
 136  ˆ
 137  ‰  phần nghìn
 138  Š
 139  ‹
 140  Œ
 141        không sử dụng
 142  Ž
 143        không sử dụng
 144        không sử dụng
 145  ‘
 146  ’
 147  “
 148  ”
 149  •
 150  –
 151  —
 152  ˜
 153  ™
 154  š
 155  ›
 156  œ
 157        không sử dụng
 158  ž
 159  Ÿ
 160
 161  ¡  ¡  ¡
 162  ¢  ¢  ¢
 163  £  £  £
 164  ¤  ¤  ¤
 165  ¥  ¥  ¥
 166  ¦  ¦  ¦
 167  §  §  §
 168  ¨  ¨  ¨
 169  ©  ©  ©
 170  ª  ª  ª
 171  «  «  «
 172  ¬  ¬  ¬
 173
 174  ®  ®  ®
 175  ¯  ¯  ¯
 176  °  °  °
 177  ±  ±  ±
 178  ²  ²  ²
 179  ³  ³  ³
 180  ´  ´  ´
 181  µ  µ µ
 182  ¶  ¶  ¶
 183  ·  ·  ·
 184  ¸  ¸  ¸
 185  ¹  ¹  ¹
 186  º  º  º
 187  »  »  »
 188  ¼  ¼  ¼
 189  ½  ½  ½
 190  ¾  ¾  ¾
 191  ¿  ¿  ¿
 192  À  À  À
 193  Á  Á  Á
 194  Â  Â  Â
 195  Ã  Ã  Ã
 196  Ä  Ä  Ä
 197  Å  Å  Å
 198  Æ  Æ  Æ
 199  Ç  Ç  Ç
 200  È  È  È
 201  É  É  É
 202  Ê  Ê  Ê
 203  Ë  Ë  Ë
 204  Ì  Ì  Ì
 205  Í  Í  Í
 206  Î  Î  Î
 207  Ï  Ï  Ï
 208  Ð  Ð  Ð
 209  Ñ  Ñ  Ñ
 210  Ò  Ò  Ò
 211  Ó  Ó  Ó
 212  Ô  Ô  Ô
 213  Õ  Õ  Õ
 214  Ö  Ö  Ö
 215  ×  ×  ×
 216  Ø  Ø  Ø
 217  Ù  Ù  Ù
 218  Ú  Ú  Ú
 219  Û  Û  Û
 220  Ü  Ü  Ü
 221  Ý Ý  Ý
 222  Þ  Þ  Þ
 223  ß  ß  ß
 224  à  à  à
 225  á  á  á
 226  â  â  â
 227  ã  ã  ã
 228  ä  ä  ä
 229  å  å  å
 230  æ  æ  æ
 231  ç  ç  ç
 232  è  è  è
 233  é  é  é
 234  ê  ê  ê
 235  ë  ë  ë
 236  ì ì  ì
 237  í  í  í
 238  î  î  î
 239  ï  ï  ï
 240  ð  ð  ð
 241  ñ  ñ  ñ
 242  ò  ò  ò
 243  ó  ó  ó
 244  ô  ô  ô
 245  õ  õ  õ
 246  ö  ö  ö
 247  ÷  ÷  ÷  phép chia
 248  ø  ø  ø
 249  ù  ù  ù
 250  ú  ú  ú
 251  û  ûû  û
 252  ü  ü  ü
 253  ý ý  ý
 254  þ  þ  þ
 255  ÿ ÿ  ÿ

Bộ ký tự ASCII

ASCII sử dụng các giá trị từ 0 đến 31 (và 127) cho các ký tự điều khiển.

ASCII sử dụng các giá trị từ 32 đến 126 đối với chữ cái, chữ số và ký hiệu.

ASCII không sử dụng các giá trị từ 128 đến 255.

Bộ ký tự ANSI (Windows-1252)

ANSI giống hệt ASCII với các giá trị từ 0 đến 127.

ANSI có một bộ các ký tự đặc trưng cho các giá trị từ 128 đến 159.

ANSI giống hệt với UTF-8 với các giá trị từ 160 đến 255.

Bộ ký tự ISO-8859-1

8859-1 giống hệt ASCII với các giá trị từ 0 đến 127.

8859-1 không sử dụng các giá trị từ 128 đến 159.

8859-1 giống hệt với UTF-8 với các giá trị từ 160 đến 255.

Bộ ký tự UTF-8

UTF-8 giống hệt ASCII với các giá trị từ 0 đến 127.

UTF-8 không sử dụng các giá trị từ 128 đến 159.

UTF-8 giống hệt với ANSI và 8859-1 cho các giá trị từ 160 đến 255.

TF-8 tiếp tục từ giá trị 256 với hơn 10.000 ký tự khác nhau.

Tham khảo thêm 2 khóa học hữu ích do giảng viên quốc tế trường FPT Arena giảng dạy:
  • Khóa học lập trình frontend cơ bản : Bootstrap 4, Jquery, CSS3, HTML5
  • Học lập trình Frontend nâng cao qua project thực tế
0