Mã hóa (bộ ký tự) trong HTML
Để hiển thị trang HTML chính xác, trình duyệt web phải biết bộ ký tự (mã hóa ký tự) để sử dụng. Thuật ngữ mã hóa ký tự ASCII là chuẩn mã hoá ký tự đầu tiên (còn gọi là bộ ký tự). ASCII xác định 128 ký tự chữ và số khác nhau có thể được sử dụng trên internet: số ...
Để hiển thị trang HTML chính xác, trình duyệt web phải biết bộ ký tự (mã hóa ký tự) để sử dụng.
Thuật ngữ mã hóa ký tự
ASCII là chuẩn mã hoá ký tự đầu tiên (còn gọi là bộ ký tự). ASCII xác định 128 ký tự chữ và số khác nhau có thể được sử dụng trên internet: số (0-9), chữ cái tiếng Anh (a-z) và một số ký tự đặc biệt như! $ + – () @ <>.
ANSI (Windows-1252) là bộ ký tự gốc của Windows, hỗ trợ 256 mã ký tự khác nhau.
ISO-8859-1 là bộ ký tự mặc định cho HTML 4. Bộ ký tự này cũng hỗ trợ 256 mã ký tự khác nhau. Vì ANSI và ISO-8859-1 còn nhiều hạn chế, HTML 4 cũng hỗ trợ UTF-8.
UTF-8 (Unicode) bao gồm gần như tất cả các ký tự và biểu tượng trên thế giới.
Mã hoá ký tự mặc định cho HTML5 là UTF-8.
Thuộc tính charset trong HTML
Để hiển thị đúng trang HTML, một trình duyệt web phải hiểu bộ ký tự được sử dụng trong trang. Điều này được chỉ định trong thẻ <meta>:
Cho HTML 4
<meta http-equiv=”Content-Type” content=”text/html;charset=ISO-8859-1″>
Cho HTML5
<meta charset=”UTF-8″>
Nếu một trình duyệt phát hiện ISO-8859-1 trong một trang web, nó mặc định là ANSI, bởi vì ANSI giống hệt ISO-8859-1 ngoại trừ việc ANSI có 32 ký tự phụ.
Sự khác biệt giữa các bộ ký tự
Bảng sau đây thể hiện sự khác biệt giữa các bộ ký tự được mô tả ở trên:
Numb | ASCII | ANSI | 8859 | UTF-8 | Mô tả |
---|---|---|---|---|---|
32 | dấu cách | ||||
33 | ! | ! | ! | ! | dấu chấm than |
34 | “ | “ | “ | “ | ngoặc kép |
35 | # | # | # | # | dấu thăng |
36 | $ | $ | $ | $ | dollar |
37 | % | % | % | % | phần trăm |
38 | & | & | & | & | ký hiệu và |
39 | ‘ | ‘ | ‘ | ‘ | ngoặc đơn |
40 | ( | ( | ( | ( | mở ngoặc |
41 | ) | ) | ) | ) | đóng ngoặc |
42 | * | * | * | * | dấu sao |
43 | + | + | + | + | dấu cộng |
44 | , | , | , | , | dấu phẩy |
45 | – | – | – | – | dấu trừ. |
46 | . | . | . | . | dấu chấm |
47 | / | / | / | / | gạch chéo |
48 | 0 | 0 | 0 | 0 | số 0 |
49 | 1 | 1 | 1 | 1 | số 1 |
50 | 2 | 2 | 2 | 2 | số 2 |
51 | 3 | 3 | 3 | 3 | số 3 |
52 | 4 | 4 | 4 | 4 | số 4 |
53 | 5 | 5 | 5 | 5 | số 5 |
54 | 6 | 6 | 6 | 6 | số 6 |
55 | 7 | 7 | 7 | 7 | số 7 |
56 | 8 | 8 | 8 | 8 | số 8 |
57 | 9 | 9 | 9 | 9 | số 9 |
58 | : | : | : | : | hai chấm |
59 | ; | ; | ; | ; | chấm phẩy |
60 | < | < | < | < | dấu nhỏ hơn |
61 | = | = | = | = | dấu bằng |
62 | > | > | > | > | dấu lớn hơn |
63 | ? | ? | ? | ? | dấu hỏi chấm |
64 | @ | @ | @ | @ | ký hiệu a còng |
65 | A | A | A | A | chữ A hoa |
66 | B | B | B | B | chữ B hoa |
67 | C | C | C | C | chữ C hoa |
68 | D | D | D | D | chữ D hoa |
69 | E | E | E | E | chữ E hoa |
70 | F | F | F | F | chữ F hoa |
71 | G | G | G | G | chữ G hoa |
72 | H | H | H | H | chứ H hoa |
73 | I | I | I | I | chữ I hoa |
74 | J | J | J | J | chữ J hoa |
75 | K | K | K | K | chữ K hoa |
76 | L | L | L | L | chữ L hoa |
77 | M | M | M | M | chữ M hoa |
78 | N | N | N | N | chữ N hoa |
79 | O | O | O | O | chữ O hoa |
80 | P | P | P | P | chữ P hoa |
81 | Q | Q | Q | Q | chữ Q hoa |
82 | R | R | R | R | chữ R hoa |
83 | S | S | S | S | chữ S hoa |
84 | T | T | T | T | chữ T hoa |
85 | U | U | U | U | chữ U hoa |
86 | V | V | V | V | chữ V hoa |
87 | W | W | W | W | chữ W hoa |
88 | X | X | X | X | chữ X hoa |
89 | Y | Y | Y | Y | chữ Y hoa |
90 | Z | Z | Z | Z | chữ Z hoa |
91 | [ | [ | [ | [ | mở ngoặc vuông |
92 | gạch chéo ngược | ||||
93 | ] | ] | ] | ] | đóng ngoặc vuông |
94 | ^ | ^ | ^ | ^ | dấu mũ |
95 | _ | _ | _ | _ | gạch dưới |
96 | ` | ` | ` | ` | dấu huyền |
97 | a | a | a | a | chữ a thường |
98 | b | b | b | b | chữ b thường |
99 | c | c | c | c | chữ c thường |
100 | d | d | d | d | chữ d thường |
101 | e | e | e | e | chữ e thường |
102 | f | f | f | f | chữ f thường |
103 | g | g | g | g | chữ g thường |
104 | h | h | h | h | chữ h thường |
105 | i | i | i | i | chữ i thường |
106 | j | j | j | j | chữ j thường |
107 | k | k | k | k | chữ k thường |
108 | l | l | l | l | chữ l thường |
109 | m | m | m | m | chữ m thường |
110 | n | n | n | n | chữ n thường |
111 | o | o | o | o | chữ o thường |
112 | p | p | p | p | chữ p thường |
113 | q | q | q | q | chữ q thường |
114 | r | r | r | r | chữ r thường |
115 | s | s | s | s | chữ s thường |
116 | t | t | t | t | chữ t thường |
117 | u | u | u | u | chữ u thường |
118 | v | v | v | v | chữ v thường |
119 | w | w | w | w | chữ w thường |
120 | x | x | x | x | chữ x thường |
121 | y | y | y | y | chữ y thường |
122 | z | z | z | z | chữ z thường |
123 | { | { | { | { | mở ngoặc nhọn |
124 | | | | | | | | | dấu sọc |
125 | } | } | } | } | đóng ngoặc nhọn |
126 | ~ | ~ | ~ | ~ | dấu ngã |
127 | DEL | ||||
128 | € | euro | |||
129 | | | | không sử dụng | |
130 | ‚ | dấu ngoặc đơn dưới | |||
131 | ƒ | chữ f theo kiểu Latin | |||
132 | „ | dấu ngoặc kép dưới | |||
133 | … | dấu ba chấm | |||
134 | † | ||||
135 | ‡ | ||||
136 | ˆ | ||||
137 | ‰ | phần nghìn | |||
138 | Š | ||||
139 | ‹ | ||||
140 | Œ | ||||
141 | | | | không sử dụng | |
142 | Ž | ||||
143 | | | | không sử dụng | |
144 | | | | không sử dụng | |
145 | ‘ | ||||
146 | ’ | ||||
147 | “ | ||||
148 | ” | ||||
149 | • | ||||
150 | – | ||||
151 | — | ||||
152 | ˜ | ||||
153 | ™ | ||||
154 | š | ||||
155 | › | ||||
156 | œ | ||||
157 | | | | không sử dụng | |
158 | ž | ||||
159 | Ÿ | ||||
160 | |||||
161 | ¡ | ¡ | ¡ | ||
162 | ¢ | ¢ | ¢ | ||
163 | £ | £ | £ | ||
164 | ¤ | ¤ | ¤ | ||
165 | ¥ | ¥ | ¥ | ||
166 | ¦ | ¦ | ¦ | ||
167 | § | § | § | ||
168 | ¨ | ¨ | ¨ | ||
169 | © | © | © | ||
170 | ª | ª | ª | ||
171 | « | « | « | ||
172 | ¬ | ¬ | ¬ | ||
173 | |||||
174 | ® | ® | ® | ||
175 | ¯ | ¯ | ¯ | ||
176 | ° | ° | ° | ||
177 | ± | ± | ± | ||
178 | ² | ² | ² | ||
179 | ³ | ³ | ³ | ||
180 | ´ | ´ | ´ | ||
181 | µ | µ | µ | ||
182 | ¶ | ¶ | ¶ | ||
183 | · | · | · | ||
184 | ¸ | ¸ | ¸ | ||
185 | ¹ | ¹ | ¹ | ||
186 | º | º | º | ||
187 | » | » | » | ||
188 | ¼ | ¼ | ¼ | ||
189 | ½ | ½ | ½ | ||
190 | ¾ | ¾ | ¾ | ||
191 | ¿ | ¿ | ¿ | ||
192 | À | À | À | ||
193 | Á | Á | Á | ||
194 | Â | Â | Â | ||
195 | Ã | Ã | Ã | ||
196 | Ä | Ä | Ä | ||
197 | Å | Å | Å | ||
198 | Æ | Æ | Æ | ||
199 | Ç | Ç | Ç | ||
200 | È | È | È | ||
201 | É | É | É | ||
202 | Ê | Ê | Ê | ||
203 | Ë | Ë | Ë | ||
204 | Ì | Ì | Ì | ||
205 | Í | Í | Í | ||
206 | Î | Î | Î | ||
207 | Ï | Ï | Ï | ||
208 | Ð | Ð | Ð | ||
209 | Ñ | Ñ | Ñ | ||
210 | Ò | Ò | Ò | ||
211 | Ó | Ó | Ó | ||
212 | Ô | Ô | Ô | ||
213 | Õ | Õ | Õ | ||
214 | Ö | Ö | Ö | ||
215 | × | × | × | ||
216 | Ø | Ø | Ø | ||
217 | Ù | Ù | Ù | ||
218 | Ú | Ú | Ú | ||
219 | Û | Û | Û | ||
220 | Ü | Ü | Ü | ||
221 | Ý | Ý | Ý | ||
222 | Þ | Þ | Þ | ||
223 | ß | ß | ß | ||
224 | à | à | à | ||
225 | á | á | á | ||
226 | â | â | â | ||
227 | ã | ã | ã | ||
228 | ä | ä | ä | ||
229 | å | å | å | ||
230 | æ | æ | æ | ||
231 | ç | ç | ç | ||
232 | è | è | è | ||
233 | é | é | é | ||
234 | ê | ê | ê | ||
235 | ë | ë | ë | ||
236 | ì | ì | ì | ||
237 | í | í | í | ||
238 | î | î | î | ||
239 | ï | ï | ï | ||
240 | ð | ð | ð | ||
241 | ñ | ñ | ñ | ||
242 | ò | ò | ò | ||
243 | ó | ó | ó | ||
244 | ô | ô | ô | ||
245 | õ | õ | õ | ||
246 | ö | ö | ö | ||
247 | ÷ | ÷ | ÷ | phép chia | |
248 | ø | ø | ø | ||
249 | ù | ù | ù | ||
250 | ú | ú | ú | ||
251 | û | ûû | û | ||
252 | ü | ü | ü | ||
253 | ý | ý | ý | ||
254 | þ | þ | þ | ||
255 | ÿ | ÿ | ÿ |
Bộ ký tự ASCII
ASCII sử dụng các giá trị từ 0 đến 31 (và 127) cho các ký tự điều khiển.
ASCII sử dụng các giá trị từ 32 đến 126 đối với chữ cái, chữ số và ký hiệu.
ASCII không sử dụng các giá trị từ 128 đến 255.
Bộ ký tự ANSI (Windows-1252)
ANSI giống hệt ASCII với các giá trị từ 0 đến 127.
ANSI có một bộ các ký tự đặc trưng cho các giá trị từ 128 đến 159.
ANSI giống hệt với UTF-8 với các giá trị từ 160 đến 255.
Bộ ký tự ISO-8859-1
8859-1 giống hệt ASCII với các giá trị từ 0 đến 127.
8859-1 không sử dụng các giá trị từ 128 đến 159.
8859-1 giống hệt với UTF-8 với các giá trị từ 160 đến 255.
Bộ ký tự UTF-8
UTF-8 giống hệt ASCII với các giá trị từ 0 đến 127.
UTF-8 không sử dụng các giá trị từ 128 đến 159.
UTF-8 giống hệt với ANSI và 8859-1 cho các giá trị từ 160 đến 255.
TF-8 tiếp tục từ giá trị 256 với hơn 10.000 ký tự khác nhau.
- Khóa học lập trình frontend cơ bản : Bootstrap 4, Jquery, CSS3, HTML5
- Học lập trình Frontend nâng cao qua project thực tế