09/10/2018, 23:51

Bảng mã tiếng việt của VnExpress là gì ???

Các bạn thử view source coi? toàn ký tự lạ, khi xuất ra màn hình thì hiển thị bình thường

Mình đã thử chuyển hết bảng mã ra unicode dựng sẵn bằng công cụ của Unikey mà vẫn ra kết quả như cũ. Ai biết chỉ mình với, vì mình cần convert qua bãng mã unicode đọc được thông thường
The Old Man viết 02:04 ngày 10/10/2018
View Source vẩn thấy là Unicode đọc bình thường mà. Có điều là các chữ VIệt không thấy thôi.
arsene_lupin viết 01:56 ngày 10/10/2018
già TOM dạo này lẩn thẩn quá rồi già trả lời thế người ta dỗi đấy
blackangel viết 02:00 ngày 10/10/2018
đó, vấn đề là mình nói bảng mã của các chữ tiếng việt đó là gì ??? như báo tuổi trẻ view là đọc dc tiếng việt có dấu liền, còn vnexpresss nó ra toàn chữ gì đâu
namhoang viết 01:56 ngày 10/10/2018
Đấy không phải là mã Unicode hay gì cả đó là mã NCR Decimal hoặc mã NCR hex. Loại mã này view được cả ở trên các máy tính không cài bộ font UNICODE. Ngoài ra khi code dùng loại mã này sẽ không bị hỏng font.
cái nick đó viết 01:54 ngày 10/10/2018
đó là mã HTML dạng số của các kí tự Unicode &#số; phải không?
blackangel viết 02:06 ngày 10/10/2018
uhm, chính xác VNExpress sử dụng NCR Decimal . Cảm ơn nhiều, mình đã convert qua UTF-8 được rồi
blackangel viết 01:57 ngày 10/10/2018
đây là hàm chuyển về dạng UTF-8 bình thường viết bằng PHP. Ai cần thì tham khảo nhé.

Code:
function Unicode_Decode($entity)
{
	$convmap = array(0x0, 0x10000, 0, 0xfffff);
	return mb_decode_numericentity($entity, $convmap, 'UTF-8');
}
tuan.tranminh viết 01:51 ngày 10/10/2018
Chính xác thì VnExpress dùng bảng mã Windows 1252. Bạn copy source vào MS Frontpage xong save với Encoding là Unicode UTF-8 thì Frontpage sẽ tự chuyển cho bạn.
Bài liên quan
0