01/10/2018, 15:45
Code PDF Parser cần những gì?
Chào các bạn,
Như tiêu đề, mình muốn viết pdf parser thì cần kiến thức những mảng nào? Tài liệu nào?.
Mình đã google khá nhiều tìm đc mỗi cái pdf specifcations là thấy có giá trị. Đa phần các câu trả lời là “khó lắm, lớn lắm…”. Mình muốn tìm hiểu và thử viết trước khi dùng cái có sẵn.
Ai có kinh nghiệm hoặc từng làm những thứ tương tự chỉ giúp mình.
Cảm ơn các bạn.
Bài liên quan
Mình tìm thử thì có bộ Adobe PDF SDK dựa trên C. Có hướng dẫn, specs đầy đủ.
Tuy nhiên, khi mình xem các file bên trong bộ SDK thì chủ yếu file .h chứa các function declarations, không có binary files nào cả.
https://www.adobe.com/devnet/acrobat/documentation.html
Try this, mấy cái đầu có rất nhiều sao:
GitHub
Build software better, together
GitHub is where people build software. More than 28 million people use GitHub to discover, fork, and contribute to over 85 million projects.
Hi Code Đơ.
Bạn cần biết fomat của file.
Cảm ơn mọi người nhiều. Các replies cho mình tìm điểm bắt đầu.
Mình thấy format này rất hay và phổ biến mà có vẻ ít người làm sâu về nó quá.