Chuyển PDF → Văn bản (Text & OCR)
Hỗ trợ PDF có lớp văn bản & PDF scan. Kết quả giữ định dạng gần giống bản gốc. Chạy tốt trên trình duyệt khi host qua HTTP(S).
Tiến trình tải lên
Tiến trình trích xuất
Thông tin file
Ghi chú: OCR sử dụng Tesseract.js. Với trang có lớp văn bản (text-layer), app ưu tiên lấy lớp văn bản để giữ định dạng. Với trang scan sẽ render sang canvas rồi OCR.

0 Nhận xét