ExpertPDF PDF To Text Converter - Phần mềm trích xuất text từ file PDF
ExpertPDF PDF To Text Converter là phần mềm có thể được sử dụng với bất kì ứng dụng .NET nào để trích xuất text từ tập tin PDF. Phần mềm có thể tích hợp với những ứng dụng .NET hết sức dễ dàng và không đòi hỏi cài đặt để chạy quá trình chuyển đổi định dạng.
Các thư mục và tập tin chứa trong file nén phần mềm ExpertPDF PDF To Text Converter
ExpertPDF PDF To Text PDF Converter giúp người dùng dễ dàng chuyển đổi PDF sang Text cho các ứng dụng .NET. Trong thư mục tải về có chứa 1 gói kết hợp assembly (thư viện gồm các code đã được dịch sẵn) cho .NET 2.0, .NET 3.5, .NET 4.0 và 1 phần mềm console mẫu sẵn sàng được sử dụng.
Đặc điểm chính của ExpertPDF PDF To Text Converter
- Thư viện phát triển cho .NET 2.0, .NET 3.5 và .NET 4.0 cùng với mẫu C#.
- Trích xuất text từ file PDF hoặc PDF Stream.
- Trích xuất text giữ nguyên định dạng PDF gốc.
- Trích xuất text theo đúng thứ tự đọc trang của PDF.
- Xác định cụ thể những trang muốn trích xuất.
- Lưu file text được trích xuất dưới dạng HTML và thêm mô tả, thẻ đánh dấu và thông tin meta cho file.
- Thêm tiêu đề, từ khó, tác giả từ mô tả trong file PDF sang file HTML.
- Đánh đấu đoạn ngắt trang trong file text được trích xuất với kí tự đặc biệt.
- Trích xuất text từ file PDF được bảo vệ bằng mật khẩu.
Giới thiệu phần mềm ExpertPDF PDF To Text Converter
Trong thư mục tải về, bạn sẽ thấy mã nguồn C# cho ứng dụng mẫu trong thư mục Samples. Ứng dụng mẫu có thể được xây dựng với Visual Studio 2005, Visual Studio 2008 và Visual Studio 2010. Kết quả sau khi chuyển đổi là 1 chuỗi đối tượng .NET (.NET String) mà bạn có thể sử dụng làm mẫu hoặc lưu lại vào ổ đĩa.
Các mẫu Winforms và Console đều có trong ExpertPDF PDF To Text Converter
Trước tiên hãy mở file Readme.txt để xem tóm tắt các thư mục và file mà phần mềm mang tới bao gồm các file dll cho ứng dụng trong thư mục Bin, các tham chiếu API trong thư mục Doc, mẫu ứng dụng cho Winfroms và Console trong Samples. Ngoài ra cũng cần chú ý là có các file pdftotext.dll cho phiên bản x64 và x86 riêng nên khi sử dụng hãy đảm bảo bạn dùng đúng file.
Hướng dẫn các bước sử dụng trong file txt
Tại đây bạn cũng có thể tìm thấy hướng dẫn sử dụng với 3 bước
- Thêm file pdftotext.dll vào thư mục bin của ứng dụng.
- Thêm tham chiếu tới pdftotext.dll.
- Viết code (có thể tham khảo các mẫu và tham chiếu API nếu cần).
Nhìn chung, ExpertPDF PDF To Text Converter mang tới tất cả những gì bạn cần để trích xuất text từ file PDF của ứng dụng .NET. File hướng dẫn cùng với kho mẫu cũng sẽ là người trợ giúp đắc lực cho bạn.
Nguyễn Thúy