Các tài liệu Microsoft Word, gần như phổ biến trong các thiết lập kinh doanh, có thể được coi là một điều ác cần thiết cho người dùng Linux để giải quyết. Chắc chắn, bạn có thể mở các tệp Word trong LibreOffice, nhưng thật khó để chờ một ứng dụng đồ họa nặng tải tài liệu của bạn. Antiword là một giải pháp chạy trong thiết bị đầu cuối của bạn - hoàn hảo cho mọi người trên máy tính hoặc hệ thống chậm mà không có môi trường đồ họa.

Antiword đã được chuyển sang FreeBSD, BeOS, OS / 2, Mac OS X, Amiga, VMS, NetWare, Plan9, EPOC, Zaurus PDA, MorphOS, Tru64 / OSF, Minix, Solaris và DOS. Đối với bài viết này, tôi sẽ tập trung vào việc sử dụng nó trong Linux.

Những đặc điểm chính

Antiword cho phép bạn xem và chuyển đổi tài liệu MS Word từ dòng lệnh. Bạn có thể chuyển đổi sang các định dạng sau:

  • Văn bản thô
  • Văn bản được định dạng
  • PDF
  • Postscript
  • XML (chỉ DocBook hiện được hỗ trợ)

Hạn chế

Trước khi bạn quá phấn khích, tôi phải đề cập rằng Antiword được cập nhật lần cuối vào năm 2005 và không tương thích với các tài liệu DOCX mới hơn. Bạn cũng không thể sử dụng nó để chỉnh sửa tài liệu của bạn.

Bắt Antiword

Nếu bản phân phối Linux của bạn có trình quản lý gói, bạn có thể tìm thấy Antiword ở một trong các kho lưu trữ của mình.

Nếu không, hãy lấy kho lưu trữ .tar.gz từ trang Antiword trên Freecode. Giải nén tệp lưu trữ và nhập thư mục antiword-0.37. Sau đó chạy:

 làm cho sudo thực hiện cài đặt 

Sử dụng

Đối với các mẹo sử dụng sau đây, tôi sẽ sử dụng lý lịch của tôi làm tài liệu ví dụ. Đây là những gì nó trông giống như trong LibreOffice:

Cách cơ bản nhất để sử dụng antiword là chỉ cần hiển thị tài liệu:

 antiword resume.doc 

Như bạn có thể thấy, lệnh mặc định không bảo toàn một số khía cạnh định dạng như kích thước phông chữ, chữ nghiêng và gạch chân, nhưng nó thực hiện một công việc tốt khi trình bày văn bản dưới dạng có thể đọc được.

Để hiển thị thông tin định dạng, hãy sử dụng cờ “ -f ” trong lệnh của bạn:

 antiword -f resume.doc 

Không, điều này không thực sự hiển thị cho bạn định dạng theo kiểu WYSIWYG; thay vào đó, nó sẽ cho bạn biết về nó với một cú pháp giống như markdown. Ví dụ: nó hiển thị _được gạch dưới văn bản_ với dấu gạch dưới và * văn bản in đậm * có dấu hoa thị.

Để chuyển đổi tài liệu Word của bạn thành một tệp PDF, bạn phải chỉ định khổ giấy bằng cách sử dụng cờ “ -a ”. Antiword hỗ trợ các kích thước giấy sau:

  • 10 × 14
  • a3
  • a4
  • a5
  • B 4
  • b5
  • điều hành
  • folio
  • hợp pháp
  • lá thư
  • chú thích
  • quarto
  • tuyên bố
  • báo lá cải

Bạn có thể sử dụng cùng kích thước giấy khi chuyển đổi tài liệu thành Postscript, nhưng trong trường hợp đó, bạn phải sử dụng cờ “ -p ” thay thế.

Ví dụ này chuyển đổi tài liệu thành tệp PDF có kích thước tabloid:

 antiword -a tabloid resume.doc> resume-tabloid.pdf 

Đây là tệp PDF kết quả được hiển thị trong Okular:

Không tệ! Đường liên kết địa chỉ e-mail rải rác và chấm chấm biến mất, nhưng nhìn chung, chuyển đổi đã thành công.

Nếu bạn đang chuyển sang Postscript, bạn cũng có thể sử dụng “ -L ” để in ở chế độ ngang.

Ví dụ này sẽ chuyển đổi tài liệu sang định dạng DocBook:

 antiword -x db resume.doc> resume-docbook.docbook 

Việc chuyển đổi cũng sẽ bảo toàn siêu dữ liệu, bao gồm tên tác giả và ngày tạo tài liệu. Dưới đây là XML thô trông như thế nào:

Và đây là những gì các tập tin DocBook trông giống như trong LibreOffice:

Bạn có thể thấy rằng nó trông khác với tài liệu Word gốc, nhưng cấu trúc chủ yếu được bảo tồn. Việc chuyển đổi sang DocBook bằng Antiword có lẽ sẽ hoạt động tốt hơn với các tài liệu Word đã được tạo bằng chuyển đổi sang XML.

Để xem bạn có thể làm gì khác với Antiword - bao gồm khôi phục văn bản đã được thay đổi trong MS Word - hãy xem trang hướng dẫn (nó cũng trực tuyến).