Giải thích MTE: Các định dạng tệp xử lý văn bản phổ biến
Nếu bạn đã từng thử lưu một tài liệu để sử dụng trên một máy tính khác, bạn có thể sẽ bị tràn ngập bởi số lượng định dạng tệp bạn có thể chọn. Microsoft Office đi kèm với một mảng chói các định dạng mà bạn không thể sử dụng: đối với người trung bình, các thiết lập mặc định của Office khó đánh bại.
Bất kể, bạn cũng sẽ tự hỏi mục đích của các loại tệp này là gì. Trong bài viết này, chúng tôi sẽ trình bày nhiều định dạng liên quan đến các tài liệu có thể chỉnh sửa nhất có thể.
.docx
Hiện tại, .docx là định dạng tệp mặc định trong Microsoft Word và đã bắt đầu từ Office 2007. Mở tệp .docx trong Office 2003 sẽ buộc nó mở trong “Chế độ tương thích”. Đây là định dạng cơ bản khác so với người tiền nhiệm của nó, dựa trên về công nghệ nén ngôn ngữ đánh dấu mở rộng (XML) và .zip. Do đó, các loại tệp có nghĩa là nhỏ hơn. Các tài liệu bị hỏng vẫn có thể khôi phục một số nội dung của chúng.
.doc
Tiền thân của định dạng tệp .docx, đây là một phần chính của xử lý văn bản trong một thời gian rất dài. Đó là một tiêu chuẩn thực tế trước khi .docx được phát hành; ngay cả các phiên bản mới nhất của Office cũng cho phép bạn lưu tệp theo định dạng này. Do đó, nó vẫn phổ biến và là cách tốt nhất để duy trì khả năng tương thích với các phiên bản Microsoft Office cũ hơn.
.docm
Được mô tả trong Word dưới dạng “tài liệu Word có hỗ trợ Macro”, định dạng được đưa vào với Office 2007. Nếu bạn muốn macro hoạt động, tài liệu phải được lưu ở định dạng .docm. Lưu nó ở bất kỳ định dạng nào khác sẽ không cho phép nó hoạt động. Đối với người dùng máy tính trung bình, đây là một định dạng không phổ biến để gặp phải. Chúng tôi thật sự khuyên bạn nên quét bất kỳ tệp .docm nào, vì macro có thể lây nhiễm sang máy tính có vi-rút.
.dotx
Bạn có thể đã giả định rằng dựa trên 'x' ở định dạng tệp, .dotx là định dạng tệp mới hơn. Giả định này là hoàn toàn chính xác. Tệp này đóng vai trò như một mẫu, cho phép bạn duy trì một giao diện nhất quán trên các tài liệu khác nhau. Định dạng “x” mới hơn và có kích thước tệp nhỏ hơn do XML và .zip, giống như định dạng .docx.
.dot
Tiền thân của .dotx, định dạng này đóng vai trò mẫu cho các tài liệu khác. Nếu bạn đã dành thời gian rót trên diện mạo của tài liệu, bạn có thể lưu nó dưới dạng mẫu cho tương lai. Trong quá khứ, .dot là cách duy nhất để làm như vậy. Ngày nay nó đã được chủ yếu thay thế, nhưng nó là mẫu mới nhất Office 2003 có thể chấp nhận.
.dotm
Giống như .dotx, định dạng mẫu này xuất hiện với bản phát hành của Office 2007. “m” ở cuối phần mở rộng biểu thị rằng mẫu được bật macro. Trong khi điều này không có khả năng là một lợi ích lớn để sử dụng máy tính hàng ngày, nó có thể chứng minh hữu ích trong các thiết lập của công ty.
.odt
Được biểu thị là “OpenDocument Text” trong các phiên bản hiện tại của Microsoft Office, .odt là một chuẩn mở cho các tài liệu văn bản. Điều này có nghĩa rằng hầu hết, nếu không phải tất cả, các bộ xử lý văn bản sẽ có thể hỗ trợ nó. Ví dụ: tài liệu được lưu ở định dạng này với Office sẽ xuất hiện giống hệt trong OpenOffice, LibreOffice và các bộ ứng dụng văn phòng miễn phí khác. Giống như các định dạng tệp Office mới nhất thế hệ, nó dựa trên XML để đạt được mục đích của nó. Lưu ý rằng, tùy thuộc vào nguồn, .fodt thỉnh thoảng được sử dụng làm định dạng tệp.
Khi chúng tôi cố gắng lưu một tài liệu ở định dạng này, Word đã tạo ra thông báo lỗi sau, mặc dù nó đã quản lý để lưu tài liệu thành công.
.abw
Một định dạng tập tin duy nhất cho AbiWord, điều này chứng minh điều gì đó của một giới hạn cho các bộ ứng dụng văn phòng khác. Mở tệp AbiWord trong Microsoft Office tạo ra lỗi “DTD”, xảy ra với tệp XML (giải thích thêm tại đây). Sau đó, có vẻ như .abw là một định dạng dựa trên XML, nhưng nó không hoàn toàn tương thích với các bộ xử lý văn bản khác. Do đó, chúng tôi khuyên bạn chỉ nên sử dụng loại tệp này nếu bạn biết mình sẽ truy cập tài liệu của mình qua AbiWord.
So sánh kích thước tệp
Mặc dù không phải là so sánh toàn diện, chúng tôi đã quyết định thử và tìm ra định dạng nào cung cấp kích thước tệp nhỏ nhất trong số những định dạng đã được phác thảo. Đối với thử nghiệm này, chúng tôi đã sử dụng bản sao văn bản thuần túy của Project Gutenberg của The Prince, bởi Niccolo Macchiavelli và lưu nó ở nhiều định dạng khác nhau. Ngoại trừ tệp .abw, tất cả các định dạng được lưu bằng Office 2013.
Định dạng tệp .odt mang lại kích thước tệp đặc biệt dễ chịu, thậm chí ở dưới định dạng .docx của Microsoft. Tệp .abw của AbiWord xuất hiện tương đối khổng lồ, sưng hơn gấp 10 lần kích thước định dạng .doc lỗi thời của Microsoft.
Phần kết luận
Ở đó bạn có nó: nhiều hơn bạn mong đợi để biết về các định dạng tệp tài liệu. Nếu bạn đã nhận thấy các tham chiếu thường xuyên đối với các định dạng tệp “x” của Microsoft và muốn biết nhiều hơn, bạn sẽ hài lòng khi biết rằng họ có một trang Wikipedia chuyên dụng. Trong khi tổng quan rất kỹ thuật, trang cung cấp thông tin chi tiết về cách sử dụng XML trong các chương trình Office khác, bao gồm Excel và PowerPoint.