5 công cụ Grep cho Linux
Như mọi người dùng Linux chắc chắn đều biết, grep là một công cụ dòng lệnh đáng tin cậy để tìm kiếm tệp sâu. Tuy nhiên, nhiều người mới bắt đầu tránh nó vì họ không thích thiết bị đầu cuối. Các ứng dụng được trình bày trong bài viết này không phải là lựa chọn thay thế chính xác cho grep vì trong một số trường hợp sử dụng grep thực sự không thể thay thế. Thay vào đó, hãy gọi chúng là nâng cấp trực quan cho grep vì chúng mở rộng chức năng của grep và bọc nó trong một giao diện đồ họa chính thức.
1. Regexxer
Regexxer là một công cụ tìm kiếm tập tin thực tế cho phép bạn chỉnh sửa các tập tin trực tiếp từ giao diện của nó. Bạn có thể tìm kiếm tệp và thư mục theo tên và xem bên trong các tệp dựa trên văn bản (bao gồm tệp HTML và XML). Phía bên trái của cửa sổ cho phép bạn chọn thư mục và mẫu đích (đặt * cho tất cả các tệp hoặc * .txt chỉ dành cho tệp văn bản). Regexxer có thể thực hiện tìm kiếm đệ quy trong các thư mục con của bất kỳ thư mục được chọn nào và bao gồm các tệp ẩn trong các kết quả.
Phía bên phải của cửa sổ cho phép bạn thực hiện "tìm kiếm và thay thế" trên một tệp đã chọn. Ở đây bạn chỉ có thể thay thế một thể hiện của một cụm từ tìm thấy hoặc tất cả chúng một cách tự động. Bạn cũng có thể thay thế cụm từ đã chọn trong tất cả các tệp được tìm thấy hữu ích cho việc chỉnh sửa hàng loạt.
2. Searchmonkey
Trở lại trong ngày Searchmonkey đã rất phổ biến. Tại một số điểm, sự phát triển của phiên bản Linux đã ngừng hoạt động và giờ đây trang web chỉ cung cấp các bản tải xuống mới cho Windows. Tuy nhiên, phiên bản cũ có thể được cài đặt từ kho của gần như mọi bản phân phối Linux. Có lẽ đáng ngạc nhiên, nó hoạt động tuyệt vời và nó thực sự nhanh chóng. Bạn có thể sử dụng Searchmonkey để tìm tệp và thư mục theo tên hoặc xem qua nội dung của chúng và tìm kiếm cụm từ bằng cụm từ thông dụng.
Searchmonkey giúp bạn xây dựng các truy vấn phức tạp với File Expression Wizard (được kích hoạt bằng cách nhấn vào nút Expression Builder) và một tùy chọn gọi là Test Regular Expression (trong menu Extras). Nó có thể tìm kiếm các tập tin đệ quy, và bạn có thể thiết lập độ sâu tìm kiếm (bao nhiêu thư mục con cần xem xét) và lọc các tập tin theo kích thước và ngày tháng. Trong tab "Tùy chọn", bạn có thể giới hạn số lượng tệp trong kết quả và chọn số lượng dòng ngữ cảnh bạn muốn xem.
3. DocFetcher
Thay vì tìm kiếm trực tiếp hệ thống tập tin của bạn, DocFetcher sẽ yêu cầu bạn xây dựng một chỉ mục và sau đó chỉ tìm kiếm các truy vấn của bạn trong các tệp được lập chỉ mục. Nó cung cấp một phiên bản di động (chỉ cần giải nén nó và chạy tập tin .sh từ thiết bị đầu cuối) cho cả hai hệ thống 32 và 64-bit. Để xây dựng chỉ mục, nhấp chuột phải vào khu vực “Phạm vi tìm kiếm” ở bên trái.
Bạn có thể thêm thư mục vào chỉ mục, tạm dừng tạo chỉ mục và tiếp tục sau đó, lưu trữ tệp chỉ mục (ZIP, TAR) dưới dạng thư mục và loại trừ các tệp đã chọn khỏi chỉ mục với sự trợ giúp của cụm từ thông dụng.
DocFetcher có trình kết xuất HTML được tích hợp sẵn cho phép bạn xem trước các tệp HTML hoàn chỉnh với định dạng và hình ảnh. Nó cung cấp tùy chọn riêng tư để xóa lịch sử tìm kiếm và cho phép bạn tìm kiếm và trong các tệp bằng ký tự đại diện, toán tử Boolean, tìm kiếm mờ (tìm các từ tương tự), tìm kiếm lân cận (khoảng cách giữa các từ trong văn bản) và hơn. DocFetcher hỗ trợ một số định dạng ấn tượng, bao gồm tệp Microsoft và Libre Office (DOC, DOCX, ODT, OTP ...), PDF và EPUB, HTML và XML, tệp email Outlook PST và siêu dữ liệu âm thanh và hình ảnh.
4. Lấy lại
Lấy lại là một công cụ tìm kiếm cho máy tính để bàn của bạn; giống như Google, nhưng đối với tệp và thư mục của bạn. Nó được viết bằng Java, vì vậy nó hoạt động trên Linux, OS X và Windows, miễn là bạn đã cài đặt và cấu hình Java đúng cách. Tệp cài đặt có sẵn trên trang web của dự án và bạn có thể chỉ cần giải nén nó vào một thư mục, mở thư mục đó trong terminal và chạy java -jar regain.jar
để khởi động ứng dụng. (Tệp “regain.jar” phải được thực thi). Lấy lại sẽ chạy trong trình duyệt web mặc định của bạn.
Để tìm kiếm các tệp và thư mục của bạn, trước tiên, hãy lấy lại hệ thống của bạn và xây dựng một chỉ mục tìm kiếm. Trong biểu mẫu "Tùy chọn", bạn thêm các thư mục mà bạn muốn lập chỉ mục. Nếu bạn không muốn bao gồm các tệp cụ thể trong chỉ mục, hãy liệt kê chúng trong tệp “CrawlerConfiguration.xml”. Khi bạn bắt đầu sử dụng Regain, nó sẽ tìm kiếm chỉ mục thay vì quét toàn bộ ổ cứng. Điều này giúp tiết kiệm tài nguyên hệ thống và giúp tìm kiếm nhanh hơn.
5. PDFgrep
Trong tất cả các công cụ trong danh sách này, PDFgrep là tương tự như grep gốc, nhưng nó cũng là "cái lẻ", bởi vì nó là một công cụ dòng lệnh. Một số bản phân phối cung cấp PDFgrep trong kho của họ, nhưng phiên bản mới nhất (hiện tại 1.3.2) phải được biên dịch.
Trong khi grep xuất ra số dòng trong đó chuỗi tìm kiếm xuất hiện, PDFgrep sẽ hiển thị cho bạn số trang thay vào đó, điều này hữu ích hơn đối với tệp PDF vì chúng tôi có xu hướng đọc chúng như sách, không phân tích từng dòng. PDFgrep chỉ hoạt động trên các tệp PDF. Chúng phải được chuyển đổi từ văn bản hoặc OCR-ed, không chỉ là hình ảnh được quét.
Để tìm kiếm một từ trong một tệp PDF, hãy nhập:
pdfgrep word filename.pdf
Để bỏ qua trường hợp, sử dụng tùy chọn -i
:
pdfgrep -i word filename.pdf
Điều này sẽ tìm thấy "Word", "từ", "WORD" và các kết hợp có thể khác. Nếu bạn đang tìm kiếm một cụm từ, hãy đặt cụm từ đó trong dấu ngoặc kép. Một số tùy chọn hữu ích là:
-n
: xuất số trang cho mỗi trận đấu-c
: chỉ in số lượng đối sánh trong một tệp-p
hiển thị số lượng kết quả phù hợp trên mỗi trang-C NUMBER
: in số ký tự được chọn xung quanh mỗi kết hợp cho ngữ cảnh. Thay vì một số, bạn có thể viết "dòng" và PDFgrep sẽ in toàn bộ dòng.
PDFgrep có thể tìm kiếm đệ quy trong tất cả các thư mục con của một thư mục hoạt động và xem qua nhiều tệp PDF. Nó cũng hỗ trợ các biểu thức chính quy, và các tùy chọn có thể được kết hợp:
pdfgrep -nH "Thế giới Linux" file1.pdf file2.pdf /home/user/Desktop/newfile.pdf
Điều này sẽ in số trang và tên tập tin cho mỗi trận đấu (vì tùy chọn -H
).
Bạn sử dụng công cụ và lệnh Linux nào để tìm tệp? Chia sẻ yêu thích của bạn trong các ý kiến dưới đây.
Tín dụng hình ảnh: Nguồn hình ảnh nổi bật, nguồn hình ảnh quảng cáo xem trước video